כשל הסתברות קודמת

כשל לוגי

כשל הסתברות קודמת, המכונה גם הזנחת הסתברות קודמת או כשל שיעור-הבסיס, הוא כשל בהיסק המתרחש כאשר נתונים ספציפיים משמשים לקבלה או דחייה של השערה (הסקה סטטיסטית), תוך הזנחת ממצאים סטטיסטיים ביחס להסתברות (המכונים גם הסתברות פריורית או base rate).

דוגמאות עריכה

אבחנה רפואית עריכה

מחלות נפוצות באוכלוסייה עריכה

נדמיין ביצוע של בדיקה רפואית למחלה על קבוצה של 1000 נבדקים, שמתוכם 40% חולים במחלה. נניח כי לבדיקה יש הסתברות של 5% לתוצאה חיובית שגויה, בעוד ההסתברות לאי-זיהוי המחלה היא אפס. התוחלת של תוצאות הבדיקה היא 430 נבדקים שיזוהו כחולים (400 חולים באמת, ועוד 30 שהם 5% מתוך 600 הנבדקים הבריאים), ו-570 נבדקים שיזוהו כבריאים. במצב זה, אדם שקיבל תוצאה חיובית יכול להניח שהוא אכן חולה בהסתברות של מעל 93% (400400+30).

מחלות נדירות באוכלוסייה עריכה

נניח עתה כי אותה בדיקה בדיוק נערכת על קבוצה אחרת של 1000 נבדקים, שבה רק 2% חולים במחלה. התוחלת של התוצאות היא עתה 69 נבדקים שיזוהו כחולים (20 חולים באמת, ועוד 49 שהם 5% מתוך 980 הנבדקים הבריאים), ו-931 נבדקים שיזוהו כבריאים. במצב זה, אם אדם קיבל תוצאה חיובית, ההסתברות שהוא אכן חולה היא 29% בלבד (2020+49). תוצאה זו עשויה להיראות לא הגיונית (עד כדי הגדרתה כפרדוקס) לנוכח הנתון שהבדיקה מדויקת ב-95% מהמקרים, ועל כן אנשים רבים יתעלמו מהאפשרות של תוצאת שווא ויסיקו שהם חולים.

ההשלכה האפשרית של כשל ההסתברות הקודמת היא שרופאים המנוסים בטיפול באוכלוסיות בסיכון גבוה עלולים להניח שמטופל שנמצא חיובי הוא אכן חולה, גם אם הוא שייך לקבוצה בסיכון נמוך, ולא לבצע בדיקות נוספות (כנדרש במקרה זה) אלא לדווח על מחלה ולהתחיל בטיפול, שעשוי להזיק למטופל.

מחקר פסיכולוגי עריכה

בניסוי, התבקשו הנבדקים להעריך את ממוצע הציונים של סטודנטים היפותטיים. כאשר ניתנו להם נתונים סטטיסטיים רלוונטיים של ממוצע ציונים, נטו הנבדקים להתעלם מהם אם ניתן להם מידע תיאורי אודות הסטודנט, אף אם המידע החדש לא היה קשור כלל לביצועים הלימודיים שלו[1]. ממצא זה שימש כדי לטעון כי ראיונות הם חלק לא נחוץ בהליך הקבלה של תלמידים למכללות, משום שהממצאים האמפיריים מראים כי המראיינים אינם מזהים מועמדים בעלי פוטנציאל להצליח בלימודים טוב יותר מאשר הסטטיסטיקה הבסיסית.

הפסיכולוגים דניאל כהנמן ועמוס טברסקי ניסו להסביר ממצא זה במונחים של היוריסטיקת ייצוגיות: לטענתם, הערכות של סבירות או סיבתיות מבוססות במקרים רבים על השאלה עד כמה תופעה אחת מייצגת תופעה אחרת, או קטגוריה[2]. ריצ'רד ניסבט טען כי הטיות ייחוס כמו טעות הייחוס הבסיסית הם מקרים של כשל כזה: אנשים עושים שימוש חסר ב"נתוני הקונצנזוס" (ההסתברות הפריורית) ביחס לאופן התנהגותם של אחרים במצבים דומים ומעדיפים במקומם ייחוס נטייתי, כלומר הנחה שהתנהגות ספציפית של אדם אחר נובעת מנטייה פנימית שלו ולא מהמצב הרגעי.

הערות שוליים עריכה

  1. ^ Kahneman, Daniel; Amos Tversky (1985). "Evidential impact of base rates". In Daniel Kahneman, Paul Slovic & Amos Tversky (ed.). Judgment under uncertainty: Heuristics and biases. pp. 153–160.
  2. ^ Kahneman, Daniel; Amos Tversky (1973). "On the psychology of prediction". Psychological Review. 80 (4): 237–251. doi:10.1037/h0034747.