שגיאות מסוג I ו-II – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Udirock (שיחה | תרומות)
הוספת מונחים קשורים
Udirock (שיחה | תרומות)
←‏מושגים קשורים: השוואות מרובות
שורה 64:
הסיבה לכך היא כדלהלן. נניח שכ-20 צוותי מחקר ברחבי העולם בודקים האם יש קשר בין [[טמפרטורה]] ושכיחות מחלת ה[[שפעת]]. כמו כן נניח לצורך הדוגמה שאין קשר. הצוותים פועלים באופן בלתי תלוי ומבלי להכיר זה את זה. הם דוחים את השערת האפס אם הם מקבלים מובהקות סטטיסטית של 5% או פחות. מכיוון שהנחנו שאין קשר בין שפעת וטמפרטורה, הרי שהסתברות לדחיית השערת האפס תהיי לפי סף המובהקות הסטטיסטית שנקבע: 5%. לכן סביר לצפות שאחד הצוותים יכריז על תגלית בשל שגיאה מסוג I, וזו התוצאה היחידה שתפורסם.
מכיוון שרק תוצאה זו תפורסם, נוצר מצג שווא כאילו נעשה רק ניסוי אחד והוא הצליח, בעוד שבמציאות הוא רק אחד מתוך 20, בדיוק השיעור הצפוי בהנחה שקשר אמיתי אינו קיים.
 
=== השוואות מרובות ===
יש מחקרים בהם נבדקות בו זמנית זוגות רבים של השערת אפס והשערה אלטרנטיבית. לדוגמה, נניח נעשה המחקר הבודק האם ההסתברות לחלות בשפעת תלויה ב[[גן (ביולוגיה)|גנים]] מסוימים. נניח שהמחקר בודק בו זמנית מאה גנים, שנכנה אותם גן 1, גן 2, גן 3 וכו'. כלומר למחקר יש מאה השערות אפס: גן 1 אינו משפיע על ההסתברות לחלות בשפעת, גן 2 אינו משפיע על ההסתברות לחלות בשפעת, וכו'. בהתאם יש מאה השערות אלטרנטיביות. מצב כזה קרוי בדיקת השערות מרובות, או השוואות מרובות. במחקרים מודרניים מספר ההשערות הנבדק עשוי להגיע למיליונים.
 
מכיוון שהמחקר מבצע בו זמנית בדיקות השערות רבות, הוא חשוף במיוחד לשגיאות מסוג I וסוג II. אם נבדקות למשל מאה השערות, ונניח שבכולן השערת האפס נכונה, ושרמת המובהקות של הניסוי היא 5%, הרי שצפוי מראש לקבל כחמש שגיאות מסוג I.
 
כלים סטטיסטים מיוחדים פותחו כדי להתמודד עם בעיה זו. אמצעי פשוט אחד ידוע בשם [[תיקון בונפרוני]], לפיו פשוט מחלקים את רמת המובהקות הסטטיסטית במספר ההשערות הנבדק. כלומר כדי לקבל רמה של 5% עבור 100 השערות צריך לעבוד ברמת מובהקות של 0.05%. שיטה זו פותרת את בעיית השגיאות מסוג I, אך מעלה בצורה משמעותית את ההסתברות לשגיאה מסוג II. בשנת [[1989]] פתחו שני סטטיסטיקאים מאוניברסיטת תל אביב, הפרופסורים [[יואב בנימיני]] ו[[יוסף הוכברג]], אמצעי מתוחכם יותר הקרוי [[שיעור התגליות השגויות]]. שיטה זו מאפשרת שליטה בכמות השגיאות מסוג I עם עליה פחותה בהסתברות לשגיאה מסוג II. השיטה זכתה להכרה רבה, והיוותה את הסיבה המרכזית לזכייתו של בנימיני ב[[פרס ישראל]] לשנת [[2012]].
 
== ראו גם ==