מבחן קוקראן-מנטל-הנזל

בסטטיסטיקה, מבחן קוקראן-מנטל-הנזל (CMH) משמש לבדיקת השערת אי התלות בין שני משתנים איכותיים דיכוטומיים (כלומר כל אחד מהם יכול לקבל שני ערכים אפשריים), כאשר ידוע כי הנתונים נאספים בשכבות. במובן מסוים, מבחן זה הוא הרחבה של מבחן מקנמר, ומאידך זהו מקרה פרטי של רגרסיה לוגיסטית מותנית.

וריאציות שונות של המבחן הוצעו על ידי ויליאם קוקראן, נתן מנטל וויליאם הנזל[1][2][3].

תיאור כללי עריכה

בדרך כלל, כדי לבחון את ההשערה כי אין קשר בין שני משתנים איכותיים, המבחן המקובל הוא מבחן כי בריבוע. עם זאת, כאשר הנתונים נאספים בשכבות, יש לקחת נתון זה בחשבון, כדי להימנע מפרדוקס סימפסון. מבחן קוקראן-מנטל-הנזל בודק את השערת אי התלות המותנה בשכבה.

לדוגמה, כדי לבדוק את ההשפעה של מסע פרסום למוצר כלשהו (למשל מותג של קפה נמס) על אחוז האנשים שקנו את המותג, נלקח מדגם מהאוכלוסייה, וכל אדם במדגם נשאל האם נחשף לפרסומת והאם קנה את המותג בחודש האחרון. ייתכן ויש הבדלים בתגובה לפרסומת בין אנשים ממעמדות סוציו-אקונומיים שונים, ולכן תועד גם המצב הסוציו-אקונומי של כל המשיבים למדגם. במקרה זה המשתנים ביניהם נמדד הקשר הוא חשיפה לפרסום (נחשף/לא נחשף) וקניית המותג (קנה/לא קנה), והשכבות הן המצב הסוציו אקונומי (למשל מעמד נמוך, בינוני או גבוה).

דוגמה נוספת: היא ניסוי קליני שנערך כדי לבדוק את היעילות של טיפול ניסיוני בהשוואה לטיפול המקובל, ועבור כל חולה מתעדים אם מצבו השתפר לאחר שבוע של טיפול. ניסויים כאלה נערכים בדרך כלל במספר בתי חולים. כאן המשתנים שהקשר ביניהם נבחן הם סוג הטיפול ותוצאת הטיפול, ובתי החולים הם השכבות.

הגדרה עריכה

מוטיבציה עריכה

בניסוי קליני שנערך בבית חולים מסוים, חלק מהחולים קיבלו טיפול נסיוני למחלתם, בעוד חלק אחר קיבלו את הטיפול המקובל. עבור כל חולה, נבדק האם מצבו השתפר לאחר שבוע של טיפול. ניתן לרכז את הנתונים בטבלה:

סטטוס שיפור ללא שיפור סך הכל
טיפול ניסיוני A B A+B
טיפול מקובל C D C+D
סך הכל A+C B+D N

כאשר A הוא מספר החולים שקיבלו טיפול ניסיוני ומצבם השתפר, B הוא מספר החולים שקיבלו טיפול ניסיוני ומצבם לא השתפר, וכן הלאה. כמו כן, N הוא המספר הכולל של החולים שהשתתפו בניסוי.

יחס הסיכויים הוא לכן  .

בהנחה כי אין קשר בין הטיפול ומצב החולה, נצפה כי מספר החולים שמצבם השתפר לאחר קבלת הטיפול הניסיוני הוא  .

תחת ההנחה כי שולי הטבלה קבועים (כלומר מספר החולים בכל קבוצה נקבע מראש וכן המספר הכולל של החולים שמצבם השתפר והמספר הכולל של החולים שמצבם לא השתפר גם הם קבועים מראש), השערת האפס כי יחס הסיכויים שווה ל-1,  , שקולה להשערה כי  . סטטיסטי מבחן מתקבל על הדעת לבדיקת השערה זו הוא  .

לעומת זאת, אם הניסוי נערך בשני בתי חולים, ניתן לחשב את יחס הסיכויים בנפרד לכל אחד מבתי החולים:

 ,

 .

מבחן קוקראן-מנטל-הנזל משקלל את יחסי הסיכויים של שני בתי החולים לפי מספר החולים בכל אחד מהם. באופן אינטואיטיבי, השקלול צריך להיות ממוצע משוקלל של יחסי הסיכויים משני בתי החולים. אולם, אפשרות אחרת לבדיקת ההשערה כייחס הסיכויים הכולל שווה ל-1 היא לבדק את הערך של  . ביטוי זה מהווה את הבסיס להגדרת מבחן קוקראן-מנטל-הנזל, והוא מתקבל לאחר שקלול מתאים של   בשונויות של   ו- .

הגדרה פורמלית עריכה

נתון לוח שכיחות תלת־ממדי מסדר   כאשר לכל  , לוח השכיחות הדו-ממדי הוא  . נסמן  .

מבחן קוקראן-מנטל-הנזל מוגדר על ידי[4]:

 .

תחת השערת האפס כי יחס הסיכויים הכולל שווה ל-1, ל-  יש התפלגות אסימפטוטית   עם דרגת חופש אחת.

דוגמה: אפליה על רקע מגדרי באוניברסיטת ברקלי עריכה

באוניברסיטת ברקלי בקליפורניה, נתוני הקבלה לסתיו 1973 הראו כי לגברים יש סיכויים גבוהים יותר להתקבל ללימודים בהשוואה לנשים[5]. מתוך 8442 גברים שביקשו להתקבל ללימודים מתקדמים, התקבלו בערך 44% מהפונים. לעומת זאת, מתוך 4321 נשים שביקשו להתקבל ללימודים, התקבלו רק 35%. לא ניתן להסביר פער זה כצרוף מקרים סטטיסטי (במילים אחרות, השערת אי התלות נדחתה).

ניתן לראות זאת גם בנתוני הקבלה של ששת החוגים הגדולים ביותר:

התקבלו נדחו סך הכל
גברים 1198 1493 2691
נשים 557 1278 1835
סך הכל 1755 2771 4526

יחס הסיכויים מראה בבירור כי שיעור הקבלה של הגברים גבוה בהרבה מזה של הנשים:  

אולם, כאשר נבחנו הנתונים מכל חוג בנפרד, נראה היה ששיעורי הקבלה בכל חוג היו בדרך כלל דומים עבור גברים ונשים, ואף נמצאו חוגים שבהם שיעור הקבלה של גברים היה נמוך יותר מזה של הנשים. בטבלה הבאה מובאים נתוני הקבלה עבור 6 החוגים הגדולים ביותר לכל חוג בנפרד:

חוג מספר הגברים שהתקבלו מספר הגברים שנדחו מספר הנשים שהתקבלו מספר הנשים שנדחו סך הכל
1 512 313 89 19 933
2 353 207 17 8 585
3 120 205 202 391 918
4 138 279 131 244 792
5 53 138 94 299 584
6 22 351 24 317 714
סך הכל 1198 1493 557 1278 4526

ערכו של מבחן קוקראן-מנטל-הנזל הוא  . חישוב ערך ה-p מעלה כי  . בהנחה שקבענו מראש כי רמת המובהקות של המבחן היא   לא נדחה את השערת האפס ונסיק כי לא נצפו הבדלים בהעדפות בין גברים ונשים.

הערות שוליים עריכה

  1. ^ Cochran, W. G., Some methods for strengthening the common chi-square tests, Biometrics, 4 10, 1954, עמ' 417-451 doi: 10.2307/3001616
  2. ^ Mantel, N. and Haensze, W., Statistical aspects of the analysis of data from retrospective studies of disease, Journal of the national cancer institute, 4 22, 1959, עמ' 719-748 doi: 10.1093/jnci/22.4.7191
  3. ^ Mantel, N., Chi-square tests with one degree of freedom; extensions of the Mantel-Haenszel procedure, Journal of the American Statistical Association, 303 58, 1963, עמ' 690-700 doi: 10.1080/01621459.1963.10500879
  4. ^ Agresti, Alan, 4.3.4, An Introduction to Categorical Data Analysis, 2nd edition, Hoboken, New Jersey: JohnWiley & Sons, Inc., 2007, עמ' 114-115, ISBN 978-0-471-22618-5
  5. ^ .Sex Bias in Graduate Admissions: Data from Berkeley, Bickel et al., Science Vol. 187, 1975