ניתוח שונות

מודלים סטטיסטיים לניתוח הבדלים בין ממוצעי קבוצות
יש לפשט ערך זה: הערך מנוסח באופן טכני מדי, וקשה להבנה לקהל הרחב.
יש להוסיף מבוא אינטואיטיבי שיסביר את הרעיונות והמושגים בצורה פשוטה יותר, רצוי בליווי דוגמאות ותוך שימוש באמצעים אינפוגרפיים. אם אתם סבורים כי הערך איננו ברור דיו או שיש נקודה שאינכם מבינים בו, ציינו זאת בדף השיחה שלו. יש לציין כי ערכים מדעיים רבים מצריכים רקע מוקדם.
הערך נמצא בשלבי עבודה: כדי למנוע התנגשויות עריכה ועבודה כפולה, אתם מתבקשים שלא לערוך את הערך בטרם תוסר ההודעה הזו, אלא אם כן תיאמתם זאת עם מניח התבנית.
אם הערך לא נערך במשך שבוע ניתן להסיר את התבנית ולערוך אותו, אך לפני כן רצוי להזכיר את התבנית למשתמש שהניח אותה, באמצעות הודעה בדף שיחתו.

בסטטיסטיקה, ניתוח שונותאנגלית: Analysis of variance :ANOVA) הוא קבוצה של מודלים סטטיסטיים שמטרתם לנתח את ההבדלים בין ממוצעים של קבוצות. קבוצת המודלים פותחה על ידי הסטטיסטיקאי רונלד פישר. ניתוח שונות חד-כיווני (One way ANOVA), מבוצע כשמדובר על משתנה בלתי תלוי אחד בלבד. ניתוח שונות דו כיווני (Two way ANOVA), כשמדובר על שני משתנים בלתי תלויים. ניתוח שונות תלת כיווני (Three way ANOVA) משמש במצב בו נבדקים הבדלים בין קבוצות כשיש שלושה משתנים בלתי תלויים וכן הלאה. יש לציין כי המילה חד דו תלת וכו' מתייחסת למספר המשתנים הבלתי תלויים. כל ניתוח שונות נעשה על משתנה תלוי אחד בלבד.

דוגמא

עריכה

מנהלת בית ספר רוצה לבחון את רמת שביעות הרצון בקרב קבוצות שונות בבית הספר. היא בודקת את ההבדלים בין מדגם של אבות ומדגם של אימהות בבית הספר ברמת שביעות הרצון. ממוצע שביעות הרצון של האבות נמצא 5.2 מתוך 7 ואילו זה של האימהות נמצא 4.8. האם היא יכולה להסיק שאבות שבעי רצון יותר מאימהות? או שמא ההבדל בין הקבוצות הוא מקרי משום שמדובר במדגם? כדי לבחון האם הבדל בין ממוצעים של שתי קבוצות מובהק סטטיסטית, יש לבצע מבחן t למדגמים בלתי תלויים או ניתוח שונות חד-כיווני. כדי לבחון הבדל בין ממוצעי שביעות הרצון של שלוש קבוצות, או יותר, למשל ההבדל בין הורי כיתות א ב ו ג , היא תצטרך לבצע ניתוח שונות חד כיווני. כדי לבחון הבדל בין קבוצות המתייחס לשני משתנים בלתי תלויים (למשל מגדר ההורים וכיתת הילד) יש לבצע ניתוח שונות דו-כיווני. שוב, יש להדגיש כי כל ניתוח שונות נעשה על משתנה תלוי אחד בלבד (למשל בדוגמה שביעות הרצון). אם למשל המנהלת מדדה גם את רמת המעורבות של ההורים. בדיקת ההבדל בין אבות ואימהות במשתנה זה יעשה באמצעות ניתוח שונות חד כיווני נפרד.

ניתוח שונות חד כיווני

עריכה

הנחות המודל

עריכה

נניח כי ישנן k קבוצות שונות שנרצה להשוות ביניהן. בכל קבוצה יש   תצפיות, כך שהתצפית   היא התצפית ה-j בקבוצה ה-i.

אזי המודל מניח כי התצפיות בקבוצה ה-i מתפלגות נורמלית סביב תוחלת השווה ל-  , בסטיית תקן  . בכתיב מקוצר:   כלומר לכל קבוצה תוחלת שונה.

אפשר גם לפרק את הביטוי כך שנגדיר גורם של רעש המתפלג נורמלית סביב האפס, בסטיית תקן של  , ונוסיף אותו לתוחלת הקבוצה. בכתיב מקוצר נאמר  , כאשר  .

השערות המבחן

עבור השערת האפס, לא נניח הבדל בין תוחלות הקבוצות.

כלומר:

 

ועבור השערת H1 אחרת מכך.

 

התפלגות הממוצעים היא:  

ומכאן שהתפלגות ממוצע כלל הדגימות:

 .

חלוקת סכום הריבועים

עריכה

נגדיר את סכומי הריבועים הבאים: עבור כל קבוצה i:  

ובהתאם נגדיר:   (סכום הריבועים בתוך הקבוצות)

סכום הריבועים בין הקבוצות:  וסה"כ סכומי הריבועים:  

מפיתוח מתמטי נגיע לקשר  

מבחן F

עריכה

תחת השערת האפס,   כאשר F זוהי התפלגות F.

מבחני POST HOC - השוואות אנליטיות

עריכה

אם מבחן ניתוח השונות מצביע על כך שהאוכלוסיות שונות זו מזו, עולה השאלה בין אילו זוגות של אוכלוסיות יש הבדל מובהק. בשאלה זו עוסקים מבחן LSD של פישר (אנ'), מבחן הטווח של טוקי (אנ') ומבחנים נוספים.

ניתוח שונות דו כיווני

עריכה

ניתוח שונות דו-כיווני מתאים למצב בו מערך המחקר כולל שני משתנים בלתי תלויים ומשתנה תלוי אחד. למשל החוקר בוחן את ההבדלים במוכנות לרכוש מוצר (המשתנה התלוי), בין נחקרים שפנו אליהם בפרסומת בלשון רבים או בלשון יחיד רבים (משתנה בלתי תלוי אחד: צורת הפניה בפרסומת) ובין נחקרים שהם בעלי ערכים קולקטיביסטים או אינדוודואליסטיים (משתנה בלתי תלוי שני: סוג הערך). בלוח מופיעים ממוצעי הקבוצות במשתנה התלוי (הסיכוי שתרכוש את המוצר שנמדד על סולם שבן 1- בטוח שלא ועד 8-בטוח שכן).

סוג הפניה בפרסומת
לשון יחיד לשון רבים סך הכל
סוג הערך קולקטיביסט 4.2 6.2 5.2
אינדוודואליסט 5.8 4.2 5
סך הכל 5 5.2

קישורים חיצוניים

עריכה
  מדיה וקבצים בנושא ניתוח שונות בוויקישיתוף
  • ראשון מארבעה פרקים על ANOVA במסגרת הפודקאסט ״סטטיסטיקה מרפאת״

https://ebm.podbean.com/e/סטטיסטיקה-מרפאת-39-why-anova/

  ערך זה הוא קצרמר בנושא סטטיסטיקה. אתם מוזמנים לתרום לוויקיפדיה ולהרחיב אותו.