ניתוח שונות
יש לפשט ערך זה: הערך מנוסח באופן טכני מדי, וקשה להבנה לקהל הרחב. | |
הערך נמצא בשלבי עבודה: כדי למנוע התנגשויות עריכה ועבודה כפולה, אתם מתבקשים שלא לערוך את הערך בטרם תוסר ההודעה הזו, אלא אם כן תיאמתם זאת עם מניח התבנית. | |
בסטטיסטיקה, ניתוח שונות (באנגלית: Analysis of variance :ANOVA) הוא קבוצה של מודלים סטטיסטיים שמטרתם לנתח את ההבדלים בין ממוצעים של קבוצות. קבוצת המודלים פותחה על ידי הסטטיסטיקאי רונלד פישר. ניתוח שונות חד-כיווני (One way ANOVA), מבוצע כשמדובר על משתנה בלתי תלוי אחד בלבד. ניתוח שונות דו כיווני (Two way ANOVA), כשמדובר על שני משתנים בלתי תלויים. ניתוח שונות תלת כיווני (Three way ANOVA) משמש במצב בו נבדקים הבדלים בין קבוצות כשיש שלושה משתנים בלתי תלויים וכן הלאה. יש לציין כי המילה חד דו תלת וכו' מתייחסת למספר המשתנים הבלתי תלויים. כל ניתוח שונות נעשה על משתנה תלוי אחד בלבד.
דוגמא
עריכהמנהלת בית ספר רוצה לבחון את רמת שביעות הרצון בקרב קבוצות שונות בבית הספר. היא בודקת את ההבדלים בין מדגם של אבות ומדגם של אימהות בבית הספר ברמת שביעות הרצון. ממוצע שביעות הרצון של האבות נמצא 5.2 מתוך 7 ואילו זה של האימהות נמצא 4.8. האם היא יכולה להסיק שאבות שבעי רצון יותר מאימהות? או שמא ההבדל בין הקבוצות הוא מקרי משום שמדובר במדגם? כדי לבחון האם הבדל בין ממוצעים של שתי קבוצות מובהק סטטיסטית, יש לבצע מבחן t למדגמים בלתי תלויים או ניתוח שונות חד-כיווני. כדי לבחון הבדל בין ממוצעי שביעות הרצון של שלוש קבוצות, או יותר, למשל ההבדל בין הורי כיתות א ב ו ג , היא תצטרך לבצע ניתוח שונות חד כיווני. כדי לבחון הבדל בין קבוצות המתייחס לשני משתנים בלתי תלויים (למשל מגדר ההורים וכיתת הילד) יש לבצע ניתוח שונות דו-כיווני. שוב, יש להדגיש כי כל ניתוח שונות נעשה על משתנה תלוי אחד בלבד (למשל בדוגמה שביעות הרצון). אם למשל המנהלת מדדה גם את רמת המעורבות של ההורים. בדיקת ההבדל בין אבות ואימהות במשתנה זה יעשה באמצעות ניתוח שונות חד כיווני נפרד.
ניתוח שונות חד כיווני
עריכההנחות המודל
עריכהנניח כי ישנן k קבוצות שונות שנרצה להשוות ביניהן. בכל קבוצה יש תצפיות, כך שהתצפית היא התצפית ה-j בקבוצה ה-i.
אזי המודל מניח כי התצפיות בקבוצה ה-i מתפלגות נורמלית סביב תוחלת השווה ל- , בסטיית תקן . בכתיב מקוצר: כלומר לכל קבוצה תוחלת שונה.
אפשר גם לפרק את הביטוי כך שנגדיר גורם של רעש המתפלג נורמלית סביב האפס, בסטיית תקן של , ונוסיף אותו לתוחלת הקבוצה. בכתיב מקוצר נאמר , כאשר .
השערות המבחן
עבור השערת האפס, לא נניח הבדל בין תוחלות הקבוצות.
כלומר:
ועבור השערת H1 אחרת מכך.
התפלגות הממוצעים היא:
ומכאן שהתפלגות ממוצע כלל הדגימות:
.
חלוקת סכום הריבועים
עריכהנגדיר את סכומי הריבועים הבאים: עבור כל קבוצה i:
ובהתאם נגדיר: (סכום הריבועים בתוך הקבוצות)
סכום הריבועים בין הקבוצות: וסה"כ סכומי הריבועים:
מפיתוח מתמטי נגיע לקשר
מבחן F
עריכהתחת השערת האפס, כאשר F זוהי התפלגות F.
מבחני POST HOC - השוואות אנליטיות
עריכהאם מבחן ניתוח השונות מצביע על כך שהאוכלוסיות שונות זו מזו, עולה השאלה בין אילו זוגות של אוכלוסיות יש הבדל מובהק. בשאלה זו עוסקים מבחן LSD של פישר (אנ'), מבחן הטווח של טוקי (אנ') ומבחנים נוספים.
ניתוח שונות דו כיווני
עריכהניתוח שונות דו-כיווני מתאים למצב בו מערך המחקר כולל שני משתנים בלתי תלויים ומשתנה תלוי אחד. למשל החוקר בוחן את ההבדלים במוכנות לרכוש מוצר (המשתנה התלוי), בין נחקרים שפנו אליהם בפרסומת בלשון רבים או בלשון יחיד רבים (משתנה בלתי תלוי אחד: צורת הפניה בפרסומת) ובין נחקרים שהם בעלי ערכים קולקטיביסטים או אינדוודואליסטיים (משתנה בלתי תלוי שני: סוג הערך). בלוח מופיעים ממוצעי הקבוצות במשתנה התלוי (הסיכוי שתרכוש את המוצר שנמדד על סולם שבן 1- בטוח שלא ועד 8-בטוח שכן).
סוג הפניה בפרסומת | ||||
---|---|---|---|---|
לשון יחיד | לשון רבים | סך הכל | ||
סוג הערך | קולקטיביסט | 4.2 | 6.2 | 5.2 |
אינדוודואליסט | 5.8 | 4.2 | 5 | |
סך הכל | 5 | 5.2 |
קישורים חיצוניים
עריכה- ניתוח שונות, באתר MathWorld (באנגלית)
- ראשון מארבעה פרקים על ANOVA במסגרת הפודקאסט ״סטטיסטיקה מרפאת״
https://ebm.podbean.com/e/סטטיסטיקה-מרפאת-39-why-anova/