עוצמה סטטיסטית – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Yoavd (שיחה | תרומות)
מאורש1 (שיחה | תרומות)
שורה 1:
'''עוצמה סטטיסטית''' היא הסיכוי לדחיית השערת האפס (H<sub>0</sub>) במחקר על בסיס נתוני המדגם וקביעה כי יש קשר בין המשתנים באוכלוסייה, כאשר הקשר/הבדל אכן קיים במציאות.
 
למעשה עוצמה סטטיסטית היא 1-P כאשר P מייצג את הסיכוי לטעות מסוג שני (β). כאשר הסיכוי לטעות מסוג שני (β) נמוך וקרוב ל-0 העוצמה הסטטיסטית תגדל, וכאשר הסיכוי לטעות מסוג שני (β) גבוה, וקרוב ל-1 העוצמה הסטטיסטית תקטן. ככל שהמחקר שנערך רגיש יותר העוצמה הסטטיסטית גבוהה יותר והסיכוי לטעות מסוג β קטן יותר. לעיתיםיש עושמסמנים את הערך של העוצמה הסטטיסטית כ-π.
 
=== דרכים להגדלת העוצמה הסטטיסטית: ===
שורה 14:
5. '''מבחנים פרמטרים''' – עוצמה סטטיסטית גדולה יותר שכן נעשה שימוש במדד אינטרוולי שיש בו יותר מידע ולכן הוא יותר רגיש.
 
בבדיקת השערות עומדת לבחינה [[השערה (מתמטיקה)|השערה]], הנקראת 'השערת האפס'. לצורך החלטה מבצעים [[ניסוי]], ומשלבים את התוצאות ב[[מבחן]]במבחן שנבחר מראש. תוצאת המבחן היא אחת משתי מסקנות אפשריות: לדחות את ההשערה, או שלא לדחות אותה. דחיית השערה על אודות הבדל בין שתי אוכלוסיות, למרות קיומו של הבדל כזה במציאות, נקראת [[שגיאה מסוג II]]. עוצמה סטטיסטית היא מידת הביטחון שלא הייתה שגיאה מסוג זה. זאת להבדיל מ[[מובהקות סטטיסטית]] שהיא מידת הביטחון שלא נעשתה [[שגיאה מסוג I]].
 
עוצמתו של מבחן סטטיסטי תלויה בגורמים התלויים בהליך המבחן עצמו ([[מבחן T]] דו זנבי דורש יותר פרטים מאשר חד זנבי), בגודל ה[[מדגם]] הסטטיסטי, בגודל האוכלוסייה הנחקרת (כל זמן שכלל האוכלוסייה קטנה יחסית), בהבדל הממוצע בפרמטר הנחקר של האוכלוסייה (הבדלים גדולים בין שתי תת-אוכלוסיות דורשים מדגם קטן יותר), ב[[התפלגות]] של פרמטר זה ([[התפלגות בינומית]] דורשת מדגם קטן יותר מאשר [[התפלגות נורמלית]] של משתנה רציף) ובמידת הדיוק שבמדידות.
שורה 20:
=== ניתוח עוצמה סטטיסטית במחקר- ניתוח מקדים מול ניתוח רטרוספקטיבי ===
ניתוח עוצמה סטטיסטית יכול להעשות לפני- ניתוח מקדים (''a priori''\ prospective) או אחרי-ניתוח רטרוספקטיבי (''post hoc''\ retrospectivi) אחרי ניתוח הנתונים. ניתוח מקדים נערך לפני ניתוח הנתונים של המחקר, ובדרך כלל משיג עוצמה סטטיסטית מספיקה. ניתוח רטרוספקטיבי נערך אחרי שהמחקר נערך והתקבלו התוצאות, והוא עושה שימוש בגודל האפקט וגודל המדגם כדי לקבוע את העוצמה של המחקר, על בסיס ההנחה כי גודל האפקט במדגם שווה לזה באוכלוסייה. התועלת בניתוח מקדים לעוצמה סטטיסטית במערך מחקר ניסויי הוא מקובל בעולם; בעוד, ניתוח רטרוספקטיבי שנוי במחלוקת בקרב החוקרים.
 
=== פרשנות ===
לא קיים סטנדרט פורמאלי לעוצמה סטטיסטית, אולם, רוב החוקרים משתמשים בערך π=80 כערך מתאים. מוסכמה זו נסמכת על 4 ל-1 שקלול תמורות בין הסיכוי ל-β (ההסתברות ל[[שגיאה מסוג II]]) ו-α (ההסתברות ל-[[שגיאה מסוג I]]). אולם "כלל אצבע" זה לא מתאים לכלל הדיסיפלינות. לדוגמא, ברפואה, מבחנים נבנים כך שלא תיתכן טעות שלילית ([[שגיאה מסוג II]]) אולם זה מעלה את הסיכוי ל-[[שגיאה מסוג I]]. עוצמה סטטיסטית מתאימה כאשר העניין של החוקר הוא האם לדחות או לא לדחות את השערת האפס. במקרים רבים העניין הוא פחות בקביעה האם יש או אין הבדל, אלא במטרה לקבל אומדן מדוייק יותר של גודל האפקט באוכלוסייה. לדוגמא: אם אנו מצפים לקשר של 0.50 בין אינטיליגנציה להצלחה בעבודה באוכלוסייה, במדגם של 20 אנשים ייתן לנו עוצמה משוערת של 80% (α=0.05, דו צדדי), לדחיית השערת האפס של קורלציה אפס. אולם, במחקר שכזה אנו מעוניינים יותר לדעת האם הקורלציה היא 0.30 או 0.60 או 0.50. בהקשר זה, אנו נצטרך מדגם גדול יותר כדי להקטין את הרווח בר סמך של האומדן שלנו, לטווח שהוא מקובל עבור המטרה שלנו.
 
== תוכנות לניתוח עוצמה סטטיסטית ==