עוצמה סטטיסטית – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
תיקון טעות הקלדה\ניסוח
מ הסרת קישורים עודפים, עיצוב, העברת קישורים חיצוניים מגוף הטקסט להערות שוליים, לא קצרמר, קישורים למקורות, קישורים חיצוניים
שורה 1:
'''עוצמה סטטיסטית''' היא ה[[הסתברות]] לדחיית [[השערת האפס]] (H<sub>0</sub>) במחקר על בסיס נתוני המדגם וקביעה כי יש קשר בין המשתנים באוכלוסייה, כאשר הקשר/הבדל אכן קיים במציאות.
 
למעשה עוצמה סטטיסטית היא <math>1-P</math> כאשר P מייצג את הסיכוי לטעות מסוג שני (β). כאשר הסיכוי לטעות מסוג שני (β) נמוך וקרוב ל-0, העוצמה הסטטיסטית גדולה, וכאשר הסיכוי לטעות מסוג שני (β) גבוה, וקרוב ל-1 העוצמה הסטטיסטית קטנה. ככל שהמחקר שנערך רגיש יותר, העוצמה הסטטיסטית גבוהה יותר והסיכוי לטעות מסוג β קטן יותר. יש שמסמנים את הערך של העוצמה הסטטיסטית באמצעות האות π.
 
=== דרכים להגדלת העוצמה הסטטיסטית ===
1. #'''רמת מובהקות''' – ככל ש[[רמת מובהקות|רמת המובהקות]] גדולה יותר, העוצמה הסטטיסטית גדולה יותר. כאשר השטח הקריטי גדול יותר, קל יותר לדחות את H<sub>0</sub> ולכן העוצמה הסטטיסטית גדולה יותר. 
2. #'''שינוי סוג ההנחה לחד-צדדי''' – שינוי ההנחה לחד-צדדית מקלה על דחיית H<sub>0</sub> מבלי לשנות את רמת המובהקות, שכן מגדילים את שטח הדחייה. 
 
3. #'''גודל האפקט (Effect size)'''– מדד סטנדרטי המלמד על עצמת הקשר בין המשתנים. (מידת ההשפעה של הטיפול/מניפולציה) בודקים את הקשר בין האוכלוסיות והפיזור. אם הפיזור/שונות (σ) קטן יותר אז העוצמה גבוהה יותר וקל יותר לדחות את H<sub>0</sub>. אם ההבדל בין ממוצעי הקבוצות גדול העוצמה גבוהה וקל יותר לדחות את H<sub>0</sub>. ניתן להשפיע על גודל האפקט ולהקטין את הפיזור σ של סטטיסטי המבחן, על ידי תכנון הניסוי בצורה חכמה, לדוגמה: אם רוצים להשוות בין התוחלות של שתי אוכלוסיות בעלות [[שונות]] דומה, כדאי לדגום כמות שווה משתי האוכלוסיות, למשל 100 אנשים מכל אוכלוסייה, ולא לדגום כמויות שונות, למשל 180 מאוכלוסייה אחת ו-20 מהאוכלוסייה השנייה.
2. '''שינוי סוג ההנחה לחד-צדדי''' – שינוי ההנחה לחד-צדדית מקלה על דחיית H<sub>0</sub> מבלי לשנות את רמת המובהקות, שכן מגדילים את שטח הדחייה. 
4. #'''גודל המדגם''' – ככל שה-N גדל הסיכוי לדחות את H<sub>0</sub> גדל ולכן העוצמה הסטטיסטית גדלה. מכיוון שהאוכלוסייה הכללית מיוצגת טוב יותר יש יותר סיכוי לזהות קשרים שקיימים באוכלוסייה.
 
5. #'''מבחנים פרמטריים''' – נותנים עוצמה סטטיסטית גדולה יותר מאשר [[סטטיסטיקה א-פרמטרית|מבחנים א-פרמטריים]], שכן נעשה שימוש במדד שיש בו יותר מידע ולכן הוא יותר מדויק.
3. '''גודל האפקט (Effect size)'''– מדד סטנדרטי המלמד על עצמת הקשר בין המשתנים. (מידת ההשפעה של הטיפול/מניפולציה) בודקים את הקשר בין האוכלוסיות והפיזור. אם הפיזור/שונות (σ) קטן יותר אז העוצמה גבוהה יותר וקל יותר לדחות את H<sub>0</sub>. אם ההבדל בין ממוצעי הקבוצות גדול העוצמה גבוהה וקל יותר לדחות את H<sub>0</sub>. ניתן להשפיע על גודל האפקט ולהקטין את הפיזור σ של סטטיסטי המבחן, על ידי תכנון הניסוי בצורה חכמה, לדוגמה: אם רוצים להשוות בין התוחלות של שתי אוכלוסיות בעלות [[שונות]] דומה, כדאי לדגום כמות שווה משתי האוכלוסיות, למשל 100 אנשים מכל אוכלוסייה, ולא לדגום כמויות שונות, למשל 180 מאוכלוסייה אחת ו-20 מהאוכלוסייה השנייה.
 
4. '''גודל המדגם''' – ככל שה-N גדל הסיכוי לדחות את H<sub>0</sub> גדל ולכן העוצמה הסטטיסטית גדלה. מכיוון שהאוכלוסייה הכללית מיוצגת טוב יותר יש יותר סיכוי לזהות קשרים שקיימים באוכלוסייה.
 
5. '''מבחנים פרמטריים''' – נותנים עוצמה סטטיסטית גדולה יותר מאשר [[סטטיסטיקה א-פרמטרית|מבחנים א-פרמטריים]], שכן נעשה שימוש במדד שיש בו יותר מידע ולכן הוא יותר מדויק.
 
בבדיקת השערות עומדת לבחינה [[בדיקת השערות|השערה]], הנקראת 'השערת האפס'. לצורך החלטה מבצעים [[ניסוי]], ומשלבים את התוצאות במבחן סטטיסטי שנבחר מראש. תוצאת המבחן היא אחת משתי מסקנות אפשריות: לדחות את ההשערה, או שלא לדחות אותה. אי-דחיית השערה לפיה אין הבדל בין שתי אוכלוסיות, על אף שקיים הבדל כזה במציאות, נקראת [[שגיאה מסוג II]]. עוצמה סטטיסטית היא מידת הביטחון שלא הייתה שגיאה מסוג זה. זאת להבדיל מ[[מובהקות סטטיסטית]] שהיא מידת הביטחון שלא נעשתה [[שגיאה מסוג I]].
שורה 22 ⟵ 18:
 
=== פרשנות ===
לא קיים סטנדרט פורמלי לעוצמה סטטיסטית, אולם, רוב החוקרים משתמשים בערך π=80% כערך מקובל. מוסכמה זו נסמכת על 4 ל-1 [[שקלול תמורות]] בין הסיכוי ל-β (ההסתברות ל[[שגיאה מסוג II]]) ו-α (ההסתברות ל-[[שגיאה מסוג I]]). אולם "כלל אצבע" זה לא מתאים לכלל הדיסיפלינות. לדוגמה, מבחנים הבודקים האם מטופל הבא לרופא סובל ממחלה מסוכנת כלשהי, לעיתים נבנים כך שלא תיתכן טעות שלילית ([[שגיאה מסוג II]]) או שסיכוייה יהיו קלושים, על מנת שלא יקרה מצב בו לא נאבחן מחלה מסוכנת כשהיא למעשה קיימת, אולם זה מעלה את הסיכוי ל-[[שגיאה מסוג I]]. עוצמה סטטיסטית מתאימה כאשר העניין של החוקר הוא האם לדחות או לא לדחות את השערת האפס. במקרים רבים העניין הוא פחות בקביעה האם יש או אין הבדל, אלא במטרה לקבל אומדן מדויק יותר של גודל האפקט באוכלוסייה. לדוגמה: אם אנו מצפים לקשר של 0.50 בין אינטליגנציה להצלחה בעבודה באוכלוסייה, במדגם של 20 אנשים נקבל עוצמה משוערת של 80% (α=0.05, דו-צדדי), לדחיית השערת האפס של קורלציה אפס. אולם, במחקר שכזה אנו מעוניינים יותר לדעת האם הקורלציה היא 0.30 או 0.60 או 0.50. בהקשר זה, אנו נצטרך מדגם גדול יותר כדי להקטין את ה[[רווח בר-סמך]] של האומדן שלנו, לטווח שהוא מקובל עבור המטרה שלנו.
 
== תוכנות לניתוח עוצמה סטטיסטית ==
קיימות תוכנות אחדות לניתוח של עוצמה סטטיסטית. חלקן הן תוכנות מסחריות:
* nQuery Advisor
* PASS Sample Size Software
* SAS Power and sample size
* Stata
וישנן תוכנות ללא תשלום:
* PS
* Russ Lenth's power and sample-size page
* G*Power {{הערה|[http://www.gpower.hhu.de G*Power: Statistical Power Analyses for Windows and Mac]}}
*Web WebPower Power{{הערה|[http://webpower.psychstat.org Web Power - Statistical Power Analysis Online]}}
*Power and Sample Size{{הערה|[http://powerandsamplesize.com powerandsamplesize.comPower and Sample Size]}}
* חבילה של [[R (שפת תכנות)|R]] בשם pwr
 
==ראו הפניות גם==
* [[הסקת מסקנות]]
* Ellis, P. D. (2010). ''The essential guide to effect sizes: Statistical power, meta-analysis, and the interpretation of research results''. Cambridge University Press
 
== לקריאה נוספת ==
* Everitt, B. S., & Skrondal, A. (2002). The Cambridge dictionary of statistics.''Cambridge: Cambridge''
<div style="direction: ltr;">
* (Hoenig, J. M., & Heisey, D. M. (2001). The abuse of power. ''The American Statistician'', ''55''(1
* Cohen, J. (1992). '''[https://journals.sagepub.com/doi/abs/10.1111/1467-8721.ep10768783 Statistical power analysis]'''. ''Current directions in psychological science'', pp. 98-101.
* Thomas, L. (1997) Retrospective power analysis. ''Conservation Biology'' 11(1):276–280
* Ellis, P. D. (2010). '''[https://www.cambridge.org/core/books/essential-guide-to-effect-sizes/72C26CA99366A19CAC4EF5B16AE3297F#fndtn-contents The essential guide to effect sizes: Statistical power, meta-analysis, and the interpretation of research results]'''. Cambridge University Press
* Weisburd, D., & Britt, C. (2014). Defining the Observed Significance Level of a Test: A Simple Example Using the Binomial Distribution. In ''Statistics in Criminal Justice'' (pp. 145-170). Springer US.
* Everitt, B. S., & Skrondal, A. (2002). '''[http://www.stewartschultz.com/statistics/books/Cambridge%20Dictionary%20Statistics%204th.pdf The Cambridge dictionary of statistics.]'''. Cambridge: Cambridge''
* (Hoenig, J. M., & Heisey, D. M. (2001). '''[https://www.tandfonline.com/doi/abs/10.1198/000313001300339897 The abuse of power]'''. ''The American Statistician'', ''55'' (1)
* Thomas, L. (1997). '''[https://onlinelibrary.wiley.com/doi/abs/10.1046/j.1523-1739.1997.96102.x Retrospective power analysis]'''. ''Conservation Biology'' 11(1):276–280
* Weisburd, D., & Britt, C. (2014). '''[https://link.springer.com/chapter/10.1007/978-1-4614-9170-5_7 Defining the Observed Significance Level of a Test: A Simple Example Using the Binomial Distribution]'''. In ''Statistics in Criminal Justice'' (pp. 145-170). Springer US.
</div>
 
==ראו גם==
* [[הסקת מסקנות]]
* Cohen, J. (1992). Statistical power analysis. ''Current directions in psychological science'', 98-101.
== קישורים חיצוניים ==
<div style="direction: ltr;">
*[https://www.youtube.com/watch?v=qUoOJ7QBLKY Video: Power and Sample Size Primer by NCSS]
 
*[https://webpower.psychstat.org/wiki/ WebPower - Free online sample size planning for one-way ANOVA, two-way ANOVA, repeated-measure ANOVA, SEM, multilevel modeling]
*[http://powerandsamplesize.com/About/ PowerAndSampleSize.com – free, online power and sample size calculators with graphics highlighting sensitivity to input values]
 
*[https://www.ncss.com/software/pass/ PASS – Power analysis and sample size software]
* PowerAndSampleSize.com – free, online power and sample size calculators with graphics highlighting sensitivity to input values
</div>
 
* PASS – Power analysis and sample size software
 
* https://www.youtube.com/watch?v=QW9_T8nrApU
 
== הערות שוליים ==
{{הערות שוליים||יישור=שמאל}}
 
{{קצרמר|סטטיסטיקה}}
[[קטגוריה:בדיקת השערות]]