הלמה של ניימן-פירסון – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ החלפת קוד LaTeX מיושן mw:Extension:Math/Roadmap
מ דוגמה
שורה 2:
 
== ניסוח ==
בהינתןנתונים [[מדגם]] <math>\mathbf{X}=(X_1,\dots,X_n)</math>, ובהינתן [[פונקציית נראות]] <math>L(\mathbf{X};\theta)</math> התלויה ב[[פרמטר (סטטיסטיקה)|פרמטר]] <math>\theta</math>, ושתי [[השערה סטטיסטית(סטטיסטיקה)|השערות]] פשוטות: [[השערת האפס]], <math>H_0\,: \theta =\theta_0</math> ו-וההשערה החלופית, <math>H_1\,: \theta =\theta_1</math>. תחת תנאים אלה, [[מבחן יחס הנראות]], ש[[אזור דחייה|אזור הדחייה]] שלו הוא:<math display="block">\mathcal{R}_k=\left\{\mathbf{X}: \frac{L(\mathbf{X};\theta_1)}{L(\mathbf{X};\theta_0)} > k_\alpha\right\}</math>
הוא ה[[מבחן סטטיסטי|מבחן]] בעל ה[[עוצמה סטטיסטית|עוצמה]] הגדולה ביותר (Uniformly Most Powerful; UMP) מבין כל המבחנים ב[[רמת מובהקות]] <math>\alpha</math> (כלומר, מתקיים <math>\operatorname{Pr}(\mathbf{X} \in \mathcal{R}_k)=\alpha</math>, אם <math>H_0</math> נכונה).
 
למעשה, פעמים רבות ניתן למצוא מבחן שקול (כלומר, בעל אותו אזור דחייה), ש[[סטטיסטי]] המבחן שלו פשוט יותר – ראו דוגמה להלן.
 
==הוכחה דוגמה ==
נניח [[מודל סטטיסטי]] שבו הנתונים [[התפלגות נורמלית|מתפלגים נורמלית]] עם [[שונות]] ידועה <math>\sigma^2</math> ותוחלת לא ידועה <math>\mu</math>. נניח גם כי קיימות שתי השערות חלופיות פשוטות באשר לתוחלת:<math display="block">\begin{array}{lcl} H_0 : & \mu=0 \\ H_1: & \mu=1 \end{array}</math>ה[[פונקציית נראות|נראות]] לפי השערת האפס היא <math display="block">L(\mathbf{X};\theta_0) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{1}{2}\sum_{i=1}^n {X_i}^2\right)</math>ובאופן דומה, הנראות לפי ההשערה החלופית היא <math display="block">L(\mathbf{X};\theta_1) = \frac{1}{\sqrt{2\pi\sigma^2}}\exp\left(-\frac{1}{2}\sum_{i=1}^n \left(X_i-1\right)^2\right)</math>ויחס הנראות הוא<math display="block">
\begin{alignat}{2}
\frac{L(\mathbf{X};\theta_1)}{L(\mathbf{X};\theta_0)} & = \frac{\cancel{\frac{1}{\sqrt{2\pi\sigma^2}}}\exp\left(-\frac{1}{2}\sum_{i=1}^n {X_i}^2\right)}{\cancel{\frac{1}{\sqrt{2\pi\sigma^2}}}\exp\left(-\frac{1}{2}\sum_{i=1}^n \left(X_i-1\right)^2\right)} \\
& = \frac{\exp\left(-\frac{1}{2}\sum_{i=1}^n {X_i}^2\right)}{\exp\left(-\frac{1}{2}\sum_{i=1}^n \left({X_i}^2-2X_i+1\right)^2\right)} \\
& = \exp\left[-\frac{1}{2}\sum_{i=1}^n \left(\cancel{{X_i}^2} - \cancel{{X_i}^2} + 2X_i - 1\right)\right] \\
& = \exp\left(\sum_{i=1}^n X_i - \frac{n}{2}\right) \\
\end{alignat}</math>נרצה להשוות את יחס הנראות הזה לערך קריטי התלוי במובהקות, ולדחות את השערת האפס אם <math display="block">
\exp\left(\sum_{i=1}^n X_i - \frac{n}{2}\right) > k^*_\alpha</math>עם זאת, ניתן לשים לב כי תנאי הזה שקול לדחייה של השערת האפס אם<math display="block">\bar{X}_n \overset{\mathrm{def}}{=} \frac{1}{n}\sum_{i=1}^n X_i > k_\alpha</math>
 
עבור ערך קריטי <math>k_\alpha</math> מתאים.
 
במילים אחרות, מבחן יחס הנראות שקול למבחן שבודק האם ממוצע המדגם <math>\bar{X}_n</math> גדול מערך קריטי, ולמבחן כזה יש עוצמה מקסימלית. היתרון בהצגה זו היא שממוצע המדגם הוא סטטיסטי מבחן פשוט יותר לניתוח מאשר יחס הנראות עצמו. בפרט, ניתן לחשב ממנו (בעזרת מעט טרנספורציות פשוטות) [[מבחן Z]].
 
== הוכחה ==
[[קובץ:Neyman-Pearson.svg|ממוזער|350px|[[דיאגרמת ון]] הממחישה את ההוכחה ללמה של ניימן ופירסון: אזורי הדחייה אם מתקיימת השערת האפס]]
[[קובץ:Neyman-Pearson2.svg|ממוזער|350px|אזורי הדחייה אם מתקיימת ההשערה האלטרנטיבית]]