מודל (סטטיסטיקה) – הבדלי גרסאות

נוספו 24 בתים ,  לפני 4 חודשים
מ
←‏דוגמה: שיפור ניסוח.
מ (←‏דוגמה: שיפור ניסוח.)
מודל קביל חייב להיות עקבי עם כל הנתונים. לפיכך, הקו ישר (<math>h_i = b_0 + b_1 \cdot a_i</math>) לא יכול להיות המשוואה עבור מודל הנתונים, כי הוא אינו מתאים בדיוק לכל הנתונים  – התאמה תתקיים רק אם כל הנתונים נמצאים בדיוק על הקו. מסיבה זו, מוסיפים למשוואת המודל איבר שגיאה <math>\epsilon_i</math>, כדי שהמודל יהיה תואם לכל הנתונים.
 
כדי לבצע [[הסקה סטטיסטית]], יש קודם כל להניח איזולאיזו משפחה של התפלגויות הסתברות עבורשייך איבר השגיאה <math>\epsilon_i</math>. למשל, ניתן (ולפעמים מקובל) להניח כי <math>\epsilon_i</math> הם משתנים מקריים [[התפלגות נורמלית|נורמליים]] שווי-התפלגות בלתי-תלויים (לשם הקיצור: ש"ה ב"ת), בעלי תוחלת 0. במקרה זה, למודל יש 3 פרמטרים: <math>b_0</math>, <math>b_1</math>, והשונות של ההתפלגות הנורמלית (<math>\sigma^2</math>).
 
ניתן להגדיר את המודל באופן רשמי בצורה <math>S</math> כדלקמן: מרחב הנתונים של המודל, <math>(S, \mathcal{P})</math>, הוא קבוצת כל הזוגות (גיל, גובה) האפשריים. כל ערך אפשרי של <math>\theta = \left(b_0, b_1, \sigma^2\right)</math> קובע התפלגות על <math>S</math>; נסמן את התפלגות זו ב-<math>\mathcal{P}</math>. אם <math>\Theta</math> היא קבוצת כל הערכים האפשריים של <math>\theta</math>, אז <math>\mathcal{P}=\{P_{\theta} : \theta \in \Theta\}</math>. קל לבדוק שפרמטריזציה כזו היא ניתנת לזיהוי.
425

עריכות