רגרסיה ליניארית – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
Lee gafter (שיחה | תרומות) |
Matanyabot (שיחה | תרומות) מ בוט החלפות: תאור\1, אוכלוסייה, הווקטור, שוויון, בהינתן, הטיה\1, ממדי |
||
שורה 3:
== הגדרה ==
תהי <math>Y:=\{y_i\}^{n}_{i=1}</math> [[סדרה]] בת <math>n</math> איברים של ערכי משתנה <math>Y</math>, ו <math>\bigcup_{j=1}^k\{X_j\}</math> משפחה של קבוצות שאיבריהן הסדרות: <math>X_j:=\{x_{j_i}\}^{n}_{i=1} , \forall{j=1,2,...,n}</math>. לכל [[אינדקס (מתמטיקה)|אינדקס]] <math>i</math> נגדיר את [[וקטור|
תחת הנחת הלינאריות נאמר כי רכיבי
<math>y_i=\beta_1x_{1_i}+\beta_2x_{2_i}+...+\beta_kx_{k_i}+\varepsilon_i, i=1,2,...,n</math>
שורה 17:
כאשר:
* <math>\bold{y}\in F^n</math> וקטור <math>n</math>-
* <math>X\in F^{n\times{k}}</math> [[מטריצה]] מסדר <math>n\times k</math> המבטאת את ההרכבה הבאה:
<math>\bold{X}=\begin{pmatrix} \bold{x_1^{T}} \\ \bold{x_2^{T}} \\.\\.\\.\\ \bold{x_k^{T}}\\ \end{pmatrix}=\begin{pmatrix} x_{11} & ... & x_{1k}\\ x_{21} & ... & x_{2k}\\ \vdots & \ddots & \vdots\\ x_{n1} & ... & x_{nk}\\ \end{pmatrix}</math>
* <math>\bold{\beta,\varepsilon}\in F^n</math> וקטורים <math>n</math>-
== משוואת המודל הלינארי ==
</math>, נגדיר [[העתקה לינארית|העתקה]]: <math>P:\mathbb{F}^k\rightarrow \mathbb{F}</math> באופן הבא:
שורה 32:
<math>P(x_1,...,x_n)=a+\beta_1x_1+\cdots+\beta_kx_k</math>
פולינום זה מאפשר לנו לקבל אומדן לכל ערך של משתנה <math>y</math> בטווח הדגימה, דהיינו: <math>\underset{i\in[n]}{min\{y_i\}}\leq y\leq \underset{i\in [n]}{max\{y_i\}}</math>,
==== משוואת הניבוי של המודל הלינארי ====
המודל המוצג לעיל הינו
===== אומדים חסרי
מכיוון
מכיוון שדגמנו <math>n</math> ערכים של המשתנה <math>Y</math>, נדרוש את הדרישה השקולה: <math>argmin_{\bold{b}}\sum_{i=1}^N[y_i-P(x_{1_i},\dots,x_{k_i})]^2</math>
שורה 44:
וקטור שעומד בדרישה זו נקרא אומד ל- <math>\bold{\beta}</math> [[הריבועים הפחותים|בשיטת הריבועים הפחותים]], יקיים את התכונות הבאות:
* '''אומד לינארי-''' וקטור זה הוא פתרון של מערכת משוואות לינארית
* '''שונות נגזרת משונות
* '''הנחת [[התפלגות נורמלית|נורמליות]]-''' אנו מניחים כי <math>\bold{b} \thicksim N(\beta,{{\sigma^2}\over{\sum{x_i^2}}})</math>
* '''אומד חסר הטיה-''' עבור <math>\beta</math>, וקטור מקדמי המערכת הלינארית
* '''הנחת השונות המינימלית-''' לכל אומד <math>\bold{\widehat{b}} \neq \bold{b}</math> מתקיים: <math>V(\bold{\widehat{b}})>V(\bold{b})</math>
שתי התכונות האחרונות ניתנות להרחבה במודל בו מניחים <math>n \rightarrow \infty</math> ושקולות, בהתאמה, לשתי התכונות הבאות:
* '''אומד חסר הטיה באופן [[אסימפטוטי]]-''' יקיים: <math>\lim_{n \to \infty} ({E(\bold{b}})-\beta)=0</math>
* '''עקיבות-''' אומד חסר
תכונות אלו יחדיו, מבטיחות כי הגדלת גודל המדגם עליו מבוססת משוואת האמידה, תקרב אותנו לפרמטרים האמיתיים של
===== ההנחות הקלאסיות =====
שורה 62:
* '''איסור מולטיקולינאריות מושלמת-''' לכל משתנה מסביר <math>\bold{X_j}</math>, נניח כי: <math>V(\bold{X_j})\neq 0</math>.
=== אמידה במקרים בהם לא מתקיימות ההנחות הקלאסיות===
לא בכל מדגם שנאסוף יתקיימו כלל ההנחות שמנינו לעיל, לרב בעקבות תכונות של
במציאות, סדרות נתונים לרב לא יקיימו את כלל ההנחות הקלאסיות, ועל כן לאורך השנים התפתחו שיטות אמידה רבות, אשר קצרה היריעה מלאזכר. את השיטות השונות ניתן לחלק למספר קטגוריות, בהתאם להנחות שהן מתירות להפר:
* '''אמידה של סדרות עתיות-''' שיטות המטפלות בסדרות בהן קיים מתאם סדרתי. השיטה הנפוצה, והפשוטה ביותר, לטפל בסדרות נתונים מסוג זה היא באמצעות החלקה מעריכית- התמרה של ערכי הסדרות בהן קיים מתאם סדרתי לערכי הלוגריתם הטבעי של הפרש התצפיות.
|