רגרסיה ליניארית – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Lee gafter (שיחה | תרומות)
Matanyabot (שיחה | תרומות)
מ בוט החלפות: תאור\1, אוכלוסייה, הווקטור, שוויון, בהינתן, הטיה\1, ממדי
שורה 3:
 
== הגדרה ==
תהי <math>Y:=\{y_i\}^{n}_{i=1}</math> [[סדרה]] בת <math>n</math> איברים של ערכי משתנה <math>Y</math>, ו <math>\bigcup_{j=1}^k\{X_j\}</math> משפחה של קבוצות שאיבריהן הסדרות: <math>X_j:=\{x_{j_i}\}^{n}_{i=1} , \forall{j=1,2,...,n}</math>. לכל [[אינדקס (מתמטיקה)|אינדקס]] <math>i</math> נגדיר את [[וקטור|הוקטורהווקטור]]: <math>(y_i,x_{1_i},x_{2_i},...,x_{k_i})</math>.
 
תחת הנחת הלינאריות נאמר כי רכיבי הוקטורהווקטור מקיימים את הקשר הלינארי הבא:
 
<math>y_i=\beta_1x_{1_i}+\beta_2x_{2_i}+...+\beta_kx_{k_i}+\varepsilon_i, i=1,2,...,n</math>
שורה 17:
 
כאשר:
* <math>\bold{y}\in F^n</math> וקטור <math>n</math>-מימדיממדי של ערכי הסדרה <math>Y</math>
* <math>X\in F^{n\times{k}}</math> [[מטריצה]] מסדר <math>n\times k</math> המבטאת את ההרכבה הבאה:
<math>\bold{X}=\begin{pmatrix} \bold{x_1^{T}} \\ \bold{x_2^{T}} \\.\\.\\.\\ \bold{x_k^{T}}\\ \end{pmatrix}=\begin{pmatrix} x_{11} & ... & x_{1k}\\ x_{21} & ... & x_{2k}\\ \vdots & \ddots & \vdots\\ x_{n1} & ... & x_{nk}\\ \end{pmatrix}</math>
* <math>\bold{\beta,\varepsilon}\in F^n</math> וקטורים <math>n</math>-מימדייםממדיים.
 
== משוואת המודל הלינארי ==
בהנתןבהינתן מערכת המשוואות הלינארית: <math>\bold{y=X}\bold{\beta+\varepsilon}</math>, וקטור פתרונות המערכת, <math>\bold \beta
</math>, נגדיר [[העתקה לינארית|העתקה]]: <math>P:\mathbb{F}^k\rightarrow \mathbb{F}</math> באופן הבא:
 
שורה 32:
<math>P(x_1,...,x_n)=a+\beta_1x_1+\cdots+\beta_kx_k</math>
 
פולינום זה מאפשר לנו לקבל אומדן לכל ערך של משתנה <math>y</math> בטווח הדגימה, דהיינו: <math>\underset{i\in[n]}{min\{y_i\}}\leq y\leq \underset{i\in [n]}{max\{y_i\}}</math>, בהנתןבהינתן כל <math>k</math> ערכים שנבחר למשתנים: <math>x_1,\dots,x_k</math>.
 
==== משוואת הניבוי של המודל הלינארי ====
המודל המוצג לעיל הינו תיאורטיתאורטי בלבד, ומניח למעשה כי דגמנו מאוכלוסיהמאוכלוסייה בת <math>n</math> פרטים, את כלל הפרטים. במציאות, דגימה של כלל האוכלוסיההאוכלוסייה לרב אינה אפשרית, ועל כן אנו בונים את משוואת הניבוי באמצעות אומדים למודל הלינארי של האוכלוסיההאוכלוסייה. במקרה זה, נחפש וקטור פתרונות <math>\bold{b}</math>, עבור המשוואה: <math>\bold{y=X}\bold{b+\varepsilon}</math>.
 
===== אומדים חסרי הטייההטיה =====
מכיוון שהוקטורשהווקטור <math>\bold{b}</math> מקיים את השיוויוןהשוויון: <math>\bold{y=X}\bold{b+\varepsilon}</math> ולא את השיוויוןהשוויון: <math>\bold{y=X}\bold{b}</math>, בכל מקרה בו <math>\varepsilon_i\neq0</math> נקבל: <math>P(x_{1_i},\dots,x_{k_i})=y\neq y_i</math> ועל כן נשאף למצוא וקטור <math>\bold{b}</math> כך ש: <math>argmin_\bold{b} P(|y_i-y|)</math>.
 
מכיוון שדגמנו <math>n</math> ערכים של המשתנה <math>Y</math>, נדרוש את הדרישה השקולה: <math>argmin_{\bold{b}}\sum_{i=1}^N[y_i-P(x_{1_i},\dots,x_{k_i})]^2</math>
שורה 44:
וקטור שעומד בדרישה זו נקרא אומד ל- <math>\bold{\beta}</math> [[הריבועים הפחותים|בשיטת הריבועים הפחותים]], יקיים את התכונות הבאות:
* '''אומד לינארי-''' וקטור זה הוא פתרון של מערכת משוואות לינארית
* '''שונות נגזרת משונות האוכלוסיההאוכלוסייה-''' [[שונות|השונות]] של <math>\bold{b}</math> מקיימת: <math>V(\bold{b})={{\sigma^2}\over{\sum{x_i^2}}}</math>
* '''הנחת [[התפלגות נורמלית|נורמליות]]-''' אנו מניחים כי <math>\bold{b} \thicksim N(\beta,{{\sigma^2}\over{\sum{x_i^2}}})</math>
* '''אומד חסר הטיה-''' עבור <math>\beta</math>, וקטור מקדמי המערכת הלינארית התיאורטיתהתאורטית של האוכלוסיההאוכלוסייה, [[תוחלת]] הוקטורהווקטור <math>\bold{b}</math> תקיים: <math>E(\bold{b})=\beta</math>
* '''הנחת השונות המינימלית-''' לכל אומד <math>\bold{\widehat{b}} \neq \bold{b}</math> מתקיים: <math>V(\bold{\widehat{b}})>V(\bold{b})</math>
שתי התכונות האחרונות ניתנות להרחבה במודל בו מניחים <math>n \rightarrow \infty</math> ושקולות, בהתאמה, לשתי התכונות הבאות:
* '''אומד חסר הטיה באופן [[אסימפטוטי]]-''' יקיים: <math>\lim_{n \to \infty} ({E(\bold{b}})-\beta)=0</math>
* '''עקיבות-''' אומד חסר הטייההטיה באופן אסימפטוטי המקיים גם: <math>\lim_{n\rightarrow \infty}V(\bold{b})=0</math>
תכונות אלו יחדיו, מבטיחות כי הגדלת גודל המדגם עליו מבוססת משוואת האמידה, תקרב אותנו לפרמטרים האמיתיים של האוכלוסיההאוכלוסייה, דהיינו, אל <math>\beta</math>
 
===== ההנחות הקלאסיות =====
שורה 62:
* '''איסור מולטיקולינאריות מושלמת-''' לכל משתנה מסביר <math>\bold{X_j}</math>, נניח כי: <math>V(\bold{X_j})\neq 0</math>.
=== אמידה במקרים בהם לא מתקיימות ההנחות הקלאסיות===
לא בכל מדגם שנאסוף יתקיימו כלל ההנחות שמנינו לעיל, לרב בעקבות תכונות של האוכלוסיההאוכלוסייה ממנה נלקחו התצפיות, או מגבלות באיסוף התצפיות עצמן. במקרים כאלו, לא ניתן להשתמש בשיטת הריבועים הפחותים לאמידת המודל, ונדרש להשתמש בשיטות אמידה אחרות, שמניבות אומדים חסרי הטייההטיה, תחת הנחות מקלות יותר.
במציאות, סדרות נתונים לרב לא יקיימו את כלל ההנחות הקלאסיות, ועל כן לאורך השנים התפתחו שיטות אמידה רבות, אשר קצרה היריעה מלאזכר. את השיטות השונות ניתן לחלק למספר קטגוריות, בהתאם להנחות שהן מתירות להפר:
* '''אמידה של סדרות עתיות-''' שיטות המטפלות בסדרות בהן קיים מתאם סדרתי. השיטה הנפוצה, והפשוטה ביותר, לטפל בסדרות נתונים מסוג זה היא באמצעות החלקה מעריכית- התמרה של ערכי הסדרות בהן קיים מתאם סדרתי לערכי הלוגריתם הטבעי של הפרש התצפיות.