מבחן גריינג'ר – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Lee gafter (שיחה | תרומות)
אין תקציר עריכה
Kobipe3 (שיחה | תרומות)
שינויי ניסוח ותיקוני עברית
שורה 1:
[[קובץ:GrangerCausalityIllustration.svg|thumb|348x348px|כאשר סדרה עתית X גריינג'ר-מסבירה את סדקה עתית Y, כיוון ועוצמת השינוי בערכי X, יופיעו בסדרה Y, לרב- בפיגור של כמה תקופות.]]
'''מבחן גריינג'ר''' הינו [[מבחן סטטיסטי]] הבודק את כוחה של [[סדרה עתית]] אחת, בניבוי סדרה עתית אחרת. מבחן זה עושה שימוש ב[[רגרסיה לינארית]] עם [[משתנים בפיגור]] ובמבחני מובהקות שונים כגון [[מבחן F]], קריטריון האינפורמציה של Akaike וקריטריון בייס. המבחן בודק את ההשערה כי תוספת של ערכים בפיגור של [[משתנה בלתי תלוי|משתנה מסביר]] X למשוואה המכילה ערכים בפיגור של [[משתנה תלוי|משתנה מוסבר]] Y, תגדיל את כוח ההסבר של המודל. במידהבמקרה והשערהשהשערה זו מתקבלת, נהוג לומר כי " X גריינג'ר-מסביר את Y".
 
המבחן פותח על ידי החוקר קלייב גריינג'ר בשנת 1969, והפך לרווח בעיקר בתחומי ה[[כלכלה]]. עם השנים הפך המבחן לשימושי ומקובל גם בתחומי המדעים המדויקים כגון [[מדעי המוח]], [[הנדסה]], ו[[מדעי המחשב]].
 
== הגדרה ==
שורה 8:
=== קשר סיבתי חד כיווני פשוט ===
{{סטטיסטיפדיה}}
תהיה <math>Y_t</math> סדרה עתית [[סדרה עתית|סטאציונריות]] בה הקשרמתקיים הקשר [[מודל אוטו-רגרסיבי|אוטו-רגרסיבי]] הפשוטפשוט: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}</math>, מתקייים עבור <math>K_y</math> כלשהו, ותהיה <math>X_t</math> סדרה עתית סטאציונרית נוספת.
 
עבור <math>U</math> ,[[מרחב הסתברות|מרחב האינפורמציה]] שנצברה עבור כלל המשתנים במודל, עד לתקופה <math>t</math>, ומרחבי האינפורמציה של הסדרות <math>X_t</math> ו- <math>Y_t</math>, נסמן את שני תתי-המרחבים הבאים:
* מרחב האינפורמציה שנצברה אודות המשתנה בעבר: <math>\overline{A_i}:=\{A_{t-j}: j=1,2,3,...\}</math>
* מרחב האינפורציה שנצברה אודות המשתנה בעבר, ובנקודה בה אנו אומדיםהנוכחית: <math>\overline{\overline{A_i}}:=\{A_{t-j}: j=0,1,2,...\}</math>
נאמר כי <math>X</math> גריינג'ר-מסביר את <math>Y</math> אם ורק אם: <math>\sigma^2(Y|{U})<\sigma^2 (Y|\overline{U\backslash{X}})</math>.
 
כלומר, שימוש בכלל האינפורמציה במרחב <math>U</math>, עדיף על שימוש בכלל האינפורמציה אותו המרחב, ''למעט'' האינפורמציה אודות <math>X</math>.
 
מבחינת משוואות האמידה, נאמר כי המשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}+\sum_{j=1}^{K_x}b_jx_{t-j}</math> בעלת כוח הסבר רב יותר מן המשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}</math>.
 
== הרחבת המודל ==
שורה 24:
 
==== קשר סיבתי מיידי ====
ההבדל העיקרי בין קשר סיבתי פשוט, לקשר סיבתי מיידי, הוא בבחינת כוח ההסבר של ערך הסדרה <math>X_t</math> בנקודת הזמן בה אומדים את <math>Y_t</math>. על כן, נאמר כי <math>X</math> גריינג'ר-מסביר באופן מיידי את <math>Y</math> אם ורק אם: <math>\sigma^2(Y|{\overline{U},\overline{\overline{X}}})<\sigma^2 (Y|\overline{U})</math>.
 
כלומר, שימוש בכלל האינפורמציה במרחב <math>\overline{U}</math>, עדיף על שימוש בכלל האינפורמציה אותו המרחב, ''למעט'' האינפורמציה אודות <math>\overline{\overline{X}}</math>.
 
מבחינת משוואות האמידה, נאמר כי המשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}+\sum_{j=0}^{K_x}b_jx_{t-j}</math> בעלת כוח הסבר רב יותר מן המשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}</math>.
 
==== קשר סיבתי בפיגור ====
עבור הסדרה <math>X_t</math> נגדיר את הסדרה <math>X(m):=\{X_{t-m}, X_{t-(m+1)}, X_{t-(m-2)},...\}</math>, כאשר: <math>m\in \N\backslash{\{0,1\}}</math>.
 
נאמר כי כי <math>X</math> גריינג'ר-מסביר בפיגור <math>m</math> י את <math>Y</math>, אם ורק אם <math>m</math> הוא המספר הטבעי הקטן ביותר עבורו: <math>\sigma^2(Y|{U\backslash X(m)})<\sigma^2 (Y|{U\backslash X(m+1)})</math>.
 
כלומר, שימוש בערכים: <math>X_t,X_{t-1},...,X_{t-(m-1)}</math> לא תורם לכח ההסבר של <math>X</math> את <math>Y</math>.
 
מבחינת משוואת האמידה, נאמר כי המשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}+\sum_{j=m}^{K_x}b_jx_{t-j}</math> בעלת כוח הסבר רב יותר מהמשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}+\sum_{j=0}^{K_x}b_jx_{t-j}</math>, וגם מן המשוואה: <math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}</math>.
 
=== קשרים דו-כיווניים ===
שורה 47:
 
=== היזון חוזר ===
תחת אותן ההגדרות, ואותם הסימונים, נאמר כי קיים היזון חוזר בין <math>X</math> ל- <math>Y</math> אם ורק אם מתקיימים יחדיו שני התנאים הבאים:
 
<math>\sigma^2(Y|{U})<\sigma^2 (Y|\overline{U\backslash{X}})</math>
שורה 53:
<math>\sigma^2(X|{U})<\sigma^2 (X|\overline{U\backslash{Y}})</math>
 
במצב זה, מתקיים למעשה קשר סיבתי חד כיווני פשוט עבור שתי הסדרות, כמסבירות זו של זו,. ובמקרהאם זהכך, זוג משוואות האמידה:
 
<math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}+\sum_{j=1}^{K_x}b_jx_{t-j}</math>
שורה 59:
<math>x_t=a+\sum_{j=1}^{K_x}b_jx_{t-j}+\sum_{j=1}^{K_y}b_jy_{t-j}</math>
 
יהיויהיה בעלותבעל כוח הסבר רב יותר מזוג המשוואות:
 
<math>y_t=a+\sum_{j=1}^{K_y}b_jy_{t-j}</math>
שורה 66:
 
== מגבלות ==
מבחן גריינג'ר מהווה כלי אנליטי חזק בתחומים רבים, אך הוא אינו רובסטיחסין (robust) דיו כדי לכמת את כלל הקשרים הסיבתיים בין סדרות עתיות. מגבלותיו העיקריות הינן:
* '''הסקהיכולת מוגבלת להסיק אודות קשר סיבתי -''' קיומו של קשר סיבתי בו משתנה אחד גריינג'ר-מסביר משתנה אחר, אינו מאפשר דחיה של ההשערה לגבי קיומו של מסביר נוסף, שאינו כלול במודל-, אך מסביר את שני המשתנים יחד. מסיבה זו, קיימת הפרדה טרמינולוגית ברורה בין סיבתיות, לגריינג'ר -סיבתיות.
* '''בעיתבעיית הרגרסיה המלאכותית -''' מכיוון שאמידה, מעצם הגדרתה, מגבילה עצמה לכמות נתונים מסויימתמסוימת, בטווח זמן מסוייםמסוים, היא עשויה ללכוד תופעה מקרית, אותה נפרש כחוקיות בהשפעת משתנה אחד על האחר. סדרות עתיות, הן המועדות ביותר לבעיית הרגרסיה המלאכותית, עקב השרירותיות בבחירת טווח זמני האמידה, ומגבלות מידע קיים על התופעה הנאמדת בעבר.
* '''בעיות של שימוש יתר במשתנים -''' מכיוון שסדרות עתיות מושפעות מערכיהן בעבר, השימוש בכמהבמספר רב יותר שיותרשל משתנים בפיגור אמור לכאורה להגדיל את כוח ההסבר של המודל. בפועל, ככל שכמות המשתנים גדולה יותר, כך כוח ההסבר של המודל הולך ופוחת. שימוש במספר רב מדי של משתנים בפיגור עשוי להניב מודל עם כח הסבר מרובה גבוה, אך עם אומדים מוטים.
* '''הנחת ההתפלגות הנורמלית של הטעות המקרית -''' מודל משוואת האמידה במבחן גריינג'ר תקף רק עבור סדרות בהן הטעות המקרית מתפלגת נורמלית, אך בעיקר. בסדרות פיננסיות- הנחה זו אינה מתקיימת. מסיבה זו, פותחו לאחרונה הרחבות שונות למבחן גריינג'ר שמאפשרות סטיה מהנחה זו.
 
== ראו גם ==