רגרסיה ליניארית – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
ביטול גרסה 16081668 של 31.210.180.154 (שיחה)
אין תקציר עריכה
שורה 18:
 
המודל הבסיסי של הרגרסיה הלינארית גמיש מספיק כדי לאפשר תלות בין המשתנים המסבירים, וניתן לכלול בו גם גורמים שאינם לינארים (כמו במודל <math>\ Y = aX(1)+bX(1)^2+cX(2)+dX(1)X(2)+error</math>). אחד השימושים העיקריים של המודל הוא במדידת הרלוונטיות של משתנה מסביר, באמצעות השוואת המודל הכולל אותו, למודל המסביר את אותה תופעה בלעדיו. הוספת משתנים משפרת את יכולת ההערכה כמעט ללא יוצא מן הכלל, אבל במקרים רבים השיפור הוא אקראי, ואינו נובע מקשר אמיתי בין המשתנים. גורם עיקרי במענה על שאלות מסוג זה מהווה '''מקדם המתאם המרובה''', המסומן <math>\ R^2</math>, ומתפלג (לאחר תיקון) [[התפלגות F]].
 
==שימושים של רגרסיה ליניארית==
לרגרסיה ליניארית שימוש נרחב במדעי החיים,חברה והתנהגות לתיאור קשרים אפשריים בין משתנים. היא נחשבת כאחד מהכלים החשובים שנעשה בהם שימוש בדיסציפלינות הללו.
 
'''קו מגמה'''
 
קו זה מייצג מגמה, תנועה לטווח ארוך לאורך נתונים על ציר הזמן לאחר התחשבות בגורמים אחרים. הוא אומר לנו האם אוסף נתונים מסויים (לדוגמא תמ"ג, מחירי נפט או מחירי מניה) עלה או ירד לאורך תקופת זמן מסויימת. ניתן לצייר קו מגמה בצורה פשוטה יחסית על ידי מבט בתצפיות, אך ליתר דיוק יש לחשב את מיקום הנק' והשיפוע על ידי כלים סטטיסטיים כמו רגרסיה ליניארית. בדרך כלל קווי מגמה הם קווים ישרים אולם יש ווריאציות המשתמשות בפולינומים מדרגה גבוהה התלויים ברמת הקעירות הרצויה.
לעיתים משמשים קווי מגמה בניתוחים עסקיים כדי להראות שינויים במידע לאורך זמן. יש לכך יתרון של פשטות. קווי מגמה משמשים לרוב כדי לטעון שפעולה או אירוע (כמו אימון או מסע פרסום) גרמו לשינויים שניתנים להבחנה בנק' זמן. זו טכניקה פשוטה שאינה דורשת קבוצת בקרה, תכנון ניסויי או אנליזה מתוחכמת. למרות זאת, הם סובלים מחוסר אמינות מדעית במקרה ששינויים אחרים יכולים להשפיע על הנתונים.
 
[['''אפידמיולוגיה''']]
 
ראיות מוקדמות המקשרות עישון טבק (קישור) למוות ותחלואה הגיעו מניסויים שהופעלו בהם ניתוחים רגרסיביים. במטרה להנמיך קורלציות מקריות בניתוח נתונים מדגמיים, חוקרים בדרך כלל כוללים מספר משתנים במודל הרגרסיה שלהם בנוסף למשתנה העיקרי שנחקר. לדוגמא, נניח שיש לנו מודל רגרסיה שבו עישון סיגריות הוא משתנה המחקר המבוקש הבלתי תלוי, והמשתנה התלוי הוא תוחלת חיים הנמדד בשנים. חוקרים עלולים לכלול מעמד סוציו-אקונומי כמשתנה בלתי תלוי נוסף, כדי להבטיח שכל השפעה שהובחנה של עישון על תוחלת החיים אינו עקב השפעה על החינוך או ההכנסה. למרות זאת, לעולם לא אפשרי לכלול את כל המשתנים המשתלבים בניתוח אמפירי. לדוגמא, גן היפותטי עלול להגדיל תמותה ובנוסף לגרום לאנשים לעשן יותר. מסיבה זו, ניסויים מבוקרים ארעיים מסוגלים לרוב לייצר ראיה משכנעת יותר של קשרי סיבתיות שניתן להשיג על ידי שימוש באנליזה רגרסיבית של אוסף נתונים. כשניסויים מבוקרים לא אפשריים, דרכים שונות של אנליזה רגרסיבית כגון רגרסיית משתני עזר, יכולים לשמש לניסיון להעריך קשרי סיבתיות מתוך אוסף נתונים.
 
'''פיננסים'''
 
מודל לתמחור נכסי הון ([[CAPM]]) משתמש ברגרסיה ליניארית כמו גם ברעיון של [[בטא]] לניתוח וכימות הסיכון השיטתי של השקעה. זה נובע ישירות ממקדם בטא של מודל הרגרסיה הליניארית שמקשר את תשואת ההשקעה לתשואה מכל הנכסים עם אופי סיכון גבוה.
 
'''כלכלה'''
 
ערך ראשי: [[אקונומטריקה]]
רגרסיה ליניארית הכלי האמפירי המרכזי בכלכלה. לדוגמא, הוא משמש לחיזוי הוצאות צריכה, הוצאות השקעה קבועות, השקעה באגירת מלאי, רכישות של יצוא של מדינה, הוצאות על יבוא, הדרישה להחזיק בנכנסים נזילים, ביקוש והיצע לעבודה.
 
'''מדעי הסביבה'''
 
ברגרסיה ליניארית נעשה שימוש במגוון רחב של יישומי מדעי הסביבה. בקנדה, "תוכנית הבקרה על ההשפעות הסביבתיות " משתמשת בניתוח סטטיסטי של מחקרים של דגים וקרקעית הים למדידת ההשפעות של שפכי עיסה טחונה או מתכות על המערכת הימית האקולוגית.
 
== ראו גם ==