שונות משותפת

ערך מחפש מקורות
רובו של ערך זה אינו כולל מקורות או הערות שוליים, וככל הנראה, הקיימים אינם מספקים.
אנא עזרו לשפר את אמינות הערך באמצעות הבאת מקורות לדברים ושילובם בגוף הערך בצורת קישורים חיצוניים והערות שוליים.
אם אתם סבורים כי ניתן להסיר את התבנית, ניתן לציין זאת בדף השיחה.

בתורת ההסתברות ובסטטיסטיקה, השונות המשותפתאנגלית: Covariance) היא מדד לקשר בין שני משתנים מקריים. השונות המשותפת חיובית כאשר המשתנים נוטים לסטות מהממוצע באותו כיוון (שניהם מעליו או ששניהם מתחתיו כאשר מתרחש מאורע כלשהו), ושלילית כאשר שני המשתנים סוטים בכיוונים מנוגדים זה לזה כשמאורע כלשהו קורה.

אם מנרמלים את השונות המשותפת באמצעות חלוקתה במכפלת סטיות התקן של המשתנים המעורבים, מתקבל מדד הנקרא "מקדם המתאם", שערכו בין 1 ל-1-. אם המקדם קרוב לערכים הקיצוניים, זהו אות לכך שהמשתנים קשורים זה בזה (קשר שעשוי להיות סיבתי, אך אינו בהכרח כזה). אפשר לראות במושג זה הכללה של השונות, משום שהשונות המשותפת של משתנה מקרי עם עצמו, שווה לשונות שלו. השונות המשותפת של משתנים בלתי תלויים שווה לאפס, אך אם השונות המשותפת שווה לאפס, המשתנים אינם בהכרח בלתי תלויים, אלא רק בלתי מתואמים.

הגדרה

עריכה

נסמן את התוחלות של המשתנים המקריים   ו-  על ידי   ו- . השונות המשותפת של השניים מוגדרת להיות:

 

או בקצרה:

 

מִתאם

עריכה

מאי-שוויון קושי-שוורץ נובע שתמיד  , כאשר   היא השונות של המשתנה המקרי   (וכן ל- ). בפרט, השונות המשותפת קיימת (וסופית) כל אימת שלמשתנים   ו-  יש שונות סופית. מאותה סיבה, הערך המוחלט של מקדם המתאם   אינו עולה על 1.

תכונות

עריכה

השונות המשותפת היא תבנית ביליניארית, כלומר,  , וכן ברכיב הימני. זוהי תבנית סימטרית, שהיא חיובית לחלוטין על מרחב המשתנים המקריים (כאשר מזהים משתנים שההפרש ביניהם קבוע בהסתברות 1), מכיוון שלמשתנה שאינו קבוע בהסתברות 1, יש שונות חיובית. מכאן שהשונות המשותפת מגדירה מכפלה פנימית על מרחב המשתנים המקריים עד-כדי הזיהוי הנזכר לעיל.

  • כיוון – השונות המשותפת יכולה להיות חיובית או שלילית, בהתאם לקשר בין שני המשתנים וכך להצביע אם קיים קשר חיובי או שלילי ביניהם.
  • גודל – שיתוף פעולה הוא מדד לחוזק הקשר בין שני משתנים. גודל גדול יותר מצביע על קשר חזק יותר, בעוד שגודל קטן מצביע על קשר חלש יותר.
  • יחידות – השונות מתבטאת בדרך כלל במונחים של היחידות של שני המשתנים הנמדדים. לדוגמה, אם משתנה אחד נמדד בדולרים והשני נמדד בפאונד, השונות תבוא לידי ביטוי בדולרים לפאונד.
  • נורמליזציה – ניתן לנרמל את השונות על ידי חלוקתה בסטיית התקן של שני המשתנים, וכתוצאה מכך לקבל את מקדם המתאם. זה מאפשר השוואה קלה יותר של עוצמת הקשר בין זוגות משתנים שונים.
  • אי תלות – אם שני משתנים בלתי תלויים, השונות המשותפת שלהם תהיה אפס, מה שמצביע על כך שאין קשר ביניהם. למשתנים ששונותם המשותפת אפס, קוראים משתנים בלתי מתואמים. כל שני משתנים בלתי תלויים הם בלתי מתואמים, אבל לא בהכרח להפך.
  • התפלגות דו-משתנית – השונות המשותפת היא מדד לקשר בין שני משתנים, וככזו היא תכונה של התפלגות דו-משתנית. זה לא מוגדר עבור התפלגויות חד-משתניות.
  • מגבלות – השונות המשותפת רגישה לקנה המידה של המשתנים הנמדדים, ואינה מביאה בחשבון קשרים שאינם קשרים ליניאריים. הוא גם אינו מספק מידע על כיוון הקשר (האם משתנה אחד גורם לשינוי השני, או להפך).

מטריצת השונויות

עריכה

אם X הוא וקטור של משתנים מקריים, מסמנים ב-  את מטריצת השונויות המשותפות, שהרכיב ה-  שלה הוא השונות המשותפת  . העתקה ליניארית של המשתנים מביאה לחפיפה של מטריצת השונויות: אם   מטריצה קבועה, אז  .

ראו גם

עריכה

קישורים חיצוניים

עריכה