וקטור מקרי

בתורת ההסתברות, ובסטטיסטיקה, וקטור מקרי הוא וקטור של משתנים מקריים. לדוגמה, ניתן להתייחס לגיל, לגובה ולמשקל של אדם שנבחר באופן אקראי, כאל וקטור מקרי עם שלושה משתנים מקריים.

הגדרה תאורטית

בהינתן מרחב הסתברות, $(\Omega ,{\mathcal {F}},\Pr )$ , כאשר $\Omega$ הוא מרחב המדגם, ${\mathcal {F}}$ היא הסיגמה-אלגברה (קבוצת כל האירועים), ו- $\Pr$ היא מידת ההסתברות (פונקציה המחזירה את ההסתברות עבור כל אירוע). וקטור מקרי הוא פונקציה מדידה המוגדרת על מרחב המדגם ותמונתה נמצאת ב- $\mathbb {R} ^{n}$ , $\operatorname {X} :\Omega \mapsto \mathbb {R} ^{n}$ , ולכן ניתן לסמנו כוקטור עמודה $\mathbf {X} ={\begin{bmatrix}X_{1}\\\vdots \\X_{n}\end{bmatrix}}$

או כוקטור שורה  $\mathbf {X} =[X_{1},\dots ,X_{n}]$ , שמרכיביו הם משתנים מקריים, כלומר פונקציות מדידות,  $X_{i}:\Omega \mapsto \mathbb {R}$ ,  $1\leq i\leq n$ , המוגדרות על אותו מרחב הסתברות,  $(\Omega ,{\mathcal {F}},\Pr )$ .^[1]

הווקטור המקרי $\operatorname {X}$ מגדיר את פונקציית מידת ההתפלגות מהסיגמא-אלגברת בורל של המרחב האוקלידי ה- $n$ -י למספר ממשי בין 0 ל-1 $\nu :{\mathcal {R}}^{n}\mapsto [0,1]$ באופן הבא:

לכל קבוצת בורל $B\in {\mathcal {R}}^{n}$ מתקיים ${\textstyle \nu (B)=\Pr(X^{-1}(B))}$ (או באופן שקול, ${\textstyle \nu (B)=\Pr(X\in B)}$ .)

במקרה כזה, אם קיימת פונקציה לא שלילית $f_{X}:R^{n}\mapsto [0,\infty ]$ המקיימת $\nu (B)=\int _{B}f_{X}{\text{d}}\lambda _{n}=\int _{B}f_{X}{\text{d}}x$ , כאשר האינטגרל הוא אינטגרל לבג ^[2] ו- $\lambda _{n}$ היא מידת לבג, אז $f_{X}$ היא פונקציית צפיפות של הווקטור המקרי $\operatorname {X}$ . ^[3]

פונקציית ההתפלגות

ההתפלגויות של כל אחד מהמשתנים המקריים המרכיבים $X_{i}$ נקראות התפלגויות שוליות. ההתפלגות המותנית של $X_{i}$ בהינתן $X_{j}$ , היא ההתפלגות של $X_{i}$ כאשר ידוע ערכו של $X_{j}$ .

פונקציית ההתפלגות המצטברת $F_{\mathbf {X} }:\mathbb {R} ^{n}\mapsto [0,1]$ של וקטור מקרי $\mathbf {X} =(X_{1},\dots ,X_{n})^{\mathsf {T}}$ מוגדרת על ידי:^[4]

$F_{X}(\mathbf {x} )=\Pr(X_{1}\leq x_{1},...,X_{n}\leq x_{n})$ כאשר $\mathbf {x} =(x_{1},\dots ,x_{n})^{\mathsf {T}}$ .

פעולות על וקטורים מקריים

ניתן לבצע עם וקטורים מקריים את אותן פעולות אלגבריות כמו וקטורים לא מקריים: חיבור, חיסור, כפל בסקלר ומכפלות פנימיות.

העתקות אפיניות

באופן דומה, וקטור מקרי חדש $\mathbf {Y}$ ניתן להגדיר על ידי החלת העתקה אפינית $g\colon \mathbb {R} ^{n}\to \mathbb {R} ^{n}$ על וקטור אקראי $\mathbf {X}$ :

\mathbf {Y} =\mathbf {A} \mathbf {X} +b

, כאשר

\mathbf {A}

היא מטריצה

n\times n

ו-

b

הוא וקטור עמודה

n\times 1

.

אם $\mathbf {A}$ היא מטריצה הפיכה ו- $\textstyle \mathbf {X}$ משתנה מקרי עם פונקציית צפיפות $f_{\mathbf {X} }$ , אז פונקציית הצפיפות של $\mathbf {Y}$ היא

f_{\mathbf {Y} }(y)={\frac {f_{\mathbf {X} }(\mathbf {A} ^{-1}(y-b))}{|\det \mathbf {A} |}}

.

העתקות הפיכות

אם נתונה $g$ העתקה חד-חד ערכית מתת-קבוצה פתוחה ${\mathcal {D}}$ שֶׁל $\mathbb {R} ^{n}$ על תת-קבוצה ${\mathcal {R}}$ שֶׁל $\mathbb {R} ^{n}$ , ונניח שלהעתקה $g$ יש נגזרות חלקיות רציפות ב- ${\mathcal {D}}$ כמו כן, נניח שהיעקוביאן של $g$ לא מתאפס ב - ${\mathcal {D}}$ . בנוסף נניח כי לווקטור מקרי ממשי $\mathbf {X}$ יש פונקציית צפיפות $f_{\mathbf {X} }(\mathbf {x} )$ המקיימת $\Pr(\mathbf {X} \in {\mathcal {D}})=1$ . במקרה כזה, לווקטור המקרי $\mathbf {Y} =g(\mathbf {X} )$ יש פונקציית צפיפות

\left.f_{\mathbf {Y} }(\mathbf {y} )={\frac {f_{\mathbf {Z} }(\mathbf {z} )}{\left|\det {\frac {\partial \mathbf {z} }{\partial \mathbf {y} }}\right|}}\right|_{\mathbf {z} =g^{-1}(\mathbf {y} )}\mathbf {1} (\mathbf {y} \in R_{\mathbf {Y} })

כאשר $\mathbf {1}$ היא פונקציה מציינת ו- $R_{\mathbf {Y} }=\{\mathbf {y} =g(\mathbf {x} ):f_{\mathbf {X} }(\mathbf {x} )>0\}\subseteq {\mathcal {R}}$ הוא התומך של $\mathbf {Y}$ .^[5]

התוחלת

התוחלת של וקטור מקרי הוא וקטור $\operatorname {E} [\mathbf {X} ]$ שרכיביו הם התוחלות של המשתנים המקריים, רכיביו של $\mathbf {X}$ .^[6] $\operatorname {E} [\mathbf {X} ]={\begin{bmatrix}\operatorname {E} [X_{1}]\\\vdots \\\operatorname {E} [X_{n}]\end{bmatrix}}$

שונות ושונות משותפת

הגדרות

מטריצת השונות של הווקטור המקרי $\mathbf {X}$ , שנסמנה ב- $\operatorname {Var} (\mathbf {X} )$ (נקראת גם מומנט מרכזי שני) היא מטריצה $n\times n$ שרכיבה ה-(i,j) הוא $\operatorname {Cov} (X_{i},X_{j})$ שהיא השונות המשותפת בין המשתנים המקריים $X_{i}$ ו- $X_{j}$ (שימו לב $\operatorname {Cov} (X_{i},X_{i})=\operatorname {Var} (X_{i})$ .) ${\boldsymbol {\operatorname {Var} }}(\operatorname {X} )={\begin{bmatrix}{\operatorname {Var} \left(X_{1}\right)}&\operatorname {Cov} \left(X_{1},X_{2}\right)&\operatorname {Cov} \left(X_{1},X_{3}\right)&\cdots &\operatorname {Cov} \left(X_{1},X_{n)}\right)\\\operatorname {Cov} \left(X_{2},X_{1}\right)&\operatorname {Var} \left(X_{2}\right)&\operatorname {Cov} \left(X_{2},X_{3}\right)&\cdots &\operatorname {Cov} \left(X_{2},X_{n}\right)\\\operatorname {Cov} \left(X_{3},X_{1}\right)&\operatorname {Cov} \left(X_{3},X_{2}\right)&\operatorname {Var} \left(X_{3}\right)&\cdots &\operatorname {Cov} \left(X_{3},X_{n}\right)\\\vdots &\vdots &\vdots &\ddots &\vdots \\\operatorname {Cov} \left(X_{n},X_{1}\right)&\operatorname {Cov} \left(X_{n},X_{2}\right)&\operatorname {Cov} \left(X_{n},X_{3}\right)&\cdots &\operatorname {Var} \left(X_{n}\right)\\\end{bmatrix}}~.$

מטריצת השונות היא  $\operatorname {Var} (\mathbf {X} )=\operatorname {E} [[\mathbf {X} -\operatorname {E} [\mathbf {X} ]][\mathbf {X} -\operatorname {E} [\mathbf {X} ]]^{T}]$ . לאחר פיתוח של הביטוי ניתן לקבל שמתקיים,  $\operatorname {Var} (\mathbf {X} )=\operatorname {E} [\mathbf {X} \mathbf {X} ^{T}]-\operatorname {E} [\mathbf {X} ]\operatorname {E} [\mathbf {X} ]^{T}$ .

מטריצת השונות המשותפת בין שני וקטורים מקריים $\mathbf {X}$ ו- $\mathbf {Y}$ (ל- $\mathbf {X}$ שיש $n$ רכיבים ול- $\mathbf {Y}$ יש $p$ רכיבים) שנסמנה $\operatorname {Cov} (\mathbf {X} ,\mathbf {Y} )$ היא מטריצה $n\times p$ כאשר הרכיב ה- $(i,j)$ הוא $\operatorname {Cov} (X_{i},X_{j})$ , שהיא השונות המשותפת בין $X_{i}$ ל- $X_{j}$ :

${\boldsymbol {\operatorname {Cov} }}(\operatorname {X} ,\operatorname {Y} )={\begin{bmatrix}{\operatorname {Cov} \left(X_{1},Y_{1}\right)}&\operatorname {Cov} \left(X_{1},Y_{2}\right)&\operatorname {Cov} \left(X_{1},Y_{3}\right)&\cdots &\operatorname {Cov} \left(X_{1},Y_{p)}\right)\\\operatorname {Cov} \left(X_{2},Y_{1}\right)&\operatorname {Cov} \left(X_{2},Y_{2}\right)&\operatorname {Cov} \left(X_{2},Y_{3}\right)&\cdots &\operatorname {Cov} \left(X_{2},Y_{p}\right)\\\vdots &\vdots &\vdots &\ddots &\vdots \\\operatorname {Cov} \left(X_{n},X_{1}\right)&\operatorname {Cov} \left(X_{n},X_{2}\right)&\operatorname {Cov} \left(X_{n},X_{3}\right)&\cdots &\operatorname {Cov} \left(X_{n},Y_{p}\right)\\\end{bmatrix}}~.$

מתקיים: ${\textstyle \operatorname {Cov} (\mathbf {X} ,\mathbf {Y} )=\operatorname {E} [[\mathbf {X} -\operatorname {E} [\mathbf {X} ]][\mathbf {Y} -\operatorname {E} [\mathbf {Y} ]]^{T}]=\operatorname {E} [\mathbf {X} \mathbf {Y} ^{T}]-\operatorname {E} [\mathbf {X} ]\operatorname {E} [\mathbf {Y} ]^{T}}$ .

תכונות

מטריצת השונות היא מטריצה סימטרית, ${\textstyle \operatorname {Var} (\mathbf {X} )^{T}=\operatorname {Var} (\mathbf {X} )}$ .
מטריצת השונות היא מטריצה חיובית למחצה, כלומר, לכל $\mathbf {a} \in \mathbb {R} ^{n}$ מתקיים, ${\textstyle \mathbf {a} ^{T}\operatorname {Var} (\mathbf {X} )\mathbf {a} \geq 0}$ .
מטריצת השונות המשותפת $\operatorname {Cov} (\mathbf {Y} ,\mathbf {X} )$ היא המטריצה המשוחלפת של המטריצה $\operatorname {Cov} (\mathbf {X} ,\mathbf {Y} )$ , כלומר, ${\textstyle \operatorname {Cov} (\mathbf {Y} ,\mathbf {X} )=\operatorname {Cov} (\mathbf {X} ,\mathbf {Y} )^{T}}$ .

וקטורים מקריים לא מתואמים

שני וקטורים מקריים $\mathbf {X} =(X_{1},...,X_{m})^{T}$ ו - $\mathbf {Y} =(Y_{1},...,Y_{n})^{T}$ נקראים לא מתואמים אם ${\textstyle \operatorname {E} [\mathbf {X} \mathbf {Y} ^{T}]=\operatorname {E} [\mathbf {X} ]\operatorname {E} [\mathbf {Y} ]^{T}}$ .

הם אינם מתואמים אם ורק אם מטריצת השונות המשותפת שלהם $\operatorname {Cov} (\mathbf {X} ,\mathbf {Y} )$ היא מטריצת האפס.

אורתוגונליות

שני וקטורים מקריים $\mathbf {X} =(X_{1},...,X_{n})^{T}$ ו- $\mathbf {Y} =(Y_{1},...,Y_{n})^{T}$ נקראים אורתוגונליים אם, ${\textstyle \operatorname {E} [\mathbf {X} ^{T}\mathbf {Y} ]=0}$ .

אי-תלות

שני וקטורים אקראיים $\mathbf {X}$ ו- $\mathbf {Y}$ נקראים בלתי-תלויים אם לכל $\mathbf {x}$ ו- $\mathbf {y}$ מתקיים, ${\textstyle F_{\mathbf {X,Y} }(\mathbf {x,y} )=F_{\mathbf {X} }(\mathbf {x} )\cdot F_{\mathbf {Y} }(\mathbf {y} )}$ , כאשר $F_{\mathbf {X} }(\mathbf {x} )$ ו- $F_{\mathbf {Y} }(\mathbf {y} )$ הן פונקציות ההתפלגות המצטברות של $\mathbf {X}$ ו- $\mathbf {Y}$ ו- $F_{\mathbf {X,Y} }(\mathbf {x,y} )$ מציין את פונקציית ההתפלגות המצטברת המשותפת שלהם. אי-תלות של $\mathbf {X}$ ו- $\mathbf {Y}$ ניתנת לסימון על ידי $\mathbf {X} \perp \!\!\!\perp \mathbf {Y}$ .

פונקציה אופיינית

הפונקציה האופיינית של וקטור מקרי $\mathbf {X}$ עם $n$ רכיבים היא פונקציה $\mathbb {R} ^{n}\to \mathbb {C}$ שממפה כל וקטור $\mathbf {\omega } =(\omega _{1},\ldots ,\omega _{n})^{T}$ למספר מרוכב^[7]:

\varphi _{\mathbf {X} }(\mathbf {\omega } )=\operatorname {E} \left[e^{i(\mathbf {\omega } ^{T}\mathbf {X} )}\right]=\operatorname {E} \left[e^{i(\omega _{1}X_{1}+\ldots +\omega _{n}X_{n})}\right]

.

יישומים

התאוריה של תיקי השקעות

בתאוריה של תיקי השקעות, המטרה היא לרוב לבחור בתיק עם מגוון נכסים כך שלתשואה של התיק יש את מאפיינים הרצויים. לדוגמה, ייתכן שתרצה לבחור בתיק עם תשואה בעלת השונות הנמוכה ביותר. כאן הווקטור המקרי הוא הווקטור $\mathbf {r}$ של התשואות על רשימה של נכסים, ותשואת התיק p (סקלר מקרי) היא המכפלה הפנימית של וקטור התשואות עם וקטור משקלים w- לפי החלוקת העלות של של הנכסים השונים. במקרה כזה, $p=w^{T}\mathbf {r}$ , היא תשואת התיק. תוחלת התשואה היא $w^{T}\operatorname {E} (\mathbf {r} )$ וניתן להראות שהשונות של תשואת התיק היא $w^{T}Cw$ , כאשר $C$ היא מטריצת השונות של $\mathbf {r}$ .

רגרסיה ליניארית

ברגרסיה הליניארית, יש לנו נתונים על n תצפיות על משתנה תלוי y ו-n תצפיות על כל אחד מ-k משתנים בלתי תלויים. התצפיות על המשתנה התלוי הן הרכיבים של ווקטור y ; התצפיות על כל משתנה בלתי תלוי מהוות את הרכיבים של וקטורי עמודות, שמהווים את העמודות למטריצה X (לא מציינת וקטור מקרי בהקשר זה) של התצפיות על המשתנים הבלתי תלויים. משוואת הרגרסיה הבאה היא מודל עבור התהליך שייצר את הנתונים:

,y=X\beta +e

כאשר β הוא וקטור קבוע אך לא ידוע של $k$ מקדמים, ו- $e$ הוא וקטור מקרי לא ידוע המשקף טעויות אקראיות בערכי המשתנה התלוי. ישנן מגוון של שיטות (למשל: שיטת הריבועים הפחותים) לאמוד את הווקטור β באמצעות וקטור ${\hat {\beta }}$ , ואת הווקטור $e$ באמצעות ${\hat {e}}$ , המקיימים ${\textstyle .{\hat {e}}=y-X{\hat {\beta }}}$ לאחר מכן סטטיסטיקאים מנתחים את המאפיינים של ${\hat {\beta }}$ ו- ${\hat {e}}$ , שהם ווקטורים מקריים שכן הם פונקציה של התצפיות שמהוות את הווקטור y.

סדרות עתיות וקטוריות

את ההשתנות של וקטור מקרי $\mathbf {X}$ לאורך זמן ניתן לעיתים לתאר באמצעות מודל של אוטורגרסיה וקטורית באופן הבא:

\mathbf {X} _{t}=c+A_{1}\mathbf {X} _{t-1}+A_{2}\mathbf {X} _{t-2}+\cdots +A_{p}\mathbf {X} _{t-p}+\mathbf {e} _{t},\,

$\mathbf {X} _{t-i}$ הוא וקטור מקרי המבטא תצפית שקרתה $i$ יחידות זמן לפני זמן $t$ , $c$ הוא וקטור של קבועים, A _i היא מטריצה קבועה בזמן ו- $\mathbf {e} _{t}$ הוא וקטור מקרי של שגיאות.

קישורים חיצוניים

וקטור מקרי, באתר MathWorld (באנגלית)

הערות שוליים

^ Billingsley, P. (2017). "Probability and measure". p.183, John Wiley & Sons.
^ Billingsley, P. (2017). "Probability and measure". p.213, John Wiley & Sons.
^ Billingsley, P. (2017). "Probability and measure". p.225, John Wiley & Sons.
^ Gallager, Robert G. (2013). Stochastic Processes Theory for Applications. p.15, Cambridge University Press. ISBN 978-1-107-03975-9.
^ Lapidoth, Amos (2009). A Foundation in Digital Communication. Cambridge University Press. p. 290-291 ISBN 978-0-521-19395-5.
^ Gubner, John A. (2006). Probability and Random Processes for Electrical and Computer Engineers. Cambridge University Press. p.333 ISBN 978-0-521-86470-1.
^ Lapidoth, Amos (2009). A Foundation in Digital Communication. Cambridge University Press. p.468. ISBN 978-0-521-19395-5.

[1] Billingsley, P. (2017). "Probability and measure". p.183, John Wiley & Sons.

[2] Billingsley, P. (2017). "Probability and measure". p.213, John Wiley & Sons.

[3] Billingsley, P. (2017). "Probability and measure". p.225, John Wiley & Sons.

[4] Gallager, Robert G. (2013). Stochastic Processes Theory for Applications. p.15, Cambridge University Press. ISBN 978-1-107-03975-9.

[5] Lapidoth, Amos (2009). A Foundation in Digital Communication. Cambridge University Press. p. 290-291 ISBN 978-0-521-19395-5.

[6] Gubner, John A. (2006). Probability and Random Processes for Electrical and Computer Engineers. Cambridge University Press. p.333 ISBN 978-0-521-86470-1.

[7] Lapidoth, Amos (2009). A Foundation in Digital Communication. Cambridge University Press. p.468. ISBN 978-0-521-19395-5.

[1]

[2]

[3]

[4]

[5]

[6]

[7]