בהינתן שני משתנים מקריים המוגדרים על אותו מרחב הסתברות ,[ 1] ההתפלגות המשותפת היא האופן שבו ההסתברות מתפלגת על זוגות ערכים אפשריים של שני המשתנים. באופן דומה ניתן להגדיר התפלגות משותפת לכל מספר נתון של משתנים מקריים. מתוך ההתפלגות המשותפת יניתן לקבל את ההתפלגויות השוליות, שהן ההתפלגויות של כל אחד מהמשתנים המקריים. ניתן גם לקבל את ההתפלגויות המותנות , שהן ההתפלגויות של משתנה מקרי אחד כאשר הערכים של המשתנים המקריים האחרים נתונים.
באיור מוצגות תצפיות רבות (בשחור) הלקוחות מהתפלגות משותפת (התפלגות רב-נורמלית). ניתן לראות גם את פונקציות הצפיפות השוליות (בכחול ובאדום).
באופן פורמלי בתורת המידה , ההתפלגות המשותפת ניתנת על ידי מידה , פונקציה לא שלילית המוגדרת על מרחב המדגם .
במקרה של משתנים מקריים המקבלים ערכים ממשיים, ניתן לתאר את ההתפלגות משותפת, באמצעות פונקציית ההתפלגות המצטברת הרב-משתנית, או על-ידי פונקציית צפיפות רב-משתנית במקרה של משתנים רציפים ופונקציית הסתברות רב-משתנית במקרה של משתנים בדידים.
פונקציית התפלגות מצטברת משותפת
עריכה
עבור זוג משתנים מקריים
X
,
Y
{\displaystyle X,Y}
, פונקציית ההתפלגות המצטברת המשותפת (CDF)
F
X
Y
{\displaystyle F_{XY}}
ניתנת על ידי,[ 2]
F
X
Y
(
x
,
y
)
=
Pr
(
X
≤
x
,
Y
≤
y
)
{\displaystyle F_{XY}(x,y)=\Pr(X\leq x,Y\leq y)}
כאשר הצד הימני מייצג את ההסתברות שהמשתנה המקרי
X
{\displaystyle X}
מקבל ערך קטן או שווה ל-
x
{\displaystyle x}
וגם
Y
{\displaystyle Y}
מקבל ערך קטן או שווה ל-
y
{\displaystyle y}
.
בהינתן
n
{\displaystyle n}
משתנים מקריים
X
1
,
…
,
X
n
{\displaystyle X_{1},\ldots ,X_{n}}
, פונקציית ההתפלגות המצטברת המשותפת
F
X
1
,
…
,
X
n
{\displaystyle F_{X_{1},\ldots ,X_{n}}}
ניתנת ע"י,
F
X
1
,
…
,
X
n
(
x
1
,
…
,
x
n
)
=
Pr
(
X
1
≤
x
1
,
…
,
X
n
≤
x
n
)
{\displaystyle F_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})=\Pr(X_{1}\leq x_{1},\ldots ,X_{n}\leq x_{n})}
ניתן להתייחס ל-
n
{\displaystyle n}
משתנים מקריים כוקטור מקרי
X
=
(
X
1
,
…
,
X
n
)
T
{\displaystyle \mathbf {X} =(X_{1},\ldots ,X_{n})^{T}}
. במקרה כזה נהוג להשתמש בסימון,
F
X
(
x
)
=
Pr
(
X
1
≤
x
1
,
…
,
X
n
≤
x
n
)
T
{\displaystyle F_{\mathbf {X} }(\mathbf {x} )=\Pr(X_{1}\leq x_{1},\ldots ,X_{n}\leq x_{n})^{T}}
כאשר
x
=
(
x
1
,
…
,
x
n
)
T
{\displaystyle \mathbf {x} =(x_{1},\ldots ,x_{n})^{T}}
הוא וקטור.
פונקציית הסתברות משותפת
עריכה
במקרה של משתנים מקריים בדידים משתמשים בפונקציית ההסתברות המשותפת של שני משתנים מקריים
X
,
Y
{\displaystyle X,Y}
,
p
X
,
Y
(
x
,
y
)
=
Pr
(
X
=
x
,
Y
=
y
)
{\displaystyle p_{X,Y}(x,y)=\Pr(X=x,Y=y)}
אם
Ω
{\displaystyle \Omega }
הוא מרחב המדגם,
X
(
Ω
)
{\displaystyle X(\Omega )}
ו-
Y
(
Ω
)
{\displaystyle Y(\Omega )}
הם קבוצות הערכים ש-
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
יכולים לקבל, אז במקרה של שני משתנים מתקיים,
∑
x
∈
X
(
Ω
)
∑
y
∈
Y
(
Ω
)
p
X
Y
(
x
,
y
)
=
1
{\displaystyle \sum _{x\in X(\Omega )}\sum _{y\in Y(\Omega )}p_{XY}(x,y)=1}
באמצעות פונקציית ההסתברות ניתן לחשב הסתברות של כל מאורע המוגדר באמצעות
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
,
A
⊆
Ω
(
X
)
×
Ω
(
Y
)
{\displaystyle A\subseteq \Omega (X)\times \Omega (Y)}
,
Pr
(
(
X
,
Y
)
∈
A
)
=
∑
(
x
,
y
)
∈
A
p
X
Y
(
x
,
y
)
{\displaystyle \Pr \left((X,Y)\in A\right)=\sum _{(x,y)\in A}p_{XY}(x,y)}
באופן דומה, עבור
n
{\displaystyle n\,}
משתנים אקראיים
X
1
,
X
2
,
…
,
X
n
{\displaystyle X_{1},X_{2},\dots ,X_{n}}
קיימת פונקציית הסתברות משותפת,
p
X
1
…
X
n
(
x
1
,
…
,
x
n
)
=
Pr
(
X
1
=
x
1
,
…
,
X
n
=
x
n
)
{\displaystyle p_{X_{1}\ldots X_{n}}(x_{1},\ldots ,x_{n})=\Pr(X_{1}=x_{1},\ldots ,X_{n}=x_{n})}
עבורה מתקיים,
∑
x
1
∈
X
1
(
Ω
)
⋯
∑
x
n
∈
X
n
(
Ω
)
p
X
1
…
X
n
(
x
1
,
…
,
x
n
)
=
1
{\displaystyle \sum _{x_{1}\in X_{1}(\Omega )}\cdots \sum _{x_{n}\in X_{n}(\Omega )}p_{X_{1}\ldots X_{n}}(x_{1},\ldots ,x_{n})=1}
ועבור
A
⊆
Ω
(
X
1
)
×
⋯
×
Ω
(
X
n
)
{\displaystyle A\subseteq \Omega (X_{1})\times \cdots \times \Omega (X_{n})}
מתקיים,
Pr
(
(
X
1
,
…
,
X
n
)
∈
A
)
=
∑
(
x
1
,
…
x
n
)
∈
A
p
X
1
…
X
n
(
x
1
,
…
,
x
n
)
{\displaystyle \Pr \left((X_{1},\ldots ,X_{n})\in A\right)=\sum _{(x_{1},\ldots x_{n})\in A}p_{X_{1}\ldots X_{n}}(x_{1},\ldots ,x_{n})}
דוגמה
נתון כד עם ארבעה כדורים, שניים כחולים, אחד אדום ואחד לבן. מוציאים מהכד שני כדורים ללא החזרה. נגדיר משתנה מקרי
X
{\displaystyle X}
כמספר הכדורים האדומים שהוצאו, ומשתנה מקרי
Y
{\displaystyle Y}
כמספר הכדורים הכחולים שהוצאו. הטבלה להלן מתארת את פונקציית ההסתברות המשותפת של
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
. למשל
p
X
Y
(
0
,
2
)
=
1
6
{\displaystyle p_{XY}(0,2)={\frac {1}{6}}}
.
Y
=
0
{\displaystyle Y=0}
Y
=
1
{\displaystyle Y=1}
Y
=
2
{\displaystyle Y=2}
X
=
0
{\displaystyle X=0}
0
{\displaystyle 0}
1
3
{\displaystyle {\frac {1}{3}}}
1
6
{\displaystyle {\frac {1}{6}}}
X
=
1
{\displaystyle X=1}
1
6
{\displaystyle {\frac {1}{6}}}
1
3
{\displaystyle {\frac {1}{3}}}
0
{\displaystyle 0}
באמצעות פונקציית ההסתברות המשותפת ניתן לחשב מאורעות המוגדרים באמצעות
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
. למשל,
Pr
(
X
+
Y
=
2
)
=
p
X
Y
(
0
,
2
)
+
p
X
Y
(
1
,
1
)
=
1
6
+
1
3
=
1
2
{\displaystyle \Pr(X+Y=2)=p_{XY}(0,2)+p_{XY}(1,1)={\frac {1}{6}}+{\frac {1}{3}}={\frac {1}{2}}}
.
כהדגמה של חישוב פונקציית התפלגות מצטברת משותפת נחשב,
F
X
Y
(
1.5
,
1.5
)
=
Pr
(
X
≤
1.5
,
Y
≤
1.5
)
=
p
X
Y
(
1
,
1
)
+
p
X
Y
(
0
,
1
)
+
p
X
Y
(
1
,
0
)
=
1
3
+
1
3
+
1
6
=
5
6
{\displaystyle F_{XY}(1.5,1.5)=\Pr(X\leq 1.5,Y\leq 1.5)=p_{XY}(1,1)+p_{XY}(0,1)+p_{XY}(1,0)={\frac {1}{3}}+{\frac {1}{3}}+{\frac {1}{6}}={\frac {5}{6}}}
.
פונקציית צפיפות משותפת
עריכה
במקרה שהמשתנים המקריים רציפים משתמשים עבור שני משתנים מקריים בפונקציית צפיפות משותפת
f
X
,
Y
(
x
,
y
)
{\displaystyle f_{X,Y}(x,y)}
. בתנאים מסוימים ניתן לקבלה על ידי הביטויים,
f
X
,
Y
(
x
,
y
)
=
Pr
(
x
−
h
2
≤
X
≤
x
+
h
2
,
y
−
h
2
≤
Y
≤
y
+
h
2
)
h
2
{\displaystyle f_{X,Y}(x,y)={\frac {\Pr \left(x-{\frac {h}{2}}\leq X\leq x+{\frac {h}{2}},y-{\frac {h}{2}}\leq Y\leq y+{\frac {h}{2}}\right)}{h^{2}}}}
או באמצעות נגזרות חלקיות של פונקציית ההתפלגות המצטברת המשותפת,
f
X
,
Y
(
x
,
y
)
=
∂
2
F
X
,
Y
(
x
,
y
)
∂
x
∂
y
{\displaystyle f_{X,Y}(x,y)={\frac {\partial ^{2}F_{X,Y}(x,y)}{\partial x\partial y}}}
מתקיימים ביטויים דומים עבור יותר משני משתנים מקריים,
f
X
1
,
…
,
X
n
(
x
1
,
…
,
x
n
)
=
Pr
(
x
1
−
h
2
≤
X
1
≤
x
1
+
h
2
,
…
,
x
n
−
h
2
≤
X
n
≤
x
n
+
h
2
)
h
n
{\displaystyle f_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})={\frac {\Pr \left(x_{1}-{\frac {h}{2}}\leq X_{1}\leq x_{1}+{\frac {h}{2}},\ldots ,x_{n}-{\frac {h}{2}}\leq X_{n}\leq x_{n}+{\frac {h}{2}}\right)}{h^{n}}}}
באמצעות נגזרות חלקיות מתוך ההתפלגות המצטברת המשותפת,
f
X
1
,
…
,
X
n
(
x
1
,
…
,
x
n
)
=
∂
n
F
X
1
,
…
,
X
n
(
x
1
,
…
,
x
n
)
∂
x
1
…
∂
x
n
{\displaystyle f_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})={\frac {\partial ^{n}F_{X_{1},\ldots ,X_{n}}(x_{1},\ldots ,x_{n})}{\partial x_{1}\ldots \partial x_{n}}}}
מכיוון שמדובר בהתפלגויות, עבור שני משתנים מתקיים,
∫
x
∫
y
f
X
,
Y
(
x
,
y
)
d
y
d
x
=
1
{\displaystyle \int _{x}\int _{y}f_{X,Y}(x,y)\;dy\;dx=1}
ליותר משני משתנים,
∫
x
1
…
∫
x
n
f
X
1
…
X
n
(
x
1
,
…
,
x
n
)
d
x
n
⋯
d
x
1
=
1
{\displaystyle \int _{x_{1}}\ldots \int _{x_{n}}f_{X_{1}\ldots X_{n}}(x_{1},\ldots ,x_{n})\;dx_{n}\cdots \;dx_{1}=1}
לכל תחום (המקיים תנאים מסוימים)
A
⊆
R
2
{\displaystyle A\subseteq \mathbb {R} ^{2}}
מתקיים
Pr
(
(
X
,
Y
)
∈
A
)
=
∬
A
f
X
Y
(
x
,
y
)
d
y
d
x
{\displaystyle \Pr \left((X,Y)\in A\right)=\iint _{A}f_{XY}(x,y)dydx}
באופן דומה נחשב עבור
A
⊆
R
n
{\displaystyle A\subseteq \mathbb {R} ^{n}}
Pr
(
(
X
1
,
…
,
X
n
)
∈
A
)
=
∫
⋯
∫
A
f
X
1
⋯
X
n
(
x
1
,
…
,
x
n
)
d
x
n
⋯
d
x
1
{\displaystyle \Pr \left((X_{1},\ldots ,X_{n})\in A\right)=\int \cdots \int _{A}f_{X_{1}\cdots X_{n}}(x_{1},\ldots ,x_{n})dx_{n}\cdots dx_{1}}
דוגמה
נתונים משתנים מקריים רציפים
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
עם פונקציית צפיפות משותפת:
f
X
Y
(
x
,
y
)
=
{
6
5
(
x
2
+
x
y
)
0
≤
x
,
y
≤
1
0
תרחא
{\displaystyle f_{XY}(x,y)=\left\{{\begin{matrix}{\frac {6}{5}}(x^{2}+xy)&0\leq x,y\leq 1\\0&{\text{תרחא}}\\\end{matrix}}\right.}
נדגים את חישוב ההסתברות ש-
X
+
Y
≤
1
{\displaystyle X+Y\leq 1}
,
Pr
(
X
+
Y
≤
1
)
=
∫
0
1
∫
0
1
−
x
6
5
(
x
2
+
2
x
y
)
d
y
d
x
=
∫
0
1
6
5
x
(
1
−
x
)
d
x
=
1
5
{\displaystyle \Pr(X+Y\leq 1)=\int _{0}^{1}\int _{0}^{1-x}{\frac {6}{5}}(x^{2}+2xy)dydx=\int _{0}^{1}{\frac {6}{5}}x(1-x)dx={\frac {1}{5}}}
הדגמה של חישוב פונקציית התפלגות מצטברת,
F
X
Y
(
1
3
,
1
2
)
=
Pr
(
X
≤
1
3
,
Y
≤
1
2
)
=
∫
0
1
3
∫
0
1
2
6
5
(
x
2
+
2
x
y
)
d
y
d
x
=
∫
0
1
3
3
5
(
x
2
+
1
2
x
)
d
x
=
13
540
{\displaystyle F_{XY}\left({\frac {1}{3}},{\frac {1}{2}}\right)=\Pr \left(X\leq {\frac {1}{3}},Y\leq {\frac {1}{2}}\right)=\int _{0}^{\frac {1}{3}}\int _{0}^{\frac {1}{2}}{\frac {6}{5}}(x^{2}+2xy)dydx=\int _{0}^{\frac {1}{3}}{\frac {3}{5}}\left(x^{2}+{\frac {1}{2}}x\right)dx={\frac {13}{540}}}
התפלגות משותפת של משתנים בלתי תלויים
עריכה
באופן כללי שני משתנים מקריים
X
{\displaystyle X}
ו
Y
{\displaystyle Y}
הם בלתי תלויים אם ורק אם פונקציית ההתפלגות המצטברת המשותפת מתקיימת
F
X
,
Y
(
x
,
y
)
=
F
X
(
x
)
⋅
F
Y
(
y
)
{\displaystyle F_{X,Y}(x,y)=F_{X}(x)\cdot F_{Y}(y)}
שני משתנים מקריים בדידים
X
{\displaystyle X}
ו
Y
{\displaystyle Y}
הם בלתי תלויים אם ורק אם פונקציית ההסתברות המשותפת מקיימת
P
(
X
=
x
,
Y
=
y
)
=
P
(
X
=
x
)
⋅
P
(
Y
=
y
)
{\displaystyle P(X=x,Y=y)=P(X=x)\cdot P(Y=y)}
לכל
x
{\displaystyle x}
ו
y
{\displaystyle y}
.
באופן דומה, שני משתנים מקריים רציפים הם בלתי תלויים אם ורק אם
f
X
,
Y
(
x
,
y
)
=
f
X
(
x
)
⋅
f
Y
(
y
)
{\displaystyle f_{X,Y}(x,y)=f_{X}(x)\cdot f_{Y}(y)}
לכל
x
{\displaystyle x}
ו
y
{\displaystyle y}
.
כאשר שני משתנים מקריים מוגדרים על מרחב הסתברות, ומעוניינים למדוד את הקשר בין המשתנים. מדד מקובל לקשר בין שני משתנים מקריים הוא השונות המשותפת.
השונות המשותפת בין המשתנים המקריים
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
, המסומנת כ-
C
o
v
(
X
,
Y
)
{\displaystyle Cov(X,Y)}
היא,[ 3]
C
o
v
(
X
,
Y
)
=
E
[
(
X
−
E
[
x
]
)
(
Y
−
E
[
y
]
)
]
=
E
[
X
,
Y
]
−
E
[
x
]
E
[
y
]
{\displaystyle Cov(X,Y)=E[(X-E[x])(Y-E[y])]=E[X,Y]-E[x]E[y]}
המתאם הוא מדד נוסף לקשר בין שני משתנים מקריים. מדד זה קל יותר לפרשנות מאשר השונות המשותפת.
המתאם מתקבל מהנירמול של השונות המשותפת באמצעות חילוק בסטיות התקן (השורש של השונות ) של כל משתנה. כתוצאה מכך, המתאם הוא חסר מימד וניתן להשתמש בו כדי להשוות את הקשר הליניארי בין זוגות של משתנים המבוטאים ביחידות שונות. אם הנקודות בהתפלגות המשותפת של
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
מקבלות הסתברות חיובית נמצאות בקרבתו קו עם שיפוע חיובי (או שלילי),
ρ
X
Y
{\displaystyle \rho _{XY}}
קרוב ל-
1
{\displaystyle 1}
(או
−
1
{\displaystyle -1}
). אם
ρ
X
Y
{\displaystyle \rho _{XY}}
שווה ל-
1
{\displaystyle 1}
או
−
1
{\displaystyle -1}
, ניתן להראות שהנקודות בהתפלגות המשותפת שמקבלות הסתברות חיובית נמצאות על ישר. שני משתנים מקריים עם מתאם שאינו אפס אמורים נקראים מתואמים. בדומה לשונות משותפת, המתאם הוא מדד לקשר הליניארי בין משתנים מקריים.
המתאם בין המשתנה המקרי
X
{\displaystyle X}
ו-
Y
{\displaystyle Y}
ניתן על ידי
ρ
X
Y
=
c
o
v
(
X
,
Y
)
V
a
r
(
X
)
V
a
r
(
Y
)
=
c
o
v
(
X
,
Y
)
σ
X
σ
Y
{\displaystyle \rho _{XY}={\frac {cov(X,Y)}{\sqrt {Var(X)Var(Y)}}}={\frac {cov(X,Y)}{\sigma _{X}\sigma _{Y}}}}
משפחות מוכרות של התפלגויות
עריכה
^ Feller, William (1957). An introduction to probability theory and its applications, vol 1, 3rd edition (באנגלית). pp. 217–218. ISBN 978-0471257080 .
^ Park,Kun Il (2018). Fundamentals of Probability and Stochastic Processes with Applications to Communications . Springer. ISBN 978-3-319-68074-3 .
^ Montgomery, Douglas C. (19 בנובמבר 2013 ). Applied statistics and probability for engineers . Runger, George C. (Sixth ed.). Hoboken, NJ. ISBN 978-1-118-53971-2 . OCLC 861273897 .