משפט פון נוימן-מורגנשטרן בתורת ההחלטות הוא משפט האפיון של פונקציית התועלת , והוא קובע שאם לשחקן יחס ההעדפות שלם וטרנזיטיבי , ואם יחס ההעדפות מקיים ארבע אקסיומות מסוימות, אז ניתן לתאר את יחס ההעדפות של השחקן באמצעות פונקציית תועלת ליניארית . פונקציה פשוטה כזו נוחה מאוד בניתוח משחקים בעלי תוצאות לא ודאיות, מכיוון שהתועלת של כל הגרלה L תהיה שווה לתוחלת התועלת של התוצאות לפי L.
תחילה אנו מניחים שמקבל ההחלטות עומד בפני מצב עם מספר סופי של תוצאות אפשריות:
O
=
{
A
1
,
⋯
,
A
K
}
{\displaystyle O=\{A_{1},\cdots ,A_{K}\}}
.
כדי לנתח סיטואציות שבהן תוצאת המשחק אינה ודאית, כלומר היא הגרלה על קבוצת התוצאות, יש להרחיב את יחס ההעדפות של השחקן להתפלגויות על O. הגרלה
L
{\displaystyle \,L}
שבה כל תוצאה אפשרית
A
k
{\displaystyle \,A_{k}}
יכולה להתקבל בהסתברות
p
k
{\displaystyle \,p_{k}}
תסומן על ידי
L
=
[
p
1
(
A
1
)
,
…
,
p
K
(
A
K
)
]
{\displaystyle L=[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]}
, וקבוצת ההגרלות על
O
{\displaystyle \,O}
:
L
(
O
)
=
{
[
p
1
(
A
1
)
,
…
,
p
K
(
A
K
)
]
:
p
→
∈
Δ
K
}
{\displaystyle {\mathcal {L}}(O)=\{[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]:{\vec {p}}\in \Delta ^{K}\}}
כאשר השתמשנו בסימון של הסימפלקס ה-K ממדי:
Δ
K
=
{
p
→
∈
[
0
,
1
]
K
:
∑
k
=
1
K
p
k
=
1
}
{\displaystyle \Delta ^{K}=\{{\vec {p}}\in [0,1]^{K}:\sum \nolimits _{k=1}^{K}{p_{k}}=1\}}
.
מתברר שכדי להוכיח את המשפט עלינו להרחיב את יחס ההעדפות של השחקן להגרלות על הגרלות. הגרלה מורכבת
L
^
{\displaystyle {\hat {L}}}
שבה כל הגרלה
L
j
{\displaystyle \,L_{j}}
יכולה להתקבל בהסתברות
q
j
{\displaystyle \,q_{j}}
תסומן על ידי
L
^
=
[
q
1
(
L
1
)
,
…
,
q
J
(
L
J
)
]
{\displaystyle {\hat {L}}=[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]}
, וקבוצת ההגרלות המורכבות על
O
{\displaystyle \,O}
:
L
^
(
O
)
=
{
[
q
1
(
L
1
)
,
…
,
q
J
(
L
J
)
]
:
J
∈
N
,
L
j
∈
L
(
O
)
,
q
→
∈
Δ
J
}
{\displaystyle {\hat {\mathcal {L}}}(O)=\{[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]:J\in \mathbb {N} ,\ L_{j}\in {\mathcal {L}}(O),\ {\vec {q}}\in \Delta ^{J}\}}
יחס ההעדפות ופונקציית התועלת
עריכה
כעת נגדיר את העדפותיו של השחקן. יחס העדפות
≿
i
{\displaystyle \succsim _{i}}
הוא יחס בינארי על
L
^
(
O
)
{\displaystyle {\hat {\mathcal {L}}}(O)}
המייצג את העדפותיו של השחקן
i
{\displaystyle \,i}
. תהיינה
L
^
1
,
L
^
2
{\displaystyle {\hat {L}}_{1},{\hat {L}}_{2}}
שתי הגרלות מורכבות. במידה והשחקן
i
{\displaystyle \,i}
מעדיף את הגרלה
L
^
1
{\displaystyle {\hat {L}}_{1}}
על פני הגרלה
L
^
2
{\displaystyle {\hat {L}}_{2}}
, נסמן
L
^
1
≿
i
L
^
2
{\displaystyle {\hat {L}}_{1}\succsim _{i}{\hat {L}}_{2}}
. אם השחקן אדיש בין שתי ההגרלות, נסמן
L
^
1
≈
i
L
^
2
{\displaystyle {\hat {L}}_{1}\approx _{i}{\hat {L}}_{2}}
.
ברור שכדי לנתח משחק בצורה מתמטית עלינו לדרוש שיחס ההעדפות יהיה שלם, כלומר שהשחקן יכול להשוות בין כל שתי הגרלות מורכבות, ובנוסף יחס ההעדפות צריך להיות טרנזיטיבי , שהרי אם יחס ההעדפות אינו טרנזיטיבי אנו עלולים לקבל מצבים שיש בהם סתירה לוגית כמו למשל: "השחקן מעדיף במבה על פני בייגלה, ומעדיף בייגלה על פני ביסלי, אך הוא מעדיף ביסלי על פני במבה". יהי אם כן
≿
i
{\displaystyle \succsim _{i}}
יחס העדפות שלם וטרנזיטיבי על
L
^
(
O
)
{\displaystyle {\hat {\mathcal {L}}}(O)}
, המייצג את העדפותיו של השחקן
i
{\displaystyle \,i}
.
נפנה להגדרת פונקציית התועלת. העתקה
u
:
L
^
(
O
)
→
R
{\displaystyle u:{\hat {\mathcal {L}}}(O)\rightarrow \mathbb {R} }
נקראת פונקציית תועלת המייצגת את יחס ההעדפות
≿
i
{\displaystyle \succsim _{i}}
אם לכל הגרלה מורכבת
L
^
1
,
L
^
2
∈
L
^
(
O
)
{\displaystyle {\hat {L}}_{1},{\hat {L}}_{2}\in {\hat {\mathcal {L}}}(O)}
מתקיים:
L
^
1
≿
i
L
^
2
⟺
u
(
L
^
1
)
≥
u
(
L
^
2
)
{\displaystyle {\hat {L}}_{1}\succsim _{i}{\hat {L}}_{2}\quad \iff \quad u({\hat {L}}_{1})\geq u({\hat {L}}_{2})}
יש לשים לב שלפי הגדרה זו ניתן לייצג יחס העדפות על ידי פונקציות שונות ורבות. למעשה, u היא פונקציית תועלת אורדינלית , כלומר מייצגת רק את סדר ההעדפות על התוצאות ואין בה שום חשיבות למידת ההעדפה של תוצאה כזו או אחרת. פונקציית תועלת
u
:
L
^
(
O
)
→
R
{\displaystyle u:{\hat {\mathcal {L}}}(O)\rightarrow \mathbb {R} }
נקראת ליניארית אם לכל הגרלה
L
^
=
[
q
1
(
L
1
)
,
q
2
(
L
2
)
,
…
,
q
J
(
L
J
)
]
{\displaystyle {\hat {L}}=[q_{1}(L_{1}),q_{2}(L_{2}),\ldots ,q_{J}(L_{J})]}
מתקיים:
u
(
L
^
)
=
q
1
u
(
L
1
)
+
q
2
u
(
L
2
)
+
…
+
q
J
u
(
L
J
)
{\displaystyle u({\hat {L}})=q_{1}u(L_{1})+q_{2}u(L_{2})+\ldots +q_{J}u(L_{J})}
כלומר ה"ליניאריות" היא בהסתברויות על ההגרלות הפשוטות.
ארבע האקסיומות של פון נוימן ומורגנשטרן
עריכה
הנחות יסוד:
קיימת קבוצה סופית של פרסים
A
=
{
A
1
,
⋯
,
A
n
}
{\displaystyle A=\{A_{1},\cdots ,A_{n}\}}
בה יכול השחקן לזכות.
לשחקן יש יחס ההעדפות על הגרלות מורכבות.
הגרלה
L
{\displaystyle L}
, הגרלה בה נקבל תוצאה
A
i
{\displaystyle A_{i}}
בהסתברות
p
i
{\displaystyle p_{i}}
. נסמן:
L
=
[
p
1
(
A
1
)
,
p
2
(
A
2
)
,
⋯
,
p
n
(
A
n
)
]
{\displaystyle L=[p_{1}(A_{1}),p_{2}(A_{2}),\cdots ,p_{n}(A_{n})]}
.
כאשר נגדיר הגרלה מורכבת באופן הבא:
L
¯
=
[
q
1
(
L
1
)
,
.
.
.
,
q
j
−
1
(
L
j
−
1
)
,
q
j
(
M
)
,
q
j
+
1
(
L
j
+
1
)
,
.
.
.
,
q
J
(
L
J
)
]
{\displaystyle {\overline {L}}=[q_{1}(L_{1}),...,q_{j-1}(L_{j-1}),q_{j}(M),q_{j+1}(L_{j+1}),...,q_{J}(L_{J})]}
היא הגרלה שבה:
1
≤
∀
i
≤
j
{\displaystyle 1\leq \forall i\leq j}
מתקיים ש
L
i
{\displaystyle L_{i}}
הגרלה,
∑
q
i
=
1
,
q
i
≥
0
{\displaystyle \sum q_{i}=1,q_{i}\geq 0}
תחת ההנחות הללו, ארבע האקסיומות בתועלת פון נוימן-מורגנשטרן הן רציפות , מונוטוניות , פישוט והצבה.
עבור שחקן
i
{\displaystyle i}
מתקיים :
לכל שלושה פרסים
A
⪯
i
B
⪯
i
C
{\displaystyle A\preceq _{i}B\preceq _{i}C}
קיים
0
≤
θ
i
≤
1
{\displaystyle 0\leq \theta _{i}\leq 1}
כך ש:
B
≈
i
[
θ
i
(
A
)
,
(
1
−
θ
i
)
C
]
{\displaystyle B\approx _{i}[\theta _{i}(A),(1-\theta _{i})C]}
כלומר,עבור יחס ההעדפות שלעיל לגבי שלושה פרסים
A
,
B
,
C
{\displaystyle A,B,C}
,קיים מספר
0
≤
θ
i
≤
1
{\displaystyle 0\leq \theta _{i}\leq 1}
עבורו ניתן ליצור הגרלה חדשה בה השחקן יזכה בפרס
C
{\displaystyle C}
בסיכוי
1
−
θ
i
{\displaystyle 1-\theta _{i}}
ובפרס
A
{\displaystyle A}
בסיכוי
θ
i
{\displaystyle \theta _{i}}
, והשחקן יוותר אדיש בין הגרלה זו לבין זכייה בפרס
B
{\displaystyle B}
.
יהיו
0
≤
α
,
β
≤
1
{\displaystyle 0\leq \alpha ,\beta \leq 1}
ונניח כי
A
≻
i
B
{\displaystyle A\succ _{i}B}
אזי:
[
α
(
A
)
,
(
1
−
α
)
(
B
)
]
⪰
i
[
β
(
A
)
,
(
1
−
β
)
(
B
)
]
{\displaystyle [\alpha (A),(1-\alpha )(B)]\succeq _{i}[\beta (A),(1-\beta )(B)]}
אם ורק אם
α
≥
β
{\displaystyle \alpha \geq \beta }
כלומר, אם שחקן מעדיף את פרס
A
{\displaystyle A}
על פני פרס
B
{\displaystyle B}
, אזי הוא יעדיף כל הגרלה הנותנת לו את פרס
A
{\displaystyle A}
בסיכוי
α
{\displaystyle \alpha }
, על פני הגרלה הנותנת לו את
A
{\displaystyle A}
בסיכוי נמוך יותר.
לכל
j
=
1
,
2...
,
J
{\displaystyle j=1,2...,J}
תהי
L
j
{\displaystyle L_{j}}
ההגרלה הפשוטה:
L
j
=
[
p
1
j
(
A
1
)
,
p
2
j
(
A
2
)
,
.
.
.
,
p
K
j
(
A
K
)
]
{\displaystyle L_{j}=[p_{1}^{j}(A_{1}),p_{2}^{j}(A_{2}),...,p_{K}^{j}(A_{K})]}
ותהי ההגרלה המורכבת:
L
¯
=
[
q
1
(
L
1
)
,
q
2
(
L
2
)
,
.
.
.
,
q
j
(
L
j
)
]
{\displaystyle {\overline {L}}=[q_{1}(L_{1}),q_{2}(L_{2}),...,q_{j}(L_{j})]}
לכל
k
=
1...
K
{\displaystyle k=1...K}
נגדיר:
r
k
=
[
(
q
1
)
p
k
1
+
(
q
2
)
p
k
2
+
.
.
.
+
(
q
j
)
p
k
J
]
{\displaystyle r_{k}=[(q_{1})p_{k}^{1}+(q_{2})p_{k}^{2}+...+(q_{j})p_{k}^{J}]}
(כלומר,בהסתברות
q
j
{\displaystyle q_{j}}
נזכה בתוצאה
L
j
{\displaystyle L_{j}}
, ואז בסיכוי
p
k
j
{\displaystyle p_{k}^{j}}
נזכה בפרס
A
k
{\displaystyle A_{k}}
. כאשר נסכום לכל
j
{\displaystyle j}
נקבל את ההסתברות ל
A
k
{\displaystyle A_{k}}
) כך נוצרת ההגרלה הפשוטה:
L
=
[
r
1
(
A
1
)
,
r
2
(
A
2
)
,
.
.
.
,
r
K
(
A
K
)
]
{\displaystyle L=[r_{1}(A_{1}),r_{2}(A_{2}),...,r_{K}(A_{K})]}
אזי:
L
≈
i
L
¯
{\displaystyle L\approx _{i}{\overline {L}}}
כלומר, בהינתן הגרלה המגדירה את ההסתברויות לזכות באוסף פרסים, כל הגרלה שתגדיר את אותן הסתברויות, גם אם היא בעלת יותר או פחות שלבים מההגרלה המקורית, שקולה להגרלה המקורית מבחינת יחס ההעדפות של השחקן.
תהי
L
¯
=
[
q
1
(
L
1
)
,
q
2
(
L
2
)
,
.
.
.
,
q
J
(
L
J
)
]
{\displaystyle {\overline {L}}=[q_{1}(L_{1}),q_{2}(L_{2}),...,q_{J}(L_{J})]}
הגרלה מורכבת ו
M
{\displaystyle M}
הגרלה פשוטה.
אם
L
j
≈
i
M
{\displaystyle L_{j}\approx _{i}M}
אזי:
L
¯
≈
i
[
q
1
(
L
1
)
,
.
.
.
,
q
j
−
1
(
L
j
−
1
)
,
q
j
(
M
)
,
q
j
+
1
(
L
j
+
1
)
,
.
.
.
,
q
J
(
L
J
)
]
{\displaystyle {\overline {L}}\approx _{i}[q_{1}(L_{1}),...,q_{j-1}(L_{j-1}),q_{j}(M),q_{j+1}(L_{j+1}),...,q_{J}(L_{J})]}
האקסיומה דורשת כי אם בתוך הגרלה מורכבת נחליף הגרלה פשוטה בהגרלה השקולה לה, אזי השחקן יישאר אדיש בין ההגרלה המורכבת הראשונית לבין זו שבה החליפו את ההגרלות הפשוטות.
משפט פון נוימן-מורגנשטרן
עריכה
אם יחס ההעדפות
≿
i
{\displaystyle \succsim _{i}}
על
L
^
(
O
)
{\displaystyle {\hat {\mathcal {L}}}(O)}
של שחקן
i
{\displaystyle \,i}
הוא שלם וטרנזיטיבי ומקיים את ארבע האקסיומות של פון נוימן ומורגנשטרן, אזי יחס ההעדפות ניתן לייצוג על ידי פונקציית תועלת ליניארית.
טענת עזר. אם יחס ההעדפות של שחקן מקיים את אקסיומות הרציפות והמונוטוניות, ואם
A
≿
i
B
≿
i
C
{\displaystyle A\succsim _{i}B\succsim _{i}C}
ו-
A
≻
i
C
{\displaystyle A\succ _{i}C}
, אזי הגודל
θ
i
{\displaystyle \,\theta _{i}}
המוגדר באקסיומת הרציפות יחיד.
הוכחת הטענה. יהי
≿
i
{\displaystyle \succsim _{i}}
יחס העדפות על
{
A
1
,
…
,
A
K
}
{\displaystyle \{A_{1},\ldots ,A_{K}\}}
שמקיים את אקסיומות הרציפות והמונוטוניות, כאשר
A
K
≻
i
A
1
{\displaystyle A_{K}\succ _{i}A_{1}}
.
לפי רציפות לכל
k
∈
{
1
,
…
,
K
}
{\displaystyle k\in \{1,\ldots ,K\}}
קיים
θ
i
k
∈
[
0
,
1
]
{\displaystyle \theta _{i}^{k}\in [0,1]}
כך ש-
A
k
≈
i
[
θ
i
k
(
A
K
)
,
(
1
−
θ
i
k
)
(
A
1
)
]
{\displaystyle A_{k}\approx _{i}[\theta _{i}^{k}(A_{K}),(1-\theta _{i}^{k})(A_{1})]}
.
אם
φ
i
k
∈
[
0
,
1
]
{\displaystyle \varphi _{i}^{k}\in [0,1]}
מקיים
A
k
≈
i
[
φ
i
k
(
A
K
)
,
(
1
−
φ
i
k
)
(
A
1
)
]
{\displaystyle A_{k}\approx _{i}[\varphi _{i}^{k}(A_{K}),(1-\varphi _{i}^{k})(A_{1})]}
, אז לפי מונוטוניות
φ
i
k
=
θ
i
k
{\displaystyle \varphi _{i}^{k}=\theta _{i}^{k}}
.
הוכחת המשפט. יהי
≿
i
{\displaystyle \succsim _{i}}
יחס העדפות המקיים את תנאי המשפט. נטפל במקרה שבו
A
K
≻
i
A
1
{\displaystyle A_{K}\succ _{i}A_{1}}
.
שלב ראשון:
הגדרת פונקציה
u
i
{\displaystyle \,u_{i}}
על קבוצת ההגרלות.
לפי טענת עזר, לכל
k
∈
{
1
,
…
,
K
}
{\displaystyle k\in \{1,\ldots ,K\}}
קיים מספר ממשי יחיד
θ
i
k
∈
[
0
,
1
]
{\displaystyle \theta _{i}^{k}\in [0,1]}
המקיים:
A
k
≈
i
[
θ
i
k
(
A
K
)
,
(
1
−
θ
i
k
)
(
A
1
)
]
{\displaystyle A_{k}\approx _{i}[\theta _{i}^{k}(A_{K}),(1-\theta _{i}^{k})(A_{1})]\ }
כעת נגדיר פונקציה
u
i
{\displaystyle \,u_{i}}
על קבוצת ההגרלות המורכבות
L
^
(
O
)
{\displaystyle {\hat {\mathcal {L}}}(O)}
. תהי נתונה הגרלה מורכבת
L
^
=
[
q
1
(
L
1
)
,
…
,
q
J
(
L
J
)
]
{\displaystyle {\hat {L}}=[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]}
, שבה
q
→
∈
Δ
J
{\displaystyle {\vec {q}}\in \Delta ^{J}}
, ו-
L
1
,
…
,
L
J
{\displaystyle L_{1},\ldots ,L_{J}}
הן הגרלות פשוטות הנתונות על ידי
L
j
=
[
p
1
j
(
A
1
)
,
…
,
p
K
j
(
A
K
)
]
{\displaystyle L_{j}=[p_{1}^{j}(A_{1}),\ldots ,p_{K}^{j}(A_{K})]}
.
לכל
k
∈
{
1
,
…
,
K
}
{\displaystyle k\in \{1,\ldots ,K\}}
נגדיר:
r
k
=
q
1
p
k
1
+
q
2
p
k
2
+
…
+
q
J
p
k
J
{\displaystyle r_{k}=q_{1}p_{k}^{1}+q_{2}p_{k}^{2}+\ldots +q_{J}p_{k}^{J}}
זוהי ההסתברות שתוצאת ההגרלה תהיה
A
k
{\displaystyle \,A_{k}}
. נגדיר פונקציה
u
i
{\displaystyle \,u_{i}}
על קבוצת ההגרלות המורכבות באופן הבא:
u
i
(
L
^
)
=
r
1
θ
i
1
+
r
2
θ
i
2
+
…
+
r
K
θ
i
K
{\displaystyle u_{i}({\hat {L}})=r_{1}\theta _{i}^{1}+r_{2}\theta _{i}^{2}+\ldots +r_{K}\theta _{i}^{K}}
מכאן נובע בפרט שלכל הגרלה פשוטה
L
=
[
p
1
(
A
1
)
,
…
,
p
K
(
A
K
)
]
{\displaystyle L=[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]}
מתקיים:
u
i
(
L
)
=
∑
k
=
1
K
p
k
θ
i
k
{\displaystyle u_{i}(L)=\sum \limits _{k=1}^{K}{p_{k}\theta _{i}^{k}}}
שלב שני:
u
i
(
A
k
)
=
θ
i
k
{\displaystyle u_{i}(A_{k})=\theta _{i}^{k}}
לכל
k
∈
{
1
,
…
,
K
}
{\displaystyle k\in \{1,\ldots ,K\}}
.
הפרס
A
k
{\displaystyle \,A_{k}}
שקול להגרלה
L
=
[
1
(
A
k
)
]
{\displaystyle \,L=[1(A_{k})]}
, השקולה להגרלה המורכבת
L
^
=
[
1
(
L
)
]
{\displaystyle {\hat {L}}=[1(L)]}
. תוצאת ההגרלה
L
^
{\displaystyle {\hat {L}}}
היא
A
k
{\displaystyle \,A_{k}}
בהסתברות
1
{\displaystyle \,1}
, ולכן במקרה זה:
r
l
=
{
1
l
=
k
0
l
≠
k
{\displaystyle r_{l}=\left\{{\begin{array}{*{35}{l}}1\quad \quad \quad l=k\\0\quad \quad \quad l\neq k\\\end{array}}\right.}
מכאן נקבל כי:
u
i
(
A
k
)
=
θ
i
k
∀
k
∈
{
1
,
…
,
K
}
{\displaystyle u_{i}(A_{k})=\theta _{i}^{k}\quad \forall k\in \{1,\ldots ,K\}}
מכיוון ש-
θ
i
1
=
0
{\displaystyle \theta _{i}^{1}=0}
ו-
θ
i
K
=
1
{\displaystyle \theta _{i}^{K}=1}
, נקבל כי
u
i
(
A
1
)
=
0
{\displaystyle \,u_{i}(A_{1})=0}
ו-
u
i
(
A
K
)
=
1
{\displaystyle \,u_{i}(A_{K})=1}
.
שלב שלישי:
u
i
{\displaystyle \,u_{i}}
ליניארית.
כדי להראות ש-
u
i
{\displaystyle \,u_{i}}
ליניארית, נראה כי לכל הגרלה פשוטה
L
=
[
p
1
(
A
1
)
,
…
,
p
K
(
A
K
)
]
{\displaystyle L=[p_{1}(A_{1}),\ldots ,p_{K}(A_{K})]}
מתקיים:
u
i
(
L
)
=
∑
k
=
1
K
p
k
u
i
(
A
k
)
{\displaystyle u_{i}(L)=\sum \limits _{k=1}^{K}{p_{k}u_{i}(A_{k})}}
אך משוואה זו מתקיימת, שכן משלב ראשון אגף שמאל שווה ל-
∑
k
=
1
K
p
k
θ
i
k
{\displaystyle \sum \nolimits _{k=1}^{K}{p_{k}\theta _{i}^{k}}}
, ומשלב שני אגף ימין שווה אף הוא לגודל זה.
שלב רביעי:
u
i
{\displaystyle \,u_{i}}
היא פונקציית תועלת.
כדי להראות כי
u
i
{\displaystyle \,u_{i}}
היא פונקציית תועלת המייצגת את יחס ההעדפות
≿
i
{\displaystyle \succsim _{i}}
יש להראות כי לכל שתי הגרלות מורכבות
L
^
{\displaystyle {\hat {L}}}
ו-
L
^
′
{\displaystyle {\hat {L}}'}
מתקיים:
L
^
≿
i
L
^
′
⟺
u
i
(
L
^
)
≥
u
i
(
L
^
′
)
{\displaystyle {\hat {L}}\succsim _{i}{\hat {L}}'\quad \iff \quad u_{i}({\hat {L}})\geq u_{i}({\hat {L}}')}
תהיינה, אם כן,
L
^
{\displaystyle {\hat {L}}}
ו-
L
^
′
{\displaystyle {\hat {L}}'}
שתי הגרלות מורכבות. נסמן:
L
^
=
[
q
1
(
L
1
)
,
…
,
q
J
(
L
J
)
]
,
L
^
′
=
[
q
1
′
(
L
1
′
)
,
…
,
q
J
′
′
(
L
J
′
′
)
]
{\displaystyle {\hat {L}}=[q_{1}(L_{1}),\ldots ,q_{J}(L_{J})]\quad ,\quad {\hat {L}}'=[q'_{1}(L'_{1}),\ldots ,q'_{J'}(L'_{J'})]}
כאשר
L
j
=
[
p
1
j
(
A
1
)
,
…
,
p
K
j
(
A
K
)
]
,
L
j
′
=
[
p
′
1
j
(
A
1
)
,
…
,
p
′
K
j
(
A
K
)
]
{\displaystyle L_{j}=[p_{1}^{j}(A_{1}),\ldots ,p_{K}^{j}(A_{K})]\quad ,\quad L'_{j}=[{p'}_{1}^{j}(A_{1}),\ldots ,{p'}_{K}^{j}(A_{K})]}
לכל
k
∈
{
1
,
…
,
K
}
{\displaystyle k\in \{1,\ldots ,K\}}
נסמן:
r
k
=
∑
j
=
1
J
q
j
p
k
j
,
r
k
′
=
∑
j
=
1
J
′
q
j
′
p
′
k
j
{\displaystyle r_{k}=\sum \limits _{j=1}^{J}{q_{j}p_{k}^{j}}\quad ,\quad r'_{k}=\sum \limits _{j=1}^{J'}{q'_{j}{p'}_{k}^{j}}}
אלו ההסתברויות לקבלת התוצאה
A
k
{\displaystyle \,A_{k}}
בשתי ההגרלות המורכבות
L
^
{\displaystyle {\hat {L}}}
ו-
L
^
′
{\displaystyle {\hat {L}}'}
. מהגדרת פונקציית התועלת,
u
i
(
L
^
)
=
∑
k
=
1
K
r
k
θ
i
k
,
u
i
(
L
^
′
)
=
∑
k
=
1
K
r
k
′
θ
i
k
{\displaystyle u_{i}({\hat {L}})=\sum \limits _{k=1}^{K}{r_{k}\theta _{i}^{k}}\quad ,\quad u_{i}({\hat {L}}')=\sum \limits _{k=1}^{K}{r'_{k}\theta _{i}^{k}}}
לכן,
u
i
(
L
^
)
≥
u
i
(
L
^
′
)
⟺
∑
k
=
1
K
r
k
θ
i
k
≥
∑
k
=
1
K
r
k
′
θ
i
k
{\displaystyle u_{i}({\hat {L}})\geq u_{i}({\hat {L}}')\quad \iff \quad \sum \limits _{k=1}^{K}{r_{k}\theta _{i}^{k}}\geq \sum \limits _{k=1}^{K}{r'_{k}\theta _{i}^{k}}}
מצד שני, מאקסיומת הפישוט,
L
^
≈
i
[
r
1
(
A
1
)
,
r
2
(
A
2
)
,
…
,
r
K
(
A
K
)
]
,
L
^
′
≈
i
[
r
1
′
(
A
1
)
,
r
2
(
A
2
)
,
…
,
r
K
′
(
A
K
)
]
{\displaystyle {\hat {L}}\approx _{i}[r_{1}(A_{1}),r_{2}(A_{2}),\ldots ,r_{K}(A_{K})]\quad ,\quad {\hat {L}}'\approx _{i}[r'_{1}(A_{1}),r_{2}(A_{2}),\ldots ,r'_{K}(A_{K})]}
נסמן
L
k
=
[
θ
i
k
(
A
K
)
,
(
1
−
θ
i
k
)
(
A
1
)
]
{\displaystyle L_{k}=[\theta _{i}^{k}(A_{K}),(1-\theta _{i}^{k})(A_{1})]}
. אזי על פי הגדרת
θ
i
k
{\displaystyle \theta _{i}^{k}}
מתקיים
A
k
≈
i
L
k
{\displaystyle A_{k}\approx _{i}L_{k}}
לכל
k
∈
{
1
,
…
,
K
}
{\displaystyle k\in \{1,\ldots ,K\}}
. מאקסיומת ההצבה המופעלת
K
{\displaystyle \,K}
פעמים, הן עבור
L
^
{\displaystyle {\hat {L}}}
והן עבור
L
^
′
{\displaystyle {\hat {L}}'}
, מתקיים:
L
^
≈
i
[
r
1
(
L
1
)
,
r
2
(
L
2
)
,
…
,
r
K
(
L
K
)
]
,
L
^
′
≈
i
[
r
1
′
(
L
1
)
,
r
2
′
(
L
2
)
,
…
,
r
K
′
(
L
K
)
]
{\displaystyle {\hat {L}}\approx _{i}[r_{1}(L_{1}),r_{2}(L_{2}),\ldots ,r_{K}(L_{K})]\quad ,\quad {\hat {L}}'\approx _{i}[r'_{1}(L_{1}),r'_{2}(L_{2}),\ldots ,r'_{K}(L_{K})]}
כיוון שכל ההגרלות
L
k
{\displaystyle \,L_{k}}
הן הגרלות על
A
1
,
A
K
{\displaystyle \,A_{1},A_{K}}
ההגרלות באגף ימין של שתי המשוואות לעיל אף הן על שתי תוצאות אלו בלבד. לכן אם נסמן ב-
r
{\displaystyle \,r}
ו-
r
′
{\displaystyle \,r'}
את ההסתברות הכוללת של
A
K
{\displaystyle \,A_{K}}
בהגרלות
L
^
{\displaystyle {\hat {L}}}
ו-
L
^
′
{\displaystyle {\hat {L}}'}
בהתאמה, אזי
r
=
∑
k
=
1
K
r
k
θ
i
k
,
r
′
=
∑
k
=
1
K
r
k
′
θ
i
k
{\displaystyle r=\sum \limits _{k=1}^{K}{r_{k}\theta _{i}^{k}}\quad ,\quad r'=\sum \limits _{k=1}^{K}{r'_{k}\theta _{i}^{k}}}
ומאקסיומת הפישוט, נובע:
L
^
≈
i
[
r
(
A
K
)
,
(
1
−
r
)
(
A
1
)
]
,
L
^
′
≈
i
[
r
′
(
A
K
)
,
(
1
−
r
′
)
(
A
1
)
]
{\displaystyle {\hat {L}}\approx _{i}[r(A_{K}),(1-r)(A_{1})]\quad ,\quad {\hat {L}}'\approx _{i}[r'(A_{K}),(1-r')(A_{1})]}
מאקסיומת המונוטוניות,
L
^
≿
i
L
^
′
⟺
r
≥
r
′
{\displaystyle {\hat {L}}\succsim _{i}{\hat {L}}'\quad \iff \quad r\geq r'}
.
לכן, בסה"כ,
L
^
≿
i
L
^
′
⟺
u
i
(
L
^
)
≥
u
i
(
L
^
′
)
{\displaystyle {\hat {L}}\succsim _{i}{\hat {L}}'\quad \iff \quad u_{i}({\hat {L}})\geq u_{i}({\hat {L}}')}
.
כנדרש.