שיווי משקל מתואם – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Matanyabot (שיחה | תרומות)
מ ←‏הגדרה פורמלית: הגהה, ניסוח
שורה 5:
==הסבר לא פורמלי==
 
שיווי משקל מתואם מהווה [[התפלגות]] על קבוצת ווקטוריוקטורי [[תכסיס (תורת המשחקים)|התכסיסים]] (אסטרטגיות), העומדים לפני שחקנים במשחק המתואר ב[[משחק בצורה תכסיסית|צורה תכסיסית]], המקיימת את התנאי הבא-: [[תוחלת]] התועלת לכל שחקן הבוחר לנקוט בתכסיס שמתווה לו תוצאה של הגרלה, גדולה לפחות כמו תוחלת התועלת עבור כל בחירה אחרת בה יכול לנקוט השחקן, בהינתן שכל שאר השחקנים מצייתים לתכסיס שהוגרל להם (מאותו שיקול).
 
ניתן להתייחס להתפלגות כאל אות, או עצה חיצונית לשחקנים. שיווי משקל נוצר כאשר כל השחקנים מאמינים כי עדיף להם לקבל את העצה או לפעול בהתאם למה שמרמז עבורם האות משיקולי תועלת. כמו כן, העצה אינה חלק מן המשחק המקורי, ואינה מחייבת אף שחקן בפועל. במובן הזה, שיווי משקל מתואם הוא מצב בו שחקני המשחק יצייתו מרצונם לגורם בלתי תלוי ומוסכם מראש, בדמות עצות, תוך הבנה כי התנהגות כזאת עדיפה להם מבלי צורך ליצור חוזה מחייב. ניתן גם לדמות מצב שלאשבו לא כל השחקנים נחשפו לאות, או שתתי -קבוצות שונות של שחקנים נחשפו לאותות שונים.
 
==הגדרה פורמלית==
שורה 15:
עבור כל ווקטור <math> S_i </math> בגודל <math> n </math> נגדיר ווקטור <math> S_{-i} </math> כווקטור בגודל <math> n-1 </math>, הזהה ל <math> S_i </math>, פרט לכך שאינו מכיל את התא <math> i </math> שלו.
 
תיהיתהי <math> p </math> התפלגות על קבוצת ווקטורי התכסיסים <math> S </math>, אזי <math> p </math> מהווההוא שיווי משקל מתואם אם לכל שחקן <math> i \in N </math> מתקיים : {{ש}} {{ש}}
<math> \forall s^\prime_i \in S_i \sum_{s_{-i} \in S_{-i}} p(s_i,s_{-i})u(s_i,s_{-i}) \geq \sum_{s_{-i} \in S_{-i}} p(s_i,s_{-i})u(s^\prime_i,s_{-i}) </math> {{ש}} {{ש}}
 
במילים אחרות, <math>p</math> היאהוא שיווי משקל מתואם אם אף שחקן לא יכול לשפר את תוחלת התשלומים שלו על ידי החלפת תכסיסיו.
 
==דוגמה==
שורה 37:
למשחק הנ"ל ישנם שלושה [[שיווי משקל נאש|שיוויי משקל נאש]], (כדורגל,כדורגל), (אופרה,אופרה) ושיווי משקל מעורב בו כל שחקן הולך לאן שהוא מעדיף בסיכוי 2/3 לאן שהשני מעדיף 1/3, בהם לאף אחד מהשחקנים לא משתלם להיות היחיד המשנה את בחירתו.
 
ניתן ליצור שיווי משקל מתואם במשחק הנ"ל על ידי הגרלה- שני השחקנים יטילו מטבע הוגן. ייקבע מראש כי אם תוצאת ההטלה היא פלי, שני השחקנים ילכו לאופרה, ואם התוצאה עץ, ילכו למשחק הכדורגל. תוחלת התשלומים של כל שחקן, במקרה זה, היא: 1.5=0.5(1+2). ניתן לשים לב כי תוחלת התשלומים בשיווי משקל זה זהה לשני השחקנים, בניגוד לשיווי המשקל במשחק המקורי.<br />
תוחלת התשלומים של כל שחקן, במקרה זה, היא - 1.5=0.5(1+2). ניתן לשים לב כי תוחלת התשלומים בשיווי משקל זה זהה לשני השחקנים, בניגוד לשיווי המשקל במשחק המקורי.<br />
 
נראה באופן פורמלי נראה עבור השחקן הראשון (חובב הכדורגל) כי התנאי לשיווי משקל מתואם מתקיים.<br />
 
נגדיר התפלגות <math>p</math>,
<math> p(o,o)=p(f,f)=1/2 </math> <math> p(o,f)=p(f,o)=0 </math>
<br />
 
<math> p(o,o)=p(f,f)=1/2 </math> <math> p(o,f)=p(f,o)=0 </math> <br />
תחילה נחשב עבור התכסיס "הליכה לכדורגל":
<br />
 
תחילה נחשב עבור התכסיס "הליכה לכדורגל":<br />
<math> p(f,f)u_1(f,f)+p(f,o)u_1(f,o) = 1/2*2+0*0 = 1 \geq 0 = 1/2*0+0*1 = p(f,f)u_1(o,f)+p(f,o)u_1(o,o) </math>
<br />
 
<math> p(f,f)u_1(f,f)+p(f,o)u_1(f,o) = 1/2*2+0*0 = 1 \geq 0 = 1/2*0+0*1 = p(f,f)u_1(o,f)+p(f,o)u_1(o,o) </math><br />
כעת עבור "הליכה לאופרה":
<br />
 
כעת עבור "הליכה לאופרה":<br />
<math> p(o,f)u_1(o,f)+p(o,o)u_1(o,o) = 0*0+1/2*1 = 1/2 \geq 0 = 0*2+1/2*0 = p(o,f)u_1(f,f)+p(o,o)u_1(f,o) </math>
 
<br />
<math> p(o,f)u_1(o,f)+p(o,o)u_1(o,o) = 0*0+1/2*1 = 1/2 \geq 0 = 0*2+1/2*0 = p(o,f)u_1(f,f)+p(o,o)u_1(f,o) </math><br />
 
מהסימטריות של מטריצת (טבלת) המשחק ניתן לראות כי תוצאת החישוב עבור השחקן השני תהיה זהה ולכן ההתפלגות שהגדרנו היא אכן שיווי משקל מתואם. קל להבין זאת מהתבוננות בטבלה, מהרגע שהוגרל אחד המצבים בהם ישנה תועלת חיובית לשני השחקנים, כל שינוי תכסיס על ידי אחד השחקנים יוביל לתועלת אפס עבורו.
שורה 80 ⟵ 75:
נניח כי ישנו גוף צד שלישי נייטרלי שבוחר את הפעולות של המשתתפים באקראי מבין שני שיווי המשקל הטהורים ו(לסטות,לסטות) בהסתברות של שליש כל אחד ומספר לכל אחד מה נבחר עבורו אך לא מה נבחר עבור השחקן השני.
 
אם הגוף החדש אומר לשחקן לנסוע ישר אזי כמובן שאין לו סיבה לסטות כי הוא יודע שלשחקן השני נאמר לסטות והתועלת תהיה 9. אם הגוף אמר לשחקן לסטות אזי השחקן השני יסטה או ייסע בהסתברות 0.5 ואז תוחלת התועלת עבור אי קבלת העצה ונסיעה ישר תהיה:
 
<math> 0.5\cdot0 + 0.5\cdot9 = 4.5 </math> ועבור סטייה כפי שנאמר תהיה <math> 0.5\cdot8 + 0.5\cdot1 = 4.5 </math> לכן אין סיבה שלא להקשיב לצד השלישי.