שיווי משקל משוכלל לצורה הרחבה

שיווי המשקל המשוכלל לצורה הרחבה הוא עידון של מושג שיווי המשקל התת-משחקי המשוכלל בתורת המשחקים. במשחקים מסוימים יכולים להתקבל שיוויי משקל תת-משחקיים משוכללים שלא נראים כמתקבלים על הדעת למתבונן הנאיבי, בהנחה שהשחקנים המשחקים את המשחק רציונליים.

דוגמהעריכה

במשחק המתואר משמאל ישנו תת-משחק יחיד (המשחק עצמו), ולכן כל שיווי משקל נאש הוא גם שיווי משקל תת-משחקי משוכלל. שני שיוויי המשקל נאש במשחק זה הם:   ו-  . אבל, אם נשים את עצמנו בנעליו של שחקן 1, הבחירה בפעולה   נראית לא סבירה, שכן אם שחקן 1 ישחק את הפעולה   לא סביר להניח כי שחקן 2 יעדיף את הפעולה   על-פני הפעולה   הנשלטת על ידה. שיווי המשקל   נראה לכן תוצאה סבירה יותר של המשחק.

הגדרה פורמליתעריכה

משחק בצורה רחבה עם הפרעות הוא משחק בצורה רחבה בו בכל קבוצת ידיעה של שחקן עליו לבחור בכל פעולה בהסתברות חיובית החסומה מלמטה. כלומר כל פעולה בכל קבוצת ידיעה מבוצעת בהסתברות חיובית ממש.

פורמלית: נסמן ב-  את קבוצת הפעולות האפשריות בכל קבוצת ידיעה   של שחקן  . וקטור הפרעות   של שחקן   הוא וקטור המתאים מספר חיובי לכל פעולה   של שחקן  , כך שלכל קבוצת ידיעה שלו   מתקיים  .

שיווי משקל משוכלל לצורה הרחבה: יהי   משחק בצורה רחבה, נסמן ב-  את המשחק עם ההפרעות שבו על כל שחקן i, בכל קבוצת ידיעה   שלו, לבחור כל פעולה   אפשרית לו באותה קבוצת ידיעה בהסתברות גדולה מ- או שווה ל- . לווקטור   נקרא וקטור הפרעות, ואת הקואורדינטה המקסימלית שלו נסמן ב- .

וקטור אסטרטגיות התנהגות   במשחק בצורה הרחבה יהווה שיווי משקל משוכלל לצורה הרחבה אם קיימת סדרה של וקטורי הפרעות   המקיימת   ולכל   קיימת נקודת שיווי משקל (באסטרטגיות התנהגות)   במשחק   כך שמתקיים  .

שיווי משקל משוכלל לצורה הרחבה ואסטרטגיות התנהגותעריכה

בניגוד לשיווי משקל משוכלל לצורה האסטרטגית בו ההפרעות מותאמות לכל אסטרטגיה טהורה של כל שחקן, בהגדרת שיווי המשקל לצורה הרחבה ההפרעות מותאמות לכל פעולה שלו. לכן למעשה מדובר בשיווי משקל המתקבל על ידי אסטרטגיות התנהגות בהן השחקן מחליט על פעולותיו בכל קבוצת ידיעה בנפרד ולא על ידי אסטרטגיה שנקבעה מראש.

קיום שיווי משקל משוכלל לצורה הרחבהעריכה

משפט: בכל משחק עם זיכרון שלם קיים שיווי משקל משוכלל לצורה הרחבה.

הוכחה: יהי   משחק בצורה רחבה עם זיכרון שלם ותהי   סדרה של וקטורי הפרעות המקיימת  . נסתכל על המשחק המופרע  . כיוון שלכל השחקנים זיכרון שלם, כל אסטרטגיה מעורבת שקולה לאסטרטגיית התנהגות כלשהי. לכן ממשפט נאש (קיום שיווי משקל לאסטרטגיות מעורבות) קיים גם שיווי משקל באסטרטגיות התנהגות ב-  . מכיוון שמרחב וקטורי אסטרטגיית ההתנהגות הוא מרחב קומפקטי, לסדרה   קיימת תת-סדרה מתכנסת. בלי הגבלת הכלליות נניח כי זו הסדרה   עצמה. נסמן את גבול סדרה זו ב- . אזי   שיווי משקל משוכלל לצורה הרחבה.

המשך הדוגמהעריכה

נראה כי במשחק המתואר למעלה רק   הוא שיווי משקל משוכלל לצורה הרחבה. יהי   המשחק המופרע המתאים למשחק זה, בו כל אחת מהפעולות:   חייבת להיות משוחקת בהסתברות   לפחות.

מכיוון שהפעולה   שולטת על הפעולה  , בכל שיווי משקל במשחק עם ההפרעות שחקן 2 ישחק את אסטרטגיית ההתנהגות  . נניח כי   קטן מספיק - כלומר במידה כזו ש: . צרוף האסטרטגיה הקודמת של שחקן 2 עם האסטרטגיה   של שחקן 1 מהוות שיווי משקל. נסמנו  . מתקיים:  . כמו כן, כיוון שראינו כי בתנאים אלו שחקן 2 משחק את האסטרטגיה   בהסתברות מינימלית לא ייתכן כי   יהווה גם כן שיווי משקל משוכלל לצורה הרחבה.

ראו גםעריכה

לקריאה נוספתעריכה