שרשרת מרקוב
יש להשלים ערך זה: בערך זה חסר תוכן מהותי. חסרים מושגים בסיסיים כמו התפלגות סטציונרית, מחזוריות, פריקות ושימושים. ייתכן שתמצאו פירוט בדף השיחה. | |
שרשרת מרקוב (באנגלית: Markov Chain) היא מודל הסתברותי המשמש בדרך-כלל לתיאור התפתחות של תהליכים כסדרה של מצבים.
שרשראות מרקוב הן כלי שימושי ביותר לתיאור תהליכים במגוון תחומים, כגון: תורת המשחקים, פיזיקה, עיבוד אותות וניתוח שפות טבעיות. נראה שהמתמטיקאי הרוסי אנדריי מרקוב, שחקר אותן לראשונה בתחילת המאה ה-20 ושעל שמו הן קרויות, התעניין בהן בשל הערך העיוני שלהן לתורת ההסתברות - הן איפשרו לו להכליל את משפט הגבול המרכזי למשתנים תלויים.
כדוגמה, ניתן לתאר דגם פשטני של מזג האוויר כשרשרת מרקוב. בניית הדגם יוצאת מהפשטה על פיה מזג האוויר מתואר במשך שבוע כסדרה של 7 מצבים (מצב לכל יום): בהיר, מעונן או גשום. על מנת להפוך תיאור זה למודל הסתברותי, יש להגדיר התפלגות במרחב הסדרות, כלומר להתאים הסתברות להתרחשותה של כל סדרה של 7 מצבים. מודל זה, למשל יכול להתאים לסדרה:
"גשום, גשום, מעונן, בהיר, בהיר, בהיר, בהיר"
הסתברות 0.01, ולסדרה הקבועה
"גשום, גשום, ... גשום"
הסתברות 0.2, וכך הלאה.
היסטוריה
עריכהאנדריי מרקוב חקר שרשראות מרקוב בתחילת המאה ה-20. מרקוב התעניין בחקירת הרחבות של רצפים אקראיים בלתי תלויים. למרקוב הייתה מוטיבציה לחקור תחום זה בעקבות ויכוח עם פאבל נקראסוב (אנ') שטען שאי-תלות היא תנאי הכרחי עבור החוק החלש של המספרים הגדולים.
במאמר הראשון שלו על שרשראות מרקוב, שפורסם ב-1906, מרקוב הראה שתחת תנאים מסוימים, הממוצעים של תוצאות השרשרת יתכנסו לווקטור ערכים, ועל ידי כך הוכח החוק החלש של המספרים הגדולים ללא הנחת אי-תלות, שנתפסה באותה העת כתנאי להוכחה.
ב-1912 חקר אנרי פואנקרה שרשראות מרקוב על קבוצות סופיות במטרה לחקור ערבוב קלפים. שימושים מוקדמים נוספים בשרשראות מרקוב כוללים מודל דיפוזיה, שהוצג על ידי פול (אנ') וטטיאנה אהרנפסט (אנ') ב-1907 ותהליך מסתעף, שהוצג על ידי פרנסיס גולטון והנרי ויליאם ווטסון (אנ') ב-1873, לפני מחקרו של מרקוב. לאחר עבודתם של ווטסון וגאלטון, התגלה שהתהליכים המסתעפים שהם חקרו נחקרו כשלושה עשורים קודם לכן בצורה בלתי תלויה על ידי אירנה-ז'ול ביינאמה.
דגם מרקובי ומערכת מרקובית
עריכהדגם מוגדר כדגם מרקובי ומערכת מוגדרת כמערכת מרקובית אם כל המידע בהווה, היכול לשמש לניבוי המצבים העתידיים, מתמצה במצב הנוכחי. משמעותו של תנאי זה, היא שאין צורך לזכור את מצבי העבר, שכן מידע זה לא יועיל בניבוי העתיד.
אינטואיטיבית, מודל מרקובי מתאר מערכת "חסרת זיכרון": מערכת שבה אין השפעות עקיפות של מצבים קודמים בסדרה, על מצבים עתידיים (השפעות "עקיפות" הן השפעות שאינן באות לידי ביטוי במצב הנוכחי).
הגדרת שרשרת מרקוב וחישוב ההתפלגות
עריכהתכונת מרקוב
עריכהשרשרת מרקוב היא תהליך סטוכסטי, כלומר סדרה של משתנים מקריים המקיימת את תכונת מרקוב: ההתפלגות של המשתנה המקרי ה- n+1-י בהינתן המשתנים שקדמו לו, שווה להתפלגותו בהינתן המשתנה ה- n-י בלבד:
כאשר המשתנים המקריים מקבלים ערכים בקבוצה .
שרשרת מרקוב המקיימת את תכונת מרקוב ניתנת לייצוג בעזרת אוטומט הסתברותי.
שרשרת מרקוב מסדר k
עריכהשרשרת מרקוב מסדר k מתארת תהליך סטוכסטי שעבורו ההתפלגות של המשתנה המקרי הn+1-י בהינתן המשתנים שקדמו לו, שווה להתפלגותו בהינתן k המשתנים שקדמו לו:
לפי הגדרה זו, תהליך סטוכסטי המקיים את תכונת מרקוב מהווה שרשרת מרקוב מסדר 1.
חישוב הסתברות מאורע במרחב הסדרות הסופיות
עריכהניתן לייצג את ערך השרשרת כהילוך אקראי בקבוצה סופית של מצבים.
תכונת מרקוב מאפשרת לתאר את התפלגות של סדרת המשתנים בצורה תמציתית.
הוכח כי ניתן להגדיר במלואה כל התפלגות של שרשרת מרקוב על ידי המקדמים הבאים:
1. מספר המצבים
2. וקטור ההתפלגות ההתחלתית, כלומר ההתפלגות של , המסומנת ב- כאשר
3. סדרה של מטריצות NxN, המסומנות , והמגדירות את הסתברויות המעבר, כך ש: ,
ההסתברות לקבלת סדרה סופית של מצבים, הנתונה על ידי:
חישוב הסתברות מאורע במרחב הסדרות האינסופיות
עריכהחישוב ההסתברות לכל מאורע במרחב הסדרות (האינסופיות), נעשה באופן דומה:
ההתפלגות של המשתנה נתונה על ידי הווקטור
תכונות של שרשראות מרקוב
עריכההומוגניות בזמן
עריכהשרשרת מרקוב נקראת הומוגנית בזמן אם מתקיים ש- ללא תלות ב- . כלומר, כאשר ההסתברות לעבור ממצב למשנהו אינה תלויה בזמן ההגעה אליו.
לדוגמה, אם לאחר התקדמות של שלבים בפעולת מערכת מרקובית ההסתברות לעבור ממצב למצב אינה זהה להסתברות המעבר אם כבר התבצעו 5 שלבים במערכת, השרשרת אינה הומוגנית בזמן.
לעומת זאת אם הסתברויות המעברים של כל המצבים אל שאר המצבים אינן משתנות בהתאם למספר השלבים שעברה המערכת, השרשרת הומוגנית בזמן.
פריקות
עריכהשרשרת מרקוב נקראת אי פריקה אם מכל מצב בשרשרת ניתן להגיע אל כל שאר המצבים.
מצב ארגודי
עריכהמצב בשרשרת מרקוב יקרא מצב ארגודי אם לכל מצב המקושר ל- (כלומר קיים מסלול מ- ל- ) אז גם מקושר ל- (כלומר קיים מסלול מ- ל- )
מחלקה בלתי פריקה
עריכהמחלקה בלתי פריקה של מצבים מקיימת שעבור כל מצב במחלקה ועבור כל מצב במחלקה המצבים מקושרים וגם עבור כל במחלקה ועבור שאינו במחלקה אז לא מקושר ל- (אך ייתכן כי מקושר ל- ).
מחלקה בלתי פריקה היא מחלקת שקילות של מצבים ארגודים. שרשרת מרקוב בלתי פריקה מקיימת שכל המצבים בה הם ארגודים.
נשנות
עריכהמצב יקרא נשנה אם הסיכוי לחזור אליו מעצמו פעם נוספת הוא 1 כלומר כאשר מסמל את הסיכוי לחזור למצב ה לראשונה לאחר צעדים. מצב שאינו נשנה יקרא מצב חולף.
נשים לב שמצב שאיננו ארגודי הוא חולף, אך המשפט ההפוך נכון רק עבור שרשראות סופיות. נשים לב שתכונה שקולה לנשנות היא כאשר מסמל את הסיכוי לחזור למצב ה לאחר צעדים.
משתי התכונות הללו ניתן להסיק כי נשנות היא תכונה מחלקתית. כלומר אם מצב במחלקה בלתי פריקה הוא נשנה אז כל המצבים במחלקה הזו נשנים.[1]
נשנות חיובית
עריכהמצב יקרא נשנה חיובית אם הוא נשנה ובנוסף מתקיים ש- תוחלת זמן החזרה של המצב סופית. אחרת אם המצב נשנה ותוחלת זמן החזרה היא אינסופית המצב יקרא מצב נשנה אפס.
נשנות אפס ונשנות חיובית הן תכונות מחלקתיות.
בשרשראות סופיות כל המצבים הנשנים הם נשנים חיובית.
מחזוריות
עריכהעבור מצב נתבונן ב ונתבונן ב- המחלק המשותף המקסימלי של האיברים בקבוצה. אם נאמר שהמצב הוא מחזורי. אחרת, אם נאמר שהשרשרת לא מחזורית.
נשים לב שמחזוריות היא תכונה מחלקתית אף היא ולכן עבור כל מצב הנמצא במחלקה של המצב הוא מחזורי אף הוא.
התפלגות סטציונרית
עריכהעבור מצב נשנה ולא מחזורי מתקיים שהגבול קיים כאשר .
עבור מטריצת מעבר מרקובית אשר מצביה אינה מחזוריים מתקיים שעבור התפלגות מצבים מתקיים
כלומר התפלגות מצבים זו היא וקטור עצמי בעל ערך עצמי של ועל כן נקראת התפלגות סטציונרית.
עבור תהליך מרקובי אי פריק שכל מצביו נשנים חיובית ולא מחזוריים ההתפלגות הסטציונרית היא יחידה ושווה ל- .
עבור ההתפלגות הסטציונרית מתקיים כי עבור כל מצב מתקיים כי
כאשר השרשרת היא לא מחזורית ובלתי פריקה, התפלגות המצבים תשאף להתפלגות הסטציונרית, ללא תלות בוקטור התפלגות המצבים ההתחלתי.[2]
תנאי האיזון המפורט
עריכהתנאי האיזון המפורט דורש תנאי חזק יותר על ההתפלגות הסטציונרית . כאשר תנאי זה מתקיים השרשרת תקרא שרשרת מרקוב הפיכה.
דוגמאות לשרשראות מרקוב
עריכההמקרה הקלאסי
עריכהלעיתים, שרשרת מרקוב מתוארת לפי הסתברויות המעברים בין המצבים בעזרת וקטור המייצג את ההסתברויות להתחיל את המערכת בהתאם לכל מצב, ובעזרת מטריצה המתאימה את ההסתברויות לעבור מהמצב בשורה ה-i (כל שורה מסתכמת ל-1) למצב בטור ה-j. למשל, בתרשים המובא בפתיח הערך מתוארת השרשרת עם וקטור המצבים ההתחלתיים ומטריצת המעברים הבאים:
- ו- לכל t.
בהגדרה כללית, הסתברויות המעבר יכולות להשתנות עם הזמן.
שרשרת מרקוב הפיכה
עריכהלעיתים, תהליכים שלכאורה אינם מרקוביים מקיימים את תכונת מרקוב.
לדוגמה, מערכת כזו היא מערכת מזג אוויר אשר מנתחים אותה על ידי בניית דגם של מצביה לאחור בזמן. במקום להגריל את מצב מזג האוויר ביום הראשון ולאחר מכן ביום השני, מגרילים את מצב מזג האוויר בדגם, ליום האחרון, ולאחריו לאחור, ליום שקדם לו. כל יום, על סמך הנתונים ביום שלאחריו על פי הסתברויות-מעבר שנקבעו מראש. תהליך בניית דגם מסוג זה[3] יכול לקיים את תכונת מרקוב[4].
יתר-על-כן, ניתן להגדיר וקטור התפלגות למצב מזג האוויר ביום האחרון וכן הסתברויות מעבר "אחורה בזמן", כך שההתפלגות המתקבלת תהיה זהה לדגם המחושב קדימה[5]. מערכת זו מקיימת את תכונת מרקוב.
בעזרת חוק בייס הוכח שכל תהליך "מרקובי הפיך" מסוג זה מקיים את תכונת מרקוב, בתנאי שההסתברות לכל מצב אינה מתאפסת באף אחת מנקודות הזמן. .
דוגמה לתהליך לא מרקובי
עריכהבהנחה שמזג האוויר בשבוע הראשון מוגרל כך שסדרת המצבים
"גשום, גשום, גשום, ..., גשום"
מופיעה בהסתברות 0.5, בעוד ששאר האפשרויות לסדרת מצבי מזג האוויר בשבוע הראשון מוגרלות בהסתברות שווה (כלומר, בהסתברות כל אחת). לאחר יום שבת, מזג האוויר מוגרל לפנים - כל פעם על סמך היום שלפניו.
השוויון המופיע בהגדרת תכונת מרקוב אומנם מתקיים ביום שני בשבוע הראשון (ובאופן טריוויאלי גם ביום ראשון, ובכל הימים שלאחר השבוע הראשון), אך מיום שלישי ועד ליום שבת בשבוע הראשון הוא מופר. למשל, ההסתברות שיום שבת יהיה גשום בהינתן שיום שישי היה גשום היא . בעוד שההסתברות לכך שיום שבת יהיה גשום בהינתן שמיום ראשון ועד יום שישי היה גשום, היא , שזה יותר מ-99.9%.
בתהליך זה, בניגוד לתהליכים מרקוביים, משתלם לזכור את ההיסטוריה גם מעבר למצב הנוכחי - המידע הנוסף (על מזג האוויר מיום ראשון עד יום חמישי) מחדד את הניבוי לגבי מזג האוויר ביום שבת. במצב זה ישנם גורמים נסתרים, שאינם מתבטאים במלואם במצב מזג האוויר של יום שישי, ומשפיעים על מזג האוויר ביום שבת.
שימושים לשרשראות מרקוב
עריכהשרשראות מרקוב משמשות במגוון רב של תחומים ובפרט במדע ובמתמטיקה. ניתן למצוא שימושים של שרשראות מרקוב בפיזיקה סטטיסטית, כימיה, ביולוגיה ותורת התורים
דוגמאות למודלים אשר מהווים שרשראות מרקוב:
בפיזיקה
עריכה- מודל ארנפסט:
מודל המתאר את הדיפוזיה של חלקיקים בין שני מיכלים זהים. המודל מתאר זאת כתהליך לידה ומוות מרקובי בעל מצבים וההנחה שלכל היותר מעבר יחיד מתרחש בכל צעד. הסתברות המעבר מהמצב ה למצב ה היא והסתברות המעבר מהמצב ה למצב ה היא כאשר הוא קצב החלפת המיכל של חלקיק.
כאשר אנחנו במצב שיווי משקל התהליך הפיך ולכן נדרוש קיום של תנאי האיזון המפורט. כלומר ש נקבל ש ממשוואה זו נקבל באינדוקציה כי
מכיוון שאנחנו דורשים שהווקטור יתאר התפלגות הסתברות נדרוש כי על ידי שימוש בנוסחא נקבל כי . כאשר ייצג את פרק הזמן היחסי שבו יהיו במיכל חלקיקים. באופן דומה ניתן להתייחס לכמות הכדורים בכל מיכל כאל טמפרטורת המיכל ובכך לקבל תיאור סטטיסטי של מעבר חום במקום תיאור קלאסי. עקב העובדה שהשרשרת במודל זה הם מחזוריים (בעלי מחזור 2) וקטור ההתפלגות אינו יתכנס להתפלגות הסטציונרית ללא תלות במצב ההתחלתי אלא יבצע תנודות סביבה. למרות זאת בשנת 1947 הוכיח מארק קארק כי עבור מצב התחלתי השונה ממצב שיווי המשקל מתקיים כי האנטרופיה מונוטונית עולה (תאוריית H). ובכך בעצם המודל מהווה הסבר לחוק השני של התרמודינמיקה ופותר את הפרדוקס הנוצר מההפיכות המיקרוסקופית הנובעת מחוקי ניוטון לבין החוק השני של התרמודינמיקה. מודל דומה נוסף הוא מודל ברנולי לפלס המאפשר מהלך ללא מעבר של חלקיקים בין המיכלים ובכך יוצרים שרשרת בלתי פריקה לא מחזורית ובכך מתקיים שוקטור ההתפלגות במודל זה יתכנס לוקטור ההתפלגות הסטציונרית ללא תלות במצב ההתחלתי. גם במודלים הללו האנטרופיה מקסימלית עבור ההתפלגות הסטציונרית והם מהווים הסבר לחוק השני. בנוסף במודלים הללו ניתן להשתמש בקשר על מנת להראות שתוחלת זמן החזרה למצבים הרחוקים ממצב שיווי משקל במערכות רב חלקיקיות גדולה בהרבה מהזמנים המאפיינים ניסויים ולהסיק מכך שניתן באופן פרקטי להתעלם ממשפט ההישנות של פואנקרה.[6]
- Markov chain Monte Carlo:
Markov chain Monte Carlo או בקצרה MCMC הם סוג של אלגוריתמים המיועדים לדגימת התפלגות הסתברות. על ידי יצירת שרשרת מרקוב בעלת התפלגות סטציונרית השווה לפונקציה ידועה הפרופורציונית להתפלגות ההסתברות ניתן לדגום את ההסתברות עצמה גם אם היא אינה ידועה ובאמצעות הדגימות ניתן לבצע קירוב של התפלגות ההסתברות. בנוסף ניתן להשתמש בדגימות על מנת להעריך גדלים אותם אנו מעוניינים לחשב.
דוגמה לצורך באלגוריתם מסוג זה היא בחישוב התפלגות בולצמן על ידי שימוש באלגוריתם מטרופוליס. ידוע שעבור מערכת קנונית ההסתברות של חלקיק להמצא במצב נתונה על ידי - כאשר . אם מספר המצבים האפשרים קטן, ניתן למצוא את Z על ידי סכימה ישירה, אך כיוון שמספר המצבים האפשרי גדל אקספוננציאלית כתלות במספר החלקיקים לרוב לא יהיה ניתן לבצע זאת. לעומת זאת ניתן להגדיר שרשרת מרקוב המקיימת עבור כאשר היא סביבת המצבים של אשר ההבדל בין המצבים הוא חלקיק יחיד. בדומה לאלגוריתם מונטה קרלו המצב ה יבחר באופן אחיד מתוך . לבסוף על מנת שהשרשרת תהיה לא מחזורית נגדיר . כעת בזכות העובדה שזוהי שרשרת מרקוב ניתן להבטיח שההתפלגות תשאף להתפלגות הסטציונרית ללא תלות בבחירה ההתחלתית ולכן ניתן לבחור מצב התחלתי כללי (על מנת לעשות זאת באופן נומרי צריך לספור את מספר הביקורים עבור כל מצב ולחלק במספר הביקורים הכולל בסך כל המצבים). בנוסף ניתן לראות שהתהליך שבחרנו הוא תהליך הפיך שכן תנאי האיזון המפורט מתקיים[7].
- שרשראות מרקוב בזמן רציף:
מודלים פיזקלים רבים מהווים למעשה שרשראות מרקוב בזמן רציף. עבור שרשראות מרקוב בזמן רציף ניתן לחשב - בהתאם לקצבי המעבר וההגעה את המטריצה היוצרת האינפיניטיסמלית ובאמצעותה להגיע למערכת משוואות דיפרנציאליות. מודלים מסוג זה כוללים את התנועה הבראונית ואת משוואת המסטר. על ידי מעבר לגבול הרצף (כלומר, הגבול בו המצבים הבדידים בשרשרת המרקוב הופכים לרציפים) ניתן לפתח מתוך משוואת המסטר את משוואות קולמגרוב ומשוואת פוקר פלאנק. בנוסף על ידי שימוש בתנאי האיזון המפורט עבור משוואת פוקר פלנק ניתן להסיק את יחס איינשטיין[8].
ראו גם
עריכהקישורים חיצוניים
עריכה- תהליכי מרקוב, דף שער בספרייה הלאומית
- אתר הקורס מבוא לתהליכים סטוכסטיים של שלומי רובינשטיין.
- פוסט על שרשראות מרקוב בבלוג "לא מדויק" של גדי אלכסנדרוביץ'
- בעיית המטריות: איך לא להירטב? - יוסי לוי - נסיכת המדעים
- פרק על שרשראות מרקוב בספר הסתברות של האגודה האמריקאית למתמטיקה (באנגלית)
- The World's Largest Matrix Computation (הדירוג של מנוע החיפוש גוגל מבוסס על חישוב ההתפלגות הסטציונרית של הילוך מקרי ברשת, באנגלית)
- שרשרת מרקוב, באתר MathWorld (באנגלית)
הערות שוליים
עריכה- ^ ד"ר שלומי רובינשטיין, מתוך סיכומי הקורס מבוא לתהליכים סטוכסטיים (עמ' 17)
- ^ ד"ר שלומי רובינשטיין, מתוך סיכומי הקורס מבוא לתהליכים סטוכסטיים (עמ' 30-34)
- ^ באופן פורמלי, תכונת מרקוב מתייחסת להתפלגות על סדרות אינסופיות לכיוון אחד. לכן, יש לתאר מראש את אופן הגרלת מצב מזג האוויר גם לימים שאחרי היום האחרון שבדגם. בדוגמה זו, יש צורך להניח שמהיום האחרון ואילך, בניית הדגם תיעשה קדימה בזמן.
- ^ למרות בניית הדגם "לאחור בזמן", הדגם בוחן את ההסתברויות למצב בכל יום בהינתן המצב ב'יום שלפניו'. הגדרת התכונה - כלומר אופן בניית הדגם, אינה מושפעת מסדר ההגרלה.
- ^ בדוגמה זו הסתברויות המעבר "אחורה" יכולות להשתנות עם הזמן, גם אם הסתברויות המעבר המקוריות, "קדימה", היו קבועות בזמן. למרות זאת, הדגם נחשב 'מרקובי'.
- ^ Eugene Seneta, Markov Chains as Models in Statistical Mechanics, Statistical Science 31, 2016-08, עמ' 399–414 doi: 10.1214/16-STS568
- ^ Richard Combes, Sampling-based optimization
- ^ [http://folk.uio.no/feder/Fys3130/LectureNotes/FokkerPlanck.pdf Fokker-Planck Equation with Detailed Balance]