הסתברות פוסטריורית

הסתברות פוסטריורית היא מושג מרכזי בסטטיסטיקה בייסיאנית. המייצגת את ההסתברות, או ההתפלגות, שמתקבלת מעדכנים את ההסתברות הפריורית על סמך מידע המתקבל מתצפיות.[1]

העדכון נעשה על ידי שימוש בכלל בייס.[2] הההסתברות הפוסטריורית עשויה לשמש כהסתברות פריורית במהלך נוסף של עדכון בייסיאני.[3]

הגדרה בהקשר של התפלגות

עריכה

בסטטיסטיקה בייסיאנית, הפרמטרים של המודל, שיסומנו ב-  , הם בעצמם משתנים מקריים. ההתפלגות הפריורית שלהם, כלומר ההתפלגות שלהם בהיעדר כל מידע מוקדם, תסומן ב   .

ההסתברות הפוסטריורית היא ההסתברות של הפרמטרים   בהינתן תצפיות  , ומסומנת   .

לעומת זאת, פונקציית הנראות היא ההסתברות של התצפיות בהינתן הפרמטרים של המודל, כלומר   .

בהינתן הסתברות פריורית   וכי ההסתברות לתצפיות   היא  , אז ההסתברות הפוסטריורית מוגדרת באמצעות כלל בייס[4]

  .

כלומר, ההסתברות הפוסטריורית פרופורציונית לפונקציית הנראות המוכפלת בהסתברות הפריורית.[5]  הוא קבוע הנירמול המחושב על ידי

 

אם   היא פרמטר רציף, או על ידי סיכום של   על כל הערכים האפשריים של  , אם   הוא פרמטר בדיד.[6]

דוגמה 1 - התפלגות פוסטריורית של פרמטר במודל בינומי

עריכה

נניח שרוצים למצוא מהו הסיכוי   שבהטלת מטבע מסוים, לא בהכרח מטבע הוגן, הוא ייפול על עץ. כדי לאמוד את הערך של   מבצעים סדרה של הטלות, ונניח ש-m פעמים הוא נפל על עץ, ו-n פעמים על פלי. נסמן ב X את סדרת התוצאות הללו. בהנחה שההטלות בלתי תלויות זו בזה, אז בהינתן מודל שבו ההסתברות לנפילה על עץ בהטלה בודדת היא  , ההסתברות לסדרת התוצאות X היא  את האמונה הראשונית שלנו, שמטבעות הם בדרך כלל הוגנים, ניתן לנסח באמצעות פונקציית צפיפות הסתברות פריורית על הפרמטר   . למען ההמחשה אפשר לבחור בהתפלגות הפריורית בפונקציה  להתפלגות פריורית זו מקסימום ב   והיא סימטרית סביב נקודה זו. כעת ההתפלגות הפוסטריורית של   היא כאשר   היא פונקציית בטא.[7]

דוגמה 2 - התפלגות פוסטריורית של פרמטר בהתפלגות נורמלית

עריכה

ניח   הם משתנים מקריים בלתי תלויים שווי התפלגות בעלי התפלגות נורמלית  , כאשר התוחלת   אינה ידועה והשונות   נתונה. נניח גם כי צפיפות ההתפלגות הפריורית של   היא   כאשר   ו   נתונים. נסמן ב   את ווקטור המשתנים המקריים   ונסמן ב   את ערכי התצפית שלהם. אם נתעלם מכל הגורמים שאינם תלויים ב  , ההסתברות הפריורית המוכפלת בנראות היא מהצורה  באמצעות השלמה לריבוע נקבל  כאשר   וכאשר   ו   הם קבועים שאינם תלויים ב   (אך תלויים ב  ), ו   ו   הם ולסיכום ההתפלגות הפוסטריורית היא התפלגות נורמלית עם תוחלת   ועם שונות   

ניתן לראות כי בגבול   מתקבלות התוצאות המצופות ממדגם גדול,   ו   .[7]

חישוב

עריכה

ניתן לחשב את התפלגות ההסתברות הפוסטריורית של משתנה מקרי אחד בהינתן ערכו של אחר באמצעות משפט בייס על ידי הכפלת התפלגות ההסתברות הפריורית בפונקציית הנראות, ולאחר מכן חלוקה בקבוע הנירמול, באופן הבא:

 

נותן את פונקציית צפיפות ההסתברות הפוסטריורית עבור משתנה מקרי  , בהינתן שהמשתנה המקרי   מקבל ערך ספציפי  , כאשר

  •   היא הצפיפות הפריורית של   ,
  •   היא פונקציית הנראות של   כפונקציה של   ,
  •   הוא קבוע הנירמול, ו
  •   היא הצפיפות הפוסטריורית של   בהינתן  .[8]

סיווג (קלסיפיקציה)

עריכה

בסיווג, הסתברות פוסטריורית משקפת את חוסר הוודאות של הערכת תצפית למחלקה מסוימת. בעוד שהפלט של שיטות סיווג סטטיסטיות הוא בהגדרה הסתברות פוסטריורית, שיטות של למידת מכונה לעיתים קרובות אינן מספקת הערכות הסתברותיות אמינות.[9]

הערות שוליים

עריכה
  1. ^ Press, S. James (1989). "Approximations, Numerical Methods, and Computer Programs". Bayesian Statistics : Principles, Models, and Applications. New York: John Wiley & Sons. pp. 69–102. ISBN 0-471-63729-7.
  2. ^ Lambert, Ben (2018). "The posterior – the goal of Bayesian inference". A Student's Guide to Bayesian Statistics. Sage. pp. 121–140. ISBN 978-1-4739-1636-4.
  3. ^ Etz, Alex (2015-07-25). "Understanding Bayes: Updating priors via the likelihood". The Etz-Files (באנגלית). נבדק ב-2022-08-18.
  4. ^ Christopher M. Bishop (2006). Pattern Recognition and Machine Learning. Springer. pp. 21–24. ISBN 978-0-387-31073-2.
  5. ^ Ross, Kevin. Chapter 8 Introduction to Continuous Prior and Posterior Distributions | An Introduction to Bayesian Reasoning and Methods.
  6. ^ Andrew Gelman, John B. Carlin, Hal S. Stern, David B. Dunson, Aki Vehtari and Donald B. Rubin (2014). Bayesian Data Analysis. CRC Press. p. 7. ISBN 978-1-4398-4095-5.{{cite book}}: תחזוקה - ציטוט: multiple names: authors list (link)
  7. ^ 1 2 G. A. Young , R. L. Smith, Essentials of Statistical Inference, US: Cambridge University Press, 2005
  8. ^ "Posterior probability - formulasearchengine". formulasearchengine.com. נבדק ב-2022-08-19.
  9. ^ Boedeker, Peter; Kearns, Nathan T. (2019-07-09). "Linear Discriminant Analysis for Prediction of Group Membership: A User-Friendly Primer". Advances in Methods and Practices in Psychological Science (באנגלית). 2 (3): 250–263. doi:10.1177/2515245919849378. ISSN 2515-2459.