פונקציית נראות

(הופנה מהדף נראות (סטטיסטיקה))

בסטטיסטיקה, פונקציית הנראות (או באופן פשוט הנראות) היא פונקציה של הפרמטרים של מודל סטטיסטי אשר תלויה בנתונים. הנראות של קבוצת ערכי פרמטרים, θ, בהינתן קבוצת תצפיות X, שווה להסתברות המשותפת של אותן תצפיות בהינתן ערכי קבוצת הפרמטרים. כלומר, .

פונקציות נראות משחקות תפקיד מפתח בהסקה סטטיסטית, במיוחד בשיטות שמבצעות אמידה של פרמטר מתוך קבוצה של סטטיסטים. בהקשרים לא פורמליים, משתמשים לרוב במילה "נראות" בתור מילה נרדפת ל"הסתברות". אבל בשימוש סטטיסטי, ישנה הבחנה על פי התפקידים של התצפיות או של הפרמטרים שאותם אומדים. המילה הסתברות באה לידי ביטוי כאשר מתארים פונקציה של התצפיות בהינתן פרמטר שנקבע מראש. לדוגמה, אם מטילים מטבע הוגן 10 פעמים, מה ההסתברות שיצא עץ בכל ההטלות? לעומת זאת, במילה נראות משתמשים כאשר מתארים פונקציה של פרמטר נתון בהינתן אוסף תצפיות. לדוגמה, אם הטלנו מטבע 10 פעמים ויצא לנו בכל ההטלות עץ, מהי הנראות (או הסבירות) שהמטבע הוא הוגן?

הגדרה

עריכה

פונקציית הנראות מוגדרת באופן שונה עבור מרחב הסתברות בדיד ועבור מרחב הסתברות רציף.

מרחב הסתברות בדיד

עריכה

יהי   משתנה מקרי במרחב הסתברות בדיד עם פונקציית הסתברות   המותנה בפרמטר אותו אנו רוצים לאמוד  . אז הפונקציה:

 

היא פונקציה של  , ונקראת פונקציית הנראות של   בהינתן אוסף נתונים   שמתקבל על ידי המשתנה המקרי X. לפעמים, ההסתברות של הערך x שמקבל X עבור הפרמטר   נכתבת  ; לעיתים קרובות נרשום   לומר שערך זה הוא אינו הסתברות מותנית, כיוון ש-  הוא פרמטר ולא משתנה מקרי.

מרחב הסתברות רציף

עריכה

יהי   משתנה מקרי במרחב הסתברות רציף עם פונקציית צפיפות   המותנה בפרמטר אותו אנו רוצים לאמוד  . אז הפונקציה:

 

היא פונקציה של  , ונקראת פונקציית הנראות של   בהינתן אוסף נתונים   שמתקבל על ידי המשתנה המקרי X. לפעמים, פונקציית הצפיפות של ערך x מתוך X מסומנת על ידי   אבל לא אמורה להיחשב כפונקציית צפיפות מותנית.

לוג נראות

עריכה

עבור יישומים רבים, הלוגריתם הטבעי של פונקציית הנראות הנקרא "לוג–נראות", יותר נוחה לעבודה. פונקציית הלוגריתם היא פונקציה מונוטונית עולה, ולכן הלוגריתם של פונקציה מקבל ערך מקסימלי באותן נקודות כשל הפונקציה עצמה, ולכן הלוג-נראות יכולה לשמש (ואף קלה יותר לשימוש) במקום נראות באמידת נראות מקסימלית ובטכניקות דומות. מציאת מקסימום של פונקציה לרוב כרוך בלקיחת הנגזרת של פונקציה ופתרון עבור מקסום הפרמטר, במקרים רבים זה קל יותר כשהפונקציה שממקסמים היא לוג-נראות מאשר פונקציית הנראות המקורית.

לדוגמה, פונקציות נראות מסוימות הן עבור הפרמטרים המסבירים אוסף של תצפיות בלתי תלויות הסתברותית. במקרה זה, פונקציית הנראות מסתכמת למכפלה של פונקציות נראות אינדיבידואליות. לוגריתם של המכפלה הזאת הוא סכום של לוגריתמים של הפונקציות הנפרדות, והנגזרת של סכום היא במקרים רבים קלה יותר לחישוב מנגזרת של מכפלה. בנוסף, למספר התפלגויות נפוצות יש פונקציית נראות המכילה מכפלה של גורמים המכילים אקספוננטים. לוגריתם של פונקציה כזו, הוא סכום של מכפלות, ושוב קל יותר לגזירה מאשר הפונקציה המקורית.

בפילוגנטיקה, יחס הלוג-נראות לעיתים נקרא "תומך" ופונקציית לוג-נראות נקראת "פונקציית התומך". לעומת זאת, לאור פוטנציאל הבלבול הגבוה עם המשמעות המתמטית של תמיכה, טרמינולוגיה זו לרוב לא בשימוש בתחום זה.

היסטוריה

עריכה

המושג האנגלי המקביל לנראות הוא likelihood, בתרגום מילולי "סבירות". מושג זה שימש להערכת רמת האמונה המיוחסת להשערות שונות על פי מידע חלקי, בתחומים כגון משפט והימורים, ללא הגדרה מתמטית פורמלית.

ההבחנה בין "נראות" שהיא פונקציה של פרמטר או השערה, לעומת "הסתברות" שהיא פונקציה של מאורע או תצפית, נקבעה על ידי רונלד פישר בספרו "על היסודות המתמטיים של התאוריה הסטטיסטית" מ-1922.[1] בספר זה הוצגה גם שיטת האמידה לפי נראות מקסימלית, שהיא אחד הכלים המרכזיים בהסקה סטטיסטית.

ראו גם

עריכה

קישורים חיצוניים

עריכה

הערות שוליים

עריכה
  1. ^ Fisher, Ronald Aylmer (1922). "018: On the Mathematical Foundations of Theoretical Statistics". Philosophical Transactions of the Royal Society, A. 222: 309–368.