נראות מקסימלית

שיטה בסטטיסטיקה

שיטת הנראות המקסימלית (או הנראות המרבית) היא שיטה נפוצה בסטטיסטיקה להתאמת מודל סטטיסטי לנתונים, כלומר היא משמשת במסגרת אמידה פרמטרית למציאת אומד לפרמטר המאפיין את המודל. למשל, במקרה שבו נתון שמשתנה מקרי הוא בעל התפלגות נורמלית אלא שהתוחלת שלו אינה ידועה, גישה זו מספקת דרך למציאת אומדן לתוחלת.

באופן אינטואיטיבי הגישה אומרת שכדי לנבא היטב את הפרמטר האמיתי על-סמך מדגם מקרי מסוים, יש לבדוק איזה פרמטר מתוך כל האפשרויות הוא זה ש"יסביר" בצורה הטובה ביותר את המדגם. כלומר אומד הנראות המרבית הוא הפרמטר שאילו היינו מציבים בפונקציית ההתפלגות מראש, הוא היה נותן את ההסתברות הגבוהה ביותר לקבל את המדגם שאכן התקבל, ובכך ממקסם את פונקציית הנראות. ההנחה כי הדוגמאות במדגם הן בלתי-תלויות ושוות-התפלגות מפשטת מאוד את הניתוח המתמטי ואת האופטימיזציה של פונקציית הנראות.

מקובל לסמן את הנראות המקסימלית באותיות MLE, ראשי תיבות של Maximum Likelihood Estimation.

פונקציית הנראות

עריכה
  ערך מורחב – פונקציית נראות

נניח כי   מדגם בלתי תלוי המפולג עם פונקציית הצפיפות   (כל הדוגמאות שוות התפלגות), וכי הדוגמאות בלתי-תלויות, כלומר הן מייצגות משתנים מקריים בלתי-תלויים ושווי-התפלגות. פונקציית הנראות (likelihood; מסומנת לעיתים כ- ) של המדגם היא הצפיפות המשותפת:  

כאשר   הוא פרמטר (או פרמטרים) של המודל או של פונקציית הצפיפות.

לעיתים נעשה שימוש בנראות הממוצעת   המציינת את תוחלת הנראות לדוגמה יחידה.

אומד הנראות המרבית

עריכה

נרצה למצוא את הערך שממקסם את פונקציית הנראות ( ), הנקרא אומד הנראות המרבית. נהוג להשתמש בלוגריתם שאיתו בדרך כלל נוח יותר לעבוד (הודות לגזירה פשוטה יותר וליציבות נומרית), ומאחר שהלוגריתם הוא פונקציה מונוטונית עולה, הערך שימקסם את לוג הנראות (log-likelihood) ימקסם גם את הנראות. למציאת הערך המרבי נשתמש ב- , נגזור ונשווה לאפס:

 

מתוך המשוואה המתקבלת מחלצים את ערך הנעלם  , והוא זה שממקסם את פונקציית הנראות. ערך זה הוא אומד הנראות המרבית לפרמטר הנאמד  .

דוגמאות

עריכה

התפלגות נורמלית

עריכה

בהנחה שגובהן של ג'ירפות מתפלג נורמלית, ניתן לאמוד את ערך התוחלת והשונות באמצעות נראות מקסימלית על מדגם הג'ירפות שבגן החיות, שכן אין באפשרותנו למדוד את גובהן של כל הג'ירפות בעולם. אם נניח כי הג'ירפות בגן החיות מהוות מדגם מקרי של n ג'ירפות מאוכלוסיית הג'ירפות בעולם,  , נוכל לאמוד את הפרמטרים   ו-  (התוחלת והשונות) של ההתפלגות באמצעות אומדי נראות מקסימליים כלהלן.

עבור התוחלת:

 

ועבור השונות:

 

כאשר   הוא ממוצע המדגם.

התפלגות אחידה

עריכה
  ערך מורחב – בעיית הטנק הגרמני

במקרה שבו קלפים ממוספרים 1 עד n מוכנסים לתיבה ואחד נבחר בהתפלגות אחידה; ובהתאם גודל הדגימה הוא 1. אם n אינו ידוע, אומד הנראות המקסימלית שלו   הוא המספר m הכתוב על הקלף שנבחר (ההסתברות ש-n הוא קטן מ־m היא אפס, עבור   ההסתברות היא  , והיא הגבוהה ביותר כאשר  ). התוחלת של הוצאת הקלף m, ובהתאם התוחלת של   היא  . מסיבה זו עבור דגימה בגודל 1, אומד הנראות המרבית ל-n יעריך (בתוחלת) את n פחות ממה שהוא ב .

תכונות אומד נראות מקסימלית

עריכה
  • עקיבות: תחת תנאי רגולריות מסוימים, כאשר גודל המדגם שואף לאינסוף, האומד מתכנס בהסתברות לערכו האמיתי של הפרמטר. זוהי תכונה חשובה שמאפשרת לנו למעשה לאמוד את הפרמטר בכל רמת דיוק שנרצה.
  • אינווריאנטיות פונקציונלית: אם   הוא אומד נראות מקסימלית של פרמטר  , ו-  היא פונקציה כלשהי אז   הוא אומד נראות מקסימלית לפרמטר  .[1]

יישומים

עריכה

אומד נראות מקסימלית משמש למגוון רחב של מודלים סטטיסטיים, כולל:

שימושים אלה עולים במגוון רחב של תחומים, כגון:

ראו גם

עריכה

קישורים חיצוניים

עריכה
  מדיה וקבצים בנושא נראות מקסימלית בוויקישיתוף

הערות שוליים

עריכה
  1. ^ אם g אינה פונקציה חד-חד-ערכית, אז פונקציית הנראות שלה   מוגדרת כמקסימום על פני כל ערכי   עבורם  , כלומר:  , והמשמעות של אומד נראות מרבית במקרה זה היא בהתאם.