התפלגות
בערך זה |
בסטטיסטיקה ותורת ההסתברות, התפלגות (לפי האקדמיה ללשון הִתְפַּלְּגוּת־הַהִסְתַּבְּרוּת[1] או באנגלית: probability distribution) היא מרכיב בסיסי בתיאור ההתנהגות של תופעה או תהליך שיש בהם היבטים אקראיים. מרחב ההסתברות מהווה את קבוצת כל התוצאות האפשריות של התהליך, וההתפלגות קובעת מהו הסיכוי של כל מאורע, ובכך מאפשרת להבדיל בין תהליכים אקראיים שונים המתרחשים באותו מרחב.
למשל, נוכל לבדוק גובהן של נשים בוגרות באוכלוסייה. כל מדידה של גובהה של אישה מסוימת, נקראת "מאורע". נמצא כי מאורעות שבהם נמדדים גבהים כמו 160 ס"מ או 165 ס"מ שכיחים למדי, ואילו מאורעות שבהם נמדדים גבהים כמו 180 ס"מ או 150 ס"מ שכיחים פחות.
אם למשתנה מקרי יש התפלגות עם פרמטרים: , נהוג לסמן זאת על ידי: .
מבחינה טכנית, התפלגות היא פונקציית מידת הסתברות המוגדרת על הקבוצות המדידות במרחב מדיד; קיומה של פונקציה כזו הופך את המרחב למרחב מידה שהוא למעשה מרחב הסתברות. במילים אחרות, ההתפלגות היא פונקציה, הקובעת את הסיכוי לכל מאורע אפשרי.
התפלגות בדידה והתפלגות רציפה
עריכהמבחינים בין שני סוגים עיקריים של התפלגויות:
- התפלגות בדידה – נוסחה או טבלה, המתאימה, לכל מאורע אפשרי, מספר חיובי בין 0 ל-1, שהוא ההסתברות של אותו מאורע. אם ההסתברות של מאורע מסוים קרוב ל-1, המאורע נחשב שכיח. אם הסתברות המאורע קרובה ל-0, המאורע נחשב נדיר.
- התפלגות רציפה – פונקציה המתאימה, לכל קטע ממשי, את ההסתברות של אותו קטע, באופן שמקיים את אקסיומות ההסתברות, וכך שההסתברות לכל נקודה היא אפס.
- קיימת גם התפלגות שאינה בדידה ואינה רציפה (או התפלגות שהיא בחלקה רציפה ובחלקה בדידה) – פונקציה המתאימה, לכל קטע ממשי, את ההסתברות של אותו קטע, באופן שמקיים את אקסיומות ההסתברות, וכך שקיימות נקודות שהסתברותן חיובית, אולם סכום הסתברויות אלה קטן מ־1.
את הסוג השני (והשלישי) אפשר להכליל להתפלגויות המוגדרות על מרחבים רב־ממדיים. ההתפלגות מתייחסת למשתנה מקרי, העשוי לקבל ערכים בקבוצה נתונה (סופית, או מוכלת בישר הממשי). במקרה הראשון, ההתפלגות מתארת את הסיכויים לכל תופעה מן הסוג . במקרה השני, ההתפלגות של המשתנה מתארת בקטע את ההסתברות , כלומר, ההסתברות לכך שהמשתנה יקבל ערך בקטע .
פונקציית הצטברות של משתנה ממשי
עריכהכל משתנה מקרי המקבל ערכים ממשיים, מאפשר להגדיר פונקציית הצטברות (או "פונקציית התפלגות מצטברת"), לפי הנוסחה . הפונקציה מתארת את הסיכוי למאורע , כאשר הוא מספר ממשי, ולכן היא מונוטונית עולה עם . מאידך, פונקציית ההצטברות מאפשרת לחשב את הסיכוי לכך שהמשתנה ייפול בקטע נתון, וכך קשורות התכונות שלה באופן הדוק לתכונות של המשתנה המקרי.
עבור משתנה מקרי בדיד, המקבל מספר בן מנייה של ערכים, פונקציית ההצטברות היא קבועה למקוטעין. התפלגות נקראת רציפה אם פונקציית הצטברות ההסתברות שלה רציפה.
התפלגויות רציפות בהחלט הן כאלה שניתן לבטא באמצעות פונקציית צפיפות , על ידי אינטגרל: (ישנן התפלגויות רציפות שאינן רציפות בהחלט, ראו פונקציה סינגולרית). הפונקציה נדרשת להיות מוגדרת על הממשיים, אי־שלילית, אינטגרבילית לפי לבג, ולקיים את התנאי . במקרה כזה , ומכאן שפונקציית ההצטברות נדרשת להיות פונקציה גזירה, ולא סתם רציפה.
התומך של התפלגות היא הקבוצה הסגורה הקטנה ביותר שלמשלים שלה הסתברות אפס (מידה אפס).
רשימת התפלגויות חשובות
עריכהלכמה התפלגויות שהן בעלות חשיבות תאורטית או מעשית רבה יש שמות:
- התפלגויות בדידות
- בעלות תומך סופי
- ההתפלגות המנוונת ב־ , שבה מקבל בוודאות את הערך . התפלגות זו אמנם אינה אקראית, אך היא עונה על ההגדרה של משתנה מקרי. התפלגות זו מאפשרת לראות קבועים כמקרה פרטי של משתנים מקריים.
- ההתפלגות האחידה הבדידה, שבה לכל האיברים בקבוצה סופית הסתברות שווה. זו אמורה להיות ההתפלגות של מטבע הוגן, קובייה הוגנת, רולטה או חפיסת קלפים שנטרפה היטב. כמו כן, ניתן להשתמש במדידות של מצבים קוונטיים כדי לייצר משתנים מקריים אחידים. אולם כל אלה הם מכשירים פיזיים או מכניים, הסובלים מפגמים והפרעות, כך שההתפלגות האחידה היא רק קירוב של התנהגותם. במחשבים ספרתיים, סדרות פסאודו-אקראיות משמשות ליצירת התפלגות בדידה אחידה אקראית מבחינה סטטיסטית.
- התפלגות ברנולי, שבה הערך 1 מתקבל בהסתברות והערך 0 בהסתברות .
- ההתפלגות הבינומית, שמתארת את מספר ההצלחות בסדרה סופית של ניסויי כן/לא בלתי תלויים.
- ההתפלגות ההיפרגאומטרית, שמתארת את מספר ההצלחות ב־ הניסויים הראשונים מתוך סדרה של ניסויי כן/לא, כאשר מספר ההצלחות הכולל בסדרה ידוע.
- בעלות תומך אינסופי
- ההתפלגות הגאומטרית, שמתארת את מספר הניסיונות הדרושים לקבלת ההצלחה הראשונה בסדרה של ניסויי כן/לא בלתי תלויים.
- התפלגות בינומית שלילית, הכללה של ההתפלגות הגאומטרית להצלחה ה־ .
- התפלגות פואסון, שמתארת את מספר המאורעות הנדירים שהתרחשו בפרק זמן מסוים.
- בעלות תומך סופי
- התפלגויות רציפות
- בעלות קטע סופי כתומך
- ההתפלגות האחידה הרציפה על , שבה כל הנקודות בקטע סופי הן שוות־סיכוי.
- התפלגות בטא על , שההתפלגות האחידה הרציפה על היא מקרה פרטי שלה, ושיש לה שימושים בהערכת סיכויי הצלחה.
- ההתפלגות המשולשת על .
- בעלות קרן כתומך, בדרך כלל
- ההתפלגות המעריכית, המתארת את משך הזמן בין מאורעות אקראיים נדירים.
- התפלגות גמא, המתארת את הזמן עד התרחשותו של המאורע הנדיר ה־ י. (ראו גם התפלגות ארלנג)
- התפלגות כי בריבוע, שהיא סכום הריבועים של משתנים נורמליים בלתי תלויים. התפלגות זו היא מקרה פרטי של התפלגות גמא. משמשת כמבחן כמותי לטיב ההתאמה בין אוסף מדידות ובין פונקציה אנליטית שאמורה לתאר את התנהגות הגודל הנמדד.
- ההתפלגות הלוג־נורמלית, המתארת משתנים שניתנים להצגה כמכפלה של הרבה משתנים קטנים בלתי תלויים חיוביים.
- התפלגות וייבול, שההתפלגות המעריכית היא מקרה פרטי שלה, משמשת כמודל למשך חייהם של מכשירים טכניים.
- התפלגות F, שהיא ההתפלגות של היחס בין שני משתנים נורמליים, המשמשת בניתוח שונות.
- התפלגות בולצמן, שיש לה חשיבות בפיזיקה סטטיסטית, המתארת את ההסתברויות של רמות אנרגיה שונות במערכת שנמצאת בשיווי משקל תרמי. בין המקרים פרטיים:
- התפלגות זטא, שיש לה שימושים בסטטיסטיקה שימושית ובמכניקה סטטיסטית, ושעשויה לעניין חוקרים בתורת המספרים.
- בעלות תומך שהוא כל הישר הממשי
- ההתפלגות הנורמלית, הקרויה גם התפלגות גאוסיאנית או עקומת פעמון. היא שכיחה מאוד בטבע ובסטטיסטיקה הודות למשפט הגבול המרכזי; כל משתנה שניתן להצגה כסכום של הרבה משתנים קטנים בלתי תלויים הוא נורמלי בקירוב.
- התפלגות t של סטודנט, השימושית באומדן ממוצעים לא ידועים של אוכלוסיות גאוסיאניות.
- התפלגות קושי, דוגמה להתפלגות שאין לה תוחלת או שונות. בפיזיקה היא נקראת בדרך כלל התפלגות לורנץ, והיא התפלגות האנרגיה של מצב בלתי יציב במכניקת הקוונטים.
- בעלות קטע סופי כתומך
ראו גם
עריכהמונחים קשורים בתורת הסתברות:
- הסתברות
- משתנה מקרי
- פונקציית הצטברות, נקראת גם "פונקציית התפלגות מצטברת"
- פונקציית צפיפות, או "פונקציית צפיפות הסתברות"
- נראות
מונחים קשורים בתורת המידה:
קישורים חיצוניים
עריכה- התפלגות, באתר MathWorld (באנגלית)
- חלוקה (תורת ההסתברות), דף שער בספרייה הלאומית
הערות שוליים
עריכה