שכיח – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
כובש המלפפונים (שיחה | תרומות) מ שוחזר מעריכות של 77.139.2.224 (שיחה) לעריכה האחרונה של KotzBot |
מ הסרת קישורים עודפים |
||
שורה 1:
ב[[סטטיסטיקה]], ה'''שכיח''' הוא הערך בעל ה[[שכיחות]] הגבוהה ביותר בקבוצת נתונים. במילים אחרות, זהו הערך שהופיע ב[[מדגם]] יותר פעמים מכל ערך אחר.
כמו ה[[ממוצע]] וה[[חציון]], השכיח משמש כאמצעי להבעת מידע חשוב על משתנה מקרי או אוכלוסייה באמצעות מספר בודד. יתרונו המשמעותי של השכיח על שאר מדדי המרכז, כמו הממוצע והחציון, הוא שהוא מוגדר גם למשתנה בעל [[סולם מדידה|ערכים שמיים]].
שורה 33:
|}
בניגוד ל[[ממוצע]] ול[[חציון]], המושג "שכיח" הגיוני וישים גם על [[סולם מדידה|ערכים שמיים]]. למשל, אם ה[[מדגם]] הוא של [[שם משפחה יהודי|שמות משפחה]] ב[[ישראל]], והשם "[[משפחות כהן|כהן]]" מופיע הכי הרבה פעמים, השכיח יהיה "[[משפחות כהן|כהן]]". מובן שבדגימה כזו לא ניתן לחשב
== פונקציית ההפסד ==
השכיח של מדגם מוגדר כערך שמספר הערכים השונים ממנו הוא הקטן ביותר. במילים אחרות, השכיח הוא הממזער של פונקציית ההפסד הבאה:
<math>L_0(m)=\sum_{i=1}^n I_{m}(X_i)</math> כאשר <math>I_m(X_i)=\begin{cases} 1 & \text{if }m=X_i \\ 0 & \text{else} \end{cases}</math>.
פונקציית ההפסד בעצם מתארת בכתיב מתמטי את המקרה הבא: בכל פעם בוחרים ערך אקראי מהרשימה. המטרה היא לנחש אותו, כאשר "ניצחון" הוא ניחוש נכון של הערך ו"הפסד" הוא כל ניחוש שאינו נכון. אנו מעוניינים "לנצח" כמה שיותר פעמים באמצעות שימוש באותו המספר. באיזה מספר עדיף לבחור? בשכיח כמובן. זהו הערך שאיתו נצא עם מספר ה"הפסדים" הקטן ביותר.
== ראו גם ==
|