שכיח – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ שוחזר מעריכות של 77.139.2.224 (שיחה) לעריכה האחרונה של KotzBot
מ הסרת קישורים עודפים
שורה 1:
ב[[סטטיסטיקה]], ה'''שכיח''' הוא הערך בעל ה[[שכיחות]] הגבוהה ביותר בקבוצת נתונים. במילים אחרות, זהו הערך שהופיע ב[[מדגם]] יותר פעמים מכל ערך אחר.
 
כמו ה[[ממוצע]] וה[[חציון]], השכיח משמש כאמצעי להבעת מידע חשוב על משתנה מקרי או אוכלוסייה באמצעות מספר בודד. יתרונו המשמעותי של השכיח על שאר מדדי המרכז, כמו הממוצע והחציון, הוא שהוא מוגדר גם למשתנה בעל [[סולם מדידה|ערכים שמיים]].
שורה 33:
|}
 
בניגוד ל[[ממוצע]] ול[[חציון]], המושג "שכיח" הגיוני וישים גם על [[סולם מדידה|ערכים שמיים]]. למשל, אם ה[[מדגם]] הוא של [[שם משפחה יהודי|שמות משפחה]] ב[[ישראל]], והשם "[[משפחות כהן|כהן]]" מופיע הכי הרבה פעמים, השכיח יהיה "[[משפחות כהן|כהן]]". מובן שבדגימה כזו לא ניתן לחשב [[ממוצע]] או [[חציון]]. במערכת בחירות שבה המנצח נקבע על פי הרוב, המנצח הוא השכיח. שני שכיחים ומעלה ידרשו תהליך שובר שוויון. בניגוד ל[[חציון]]לחציון, שהגיוני להשתמש בו רק כאשר יש סדר ליניארי בין הערכים האפשריים, השכיח אינו דורש זאת- בכל מדגם יש משמעות למושג זה.
 
== פונקציית ההפסד ==
השכיח של מדגם מוגדר כערך שמספר הערכים השונים ממנו הוא הקטן ביותר. במילים אחרות, השכיח הוא הממזער של פונקציית ההפסד הבאה:
 
<math>L_0(m)=\sum_{i=1}^n I_{m}(X_i)</math> כאשר <math>I_m(X_i)=\begin{cases} 1 & \text{if }m=X_i \\ 0 & \text{else} \end{cases}</math>.
 
פונקציית ההפסד בעצם מתארת בכתיב מתמטי את המקרה הבא: בכל פעם בוחרים ערך אקראי מהרשימה. המטרה היא לנחש אותו, כאשר "ניצחון" הוא ניחוש נכון של הערך ו"הפסד" הוא כל ניחוש שאינו נכון. אנו מעוניינים "לנצח" כמה שיותר פעמים באמצעות שימוש באותו המספר. באיזה מספר עדיף לבחור? בשכיח כמובן. זהו הערך שאיתו נצא עם מספר ה"הפסדים" הקטן ביותר.
 
== ראו גם ==