שכיח – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
אין תקציר עריכה
שורה 19:
 
==השוואה למדדי מרכז אחרים==
[[Imageקובץ:Comparison mean median mode.svg|thumbממוזער|300px|Comparison of [[mean]], [[median]] and mode of two [[log-normal distribution]]s with different [[skewness]].]]
 
הטבלה הבאה מדגימה ששלושת [[מדד מיקום|מדדי המיקום]] המרכזיים אינם חייבים להסכים זה עם זה:
שורה 32:
| שכיח || הערך הנפוץ ביותר במדגם || 1,'''2''','''2''',3,4,7,9 || 2
|}
 
 
בניגוד ל[[ממוצע]] ול[[חציון]], המושג "שכיח" הגיוני וישים גם על [[סולם מדידה|ערכים שמיים]]. למשל, אם ה[[מדגם]] הוא של [[שם משפחה יהודי|שמות משפחה]] ב[[ישראל]], והשם "[[משפחות כהן|כהן]]" מופיע הכי הרבה פעמים, השכיח יהיה "[[משפחות כהן|כהן]]". מובן שבדגימה כזו לא ניתן לחשב [[ממוצע]] או [[חציון]]. במערכת בחירות שבה המנצח נקבע על פי הרוב, המנצח הוא השכיח. שני שכיחים ומעלה ידרשו תהליך שובר שוויון. בניגוד ל[[חציון]], שהגיוני להשתמש בו רק כאשר יש סדר לינארי בין הערכים האפשריים, השכיח אינו דורש זאת- בכל מדגם יש משמעות למושג זה.
שורה 42 ⟵ 41:
 
פונקציית ההפסד בעצם מתארת בכתיב מתמטי את המקרה הבא: בכל פעם בוחרים ערך אקראי מהרשימה. המטרה היא לנחש אותו, כאשר "ניצחון" הוא ניחוש נכון של הערך ו"הפסד" הוא כל ניחוש שאינו נכון. אנו מעוניינים "לנצח" כמה שיותר פעמים באמצעות שימוש באותו המספר. באיזה מספר עדיף לבחור? בשכיח כמובן. זהו הערך שאיתו נצא עם מספר ה"הפסדים" הקטן ביותר.
 
 
== ראו גם ==