חציון – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
לשכתוב
אין תקציר עריכה
שורה 1:
ב[[סטטיסטיקה]], ה'''חציון''' (קרוי גם '''ה[[מאון]] ה-50''' או '''האחוזון ה-50''') הוא מדד מרכזי לקבוצתל[[סדר מלא|קבוצה סדורה של נתונים]] סדוריםחד-ממדיים. לפיהחציון הגדרתו,מוגדר החציוןלהיות הואערך הערך- הגם שאינו איבר בקבוצה - שחצי מהנתונים קטנים ממנו וחצי מהנתונים גדולים ממנו (אי-שוויון חלש). למשל החציון של הקבוצה {1,2,10} הוא 2. כאשר מספר הנתונים אי-זוגי הגדרת החציון פשוטה, אולם כאשר הוא אי-זוגי ההגדרה הופכתאינה גמישה יותרחד-משמעית. כך למשל ניתןנהוג לקבוע ששנישבמקרים הנתוניםכאלה המרכזייםהחציון הם חציוניים, ולחלופיןהוא שהממוצעהממוצע של שני הנתונים המרכזיים הוא החציון.
{{לשכתוב}}
 
[[חציון גאומטרי]] {{אנ|Geometric median}} הוא מדד מרכזי שמוגדר גם עבור קבוצות סדורות של נתונים רב-ממדיים.
ב[[סטטיסטיקה]], ה'''חציון''' (קרוי גם '''ה[[מאון]] ה-50''' או '''האחוזון ה-50''') הוא מדד מרכזי לקבוצת נתונים סדורים. לפי הגדרתו, החציון הוא הערך שחצי מהנתונים קטנים ממנו וחצי מהנתונים גדולים ממנו. כאשר מספר הנתונים אי-זוגי הגדרת החציון פשוטה, אולם כאשר הוא אי-זוגי ההגדרה הופכת גמישה יותר. כך למשל ניתן לקבוע ששני הנתונים המרכזיים הם חציוניים, ולחלופין שהממוצע של שני הנתונים המרכזיים הוא החציון.
 
לחציון תכונות משותפותמסוימות המשותפות עם ה[[ממוצע]], אולם הם שונים מהותית בהיבטים מסוימים. ההבדל המשמעותי ביניהם הוא בכך שהחציון מתעלם מ[[מטריקה]] על הנתונים ולוקח בחשבון רק את האינדקס שלהם. כך למשל בניגודהחציון לממוצע,של החציוןהקבוצה אינו{1,2,5} מושפעזהה כלללחציון מערכישל קצההקבוצה {1,2,10}, והדברעל אף שהממוצעים של שתי הקבוצות שונים מאוד. הדבר מהווה יתרון בהצגות מסוימות של נתונים שיש בהן תצפיות מועטות חריגות במיוחד, (כגון רמות [[משכורת|שכר]]).
 
==הגדרה פורמלית==
==הסבר אינטואיטיבי==
 
כמדד של קבוצת נתונים, יש לחציון כמה הגדרות מקובלות, שכולן מסכימות זו עם זושקולות אם הקבוצה כוללת מספר אי-זוגי של נתונים. במקרה זה, החציון שווה לערך המופיע במקום האמצעי לאחר סידור הנתונים. אם בקבוצה מספר זוגי של נתונים מסודרים, <math>\ a_1,\dots,a_n,a_{n+1},\dots,a_{2n}</math>, כל מספר שבין <math>\ a_n</math> ו- <math>\ a_{n+1}</math> עשוי להחשבלהיחשב כחציון, ולעתיםוכמור נהוג קרובותלרוב בוחריםלבחור את הממוצע שבין שני ערכים אלה.
כאשר נתונה קבוצת מספרים סופית, ניתן לסדר את האיברים בקבוצה לפי גודלם וכך ליצור סדרת מספרים. אם מספר האיברים הוא אי זוגי, החציון יהיה האיבר הממוקם בדיוק באמצע הסדרה. אם מספר האיברים הוא זוגי, החציון יהיה הממוצע של שני האיברים האמצעיים.
 
כאשר מדובר בנתונים מקובצים (למשל: כמה תלמידים קיבלו ציון עד 60, מ-שבין 61 ל- 70, וכן הלאה), החציון שייך לקבוצה שפחות ממחצית הנתונים מעליה, ופחות ממחצית הנתונים מתחתיה, אם יש כזו. במקרה כזה מקובל למקם את החציון כאילו הנתונים בקבוצה שאליה הוא שייך היו מתפלגים באופן אחיד, וכך מחלק החציון את ה[[היסטוגרמה]] לשתי מחציות שוות-שטח. אם לא קיימת קבוצה כנזכר למעלה, אז קיימת נקודת חיתוך בין שתי קבוצות, החוצה את הנתונים לשתי קבוצות שוות, ואז מקובל לקבוע אותה כחציון.
למשל, אם נתונה סדרת המספרים <math>\ 1,2,22,7,19,8 </math> - סדרה בת 6 מספרים, כל שעלינו לעשות כדי למצוא את החציון הוא לסדר את המספרים שוב, על פי גודלם: <math>\ 1,2,7,8,19,22 </math>. בסדרה הזו יש שני חציונים: 7 ו-8, משום ששניהם ממוקמים באמצע הסדרה. המספר 7 הינו חציון, מפני שהוא גדול או שווה ל-<math>\ 1,2,7</math>, וקטן או שווה ל-<math>\ 8,19,22</math>. גם 8 הינו חציון, מפני שהוא גדול או שווה ל-<math>\ 1,2,7</math> וקטן או שווה ל-<math>\ 8,19,22</math>.
 
חציון לא חייב להיות איבר בסדרה. בדוגמה זו, כל מספר בתחום <math>\ [7,8]</math> הוא חציון של הסדרה. למעשה, עבור כל סדרה באורך זוגי, שני המספרים האמצעיים המתקבלים כאשר רושמים את הסדרה בסדר ממוין הם חציונים, וכל מספר ביניהם הוא חציון. יש המגדירים את החציון כ[[ממוצע חשבוני]] של שני מספרים אלו.
 
בסדרה באורך אי זוגי יש חציון יחיד, הוא המספר האמצעי כאשר רושמים את הסדרה בסדר ממוין, למשל בדוגמה 1 למטה. ניתן להרחיב הגדרה זו גם עבור נתונים מקובצים.
 
==הגדרות פורמליות==
 
כמדד של קבוצת נתונים, יש לחציון כמה הגדרות מקובלות, שכולן מסכימות זו עם זו אם הקבוצה כוללת מספר אי-זוגי של נתונים. במקרה זה, החציון שווה לערך המופיע במקום האמצעי לאחר סידור הנתונים. אם בקבוצה מספר זוגי של נתונים מסודרים, <math>\ a_1,\dots,a_n,a_{n+1},\dots,a_{2n}</math>, כל מספר שבין <math>\ a_n</math> ו- <math>\ a_{n+1}</math> עשוי להחשב כחציון, ולעתים קרובות בוחרים את הממוצע שבין שני ערכים אלה.
 
כאשר מדובר בנתונים מקובצים (למשל: כמה תלמידים קיבלו ציון עד 60, מ- 61 ל- 70, וכן הלאה), החציון שייך לקבוצה שפחות ממחצית הנתונים מעליה, ופחות ממחצית הנתונים מתחתיה, אם יש כזו. במקרה כזה מקובל למקם את החציון כאילו הנתונים בקבוצה שאליה הוא שייך היו מתפלגים באופן אחיד, וכך מחלק החציון את ה[[היסטוגרמה]] לשתי מחציות שוות-שטח. אם לא קיימת קבוצה כנזכר למעלה, אז קיימת נקודת חיתוך בין שתי קבוצות, החוצה את הנתונים לשתי קבוצות שוות, ואז מקובל לקבוע אותה כחציון.
 
הגדרת החציון חלה, באופן כללי יותר, בכל מקרה שבו הנתונים [[קבוצה סדורה|סדורים]] [[סדר לינארי|באופן מלא]]. במקרה זה, חציון תמיד קיים (לפחות אחד) אם לכל חתך של הטווח של המשתנה המקרי (דהיינו, חלוקת הטווח לשתי קבוצות הממצות אותו ואשר כל איבר באחת גדול מכל אחד מאברי השנייה) יש לפחות קבוצה אחת המרכיבה אותו שיש לה איבר הקטן ביותר ואיבר הגדול ביותר.
שורה 35 ⟵ 25:
 
את הממוצע x של קבוצת מספרים <math>\ a_1,\dots,a_n</math> אפשר להגדיר כמספר (היחיד) שעבורו סכום הריבועים <math>\ (x-a_1)^2+\dots+(x-a_n)^2</math> הוא [[נקודת קיצון|הקטן ביותר]]. באופן דומה, מספר הממזער את סכום הערכים המוחלטים <math>\ |x-a_1|+\dots+|x-a_n|</math> נקרא '''חציון''' של הקבוצה. על-פי הגדרה זו, ישנם לקבוצה בגודל זוגי אינסוף ערכי חציון אפשריים (בדרך כלל); מקורות אחדים בוחרים אחד מן הערכים האלה להיות '''החציון''', כפי שהוצע לעיל בבחירת הממוצע של שני הערכים המרכזיים.
 
==דוגמאות==
 
# במדגם 3,7,11,20,21, החציון הוא הערך האמצעי - 11.
# במדגם 3,7,11,20,21,21 החציון הוא הממוצע שבין שני הערכים האמצעיים - 15.5.
# בהיסטוגרמה המתארת 12 ערכים בטווח 70-80, 30 ערכים בטווח 80-90, ו- 18 ערכים בטווח 90-100, המדגם כולל 60 ערכים. בכזו היסטוגרמה ישנם שני ערכים אמצעיים ולכן גם החציון שייך לקבוצה האמצעית. כדי לאתר את החציון ביתר דיוק, מחלקים את קצות הטווח 80-90 באופן יחסי למספרי הערכים החסרים: מחד, 30-12=18, ומאידך 30-18=12. החציון הוא, אם כך, <math>\ 80+\frac{18}{18+12}\cdot(90-80) = 86</math>.
 
[[קטגוריה:מאונים]]