טעות ריבועית ממוצעת – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ ←‏פרשנות: הגהה
Matanyabot (שיחה | תרומות)
מ בוט החלפות: על ידי, תלויה, הטיה\1, מסוי\1, מדויק
שורה 1:
ב[[סטטיסטיקה]], '''טעות ריבועית ממוצעת''' (Mean Square Error) של [[אומד]] מודדת את [[ממוצע]] ריבועי ה"טעויות", כלומר ההבדל בין האומד לבין מה שנאמד. ההבדל נובע בגלל האקראיות או בגלל שהאומד לא לוקח בחשבון מידע שיכול לייצר אומד מדוייקמדויק יותר.
 
טעות ריבועית ממוצעת היא מומנט מסדר שני של השגיאה, ולכן משלבת גם את ה[[שונות]] של האומד וגם את ההטייה שלו. עבור אומד חסר הטייההטיה, הטעות הריבועית הממצועת היא שונות האומד. בדומה לשונות, לשונות הריבועית הממוצעת יש אותם יחידות מדידה כמו לריבוע המידה שנאמדת. באנלוגיה לסטיית התקן, אם ניקח את השורש של הטעות הריבועית הממוצעת נקבל את שורש הטעות הריבועית הממוצעת (RMSE), אשר יש לה את אותן יחידות מידה כמו למידה שנאמדת; עבור אומד חסר הטייההטיה, שורש הטעות הריבועית הממוצעת הוא שורש השונות, הידוע כסטיית התקן.
 
 
שורה 8:
אם '''<big>Ŷ</big>''' הוא וקטור של n ערכים חזויים, ו-'''<big>Y</big>''' הוא הווקטור של הערכים האמיתיים ,אזי הטעות הריבועית הממוצעת(המוערכת) היא: <math>\operatorname{MSE}=\frac{1}{n}\sum_{i=1}^n(\hat{Y_i} - Y_i)^2</math>
 
זהו מדד ידוע ומחושב בהינתן מדגם מסוייםמסוים (ולכן גם תלוי מדגם).
הטעות הריבועית הממוצעת של אומד <math>\hat{\theta}</math> בהתייחס לפרמטר לא ידוע <math>\theta</math> מוגדרת כ:
<math>\operatorname{MSE}(\hat{\theta})=\operatorname{E}\big[(\hat{\theta}-\theta)^2\big]</math>
 
הגדרה זו תלוייהתלויה בפרמטר הלא ידוע,והטעות הריבועית הממוצעת בהקשר הזה היא תכונה של אומד.
הטעות הריבועית הממוצעת שווה לסכום השונות וריבוע ההטייה של האומד או של התחזיות .
במקרה של טעות ריבועית ממוצעת של אומד: <math>\operatorname{MSE}(\hat{\theta})=\operatorname{Var}(\hat{\theta})+ \left(\operatorname{Bias}(\hat{\theta},\theta)\right)^2</math>
שורה 43:
== שימושים ==
* MSE מזערי הוא קריטריון מרכזי בבחירת אומדים. מבין קבוצה של אומדים חסרי הטיה, מזעור ה-MSE שקול למזעור השונות, והאומד בעל השונות המזערית הוא ה-MVUE. עם זאת, ייתכן ולאומד מוטה יהיה MSE נמוך יותר מלאומד חסר הטיה.
* במודלים סטטיסטיים ה-MSE, המייצג את הפער בין התצפיות עצמן לבין ערכי התצפיות שנחזו על- ידי המודל, משמש על-מנת לקבוע את המידה שבה המודל מתאים לנתונים, וכן לקבוע האם ניתן להסיר משתנים מסבירים (ובכך לפשט את המודל) מבלי לפגוע באופן משמעותי ביכולת החיזוי של המודל.
 
== חסרונות ==