עקומת ROC – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
לדעתי פונקציית ההסתברות זה קצר יותר ומובן יותר , הנוסח הקודם הלך בעיקבות הנוסח באנגלית של הערך ROC, ושם כתוב comulative distribution - איך נתרגם ? הצטברות ההתפלגות ? הצטברות ציפות ההסתברות ? לענ"ד הנסוח שהצעתי פשוט יותר ומדוייק יותר. (צבי נר)
שומר על קונססיסנטיות במילה רגישות לעומת פגיעות
שורה 1:
[[קובץ:Roccurves.png|ממוזער|עקומת ROC של שלוש שיטות לניבוי פיצול פפטידים ב[[פרוטאזום]].]]
ב[[סטטיסטיקה]], '''עקומה אופיינית למסווג''', או '''עקומת ROC''', היא גרף המציג את הביצועים של [[מסווג דו-ערכי]], לאור סף ההחלטה שנקבע לו. העקומה נוצרת על ידי התוויית [[שיעור החיוביים האמיתיים]] (TPR) מול [[שיעור החיוביים הכוזבים]] (FPR) תחת ספי קבלה שונים. שיעור החיוביים האמיתיים ידוע גם כ[[רגישות (מדד)|רגישות]] או [[דיוק וכיסוי|כיסוי]] ב[[למידת מכונה]]. שיעור החיוביים הכוזבים ידוע גם כ[[דלף]] וניתן לחשב אותו כ־1 פחות ה[[סגוליות]]. עקומת ROC היא, אם כן, הרגישות כפונקציה של הדלף. באופן כללי, אם התפלגות ההסתברות ידועה הן לפגיעה והן לאזעקת שווא, ניתן לייצר את עקומת ROC על ידי התוויית [[פונקציית הצטברות|פונקציית ה]]<nowiki/>הסתברות הפגיעותהרגישות צירבציר ה־y לעומת פונקציית ההסתברות לאזעקת שווא בציר ה־x.
 
ניתוח ROC מספק כלים לבחירת מבחן (או מסווג) אופטימלי, בטרם מתחשבים בהקשר העלות של כל אחת מסוגי הטעויות או בהתפלגות הפרטים בין הקבוצות. ניתוח ROC קשור באופן ישיר וטבעי לניתוח עלות/תועלת של [[קבלת החלטות]].