עקומת ROC – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מ הוספת קישור לחיובי כוזב
שורה 1:
[[קובץ:Roccurves.png|ממוזער|עקומת ROC של שלוש שיטות לניבוי פיצול פפטידים ב[[פרוטאזום]].]]
ב[[סטטיסטיקה]], '''עקומה אופיינית למסווג''', או '''עקומת ROC''', היא גרף המציג את הביצועים של [[מסווג דו-ערכי]], לאור סף ההחלטה שנקבע לו. העקומה נוצרת על ידי התוויית [[שיעור החיוביים האמיתיים]] (TPR) מול [[שיעור החיוביים הכוזבים]] (FPR) תחת ספי קבלה שונים. שיעור החיוביים האמיתיים ידוע גם כ[[רגישות (מדד)|רגישות]] או [[דיוק וכיסוי|כיסוי]] ב[[למידת מכונה]]. שיעור החיוביים הכוזבים ידוע גם כ[[דלף]] וניתן לחשב אותו כ־1 פחות ה[[סגוליות]]. עקומת ROC היא, אם כן, הרגישות כפונקציה של הדלף. באופן כללי, אם התפלגות ההסתברות ידועה הן לפגיעה (Hit, חיובי אמיתי) והן לאזעקת שווא ([[חיובי כוזב]]), ניתן לייצר את עקומת ROC על ידי התוויית פונקציית הסתברות הפגיעות (שיעור חיוביים אמיתיים) בציר ה־y לעומת פונקציית ההסתברות לאזעקת שווא (שיעור חיוביים כוזבים) בציר ה־x.
 
ניתוח ROC מספק כלים לבחירת מבחן (או מסווג) אופטימלי, בטרם מתחשבים בהקשר העלות של כל אחת מסוגי הטעויות או בהתפלגות הפרטים בין הקבוצות. ניתוח ROC קשור באופן ישיר וטבעי לניתוח עלות/תועלת של [[קבלת החלטות]].