עקומת ROC – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
יצירה באמצעות תרגום הדף "Receiver operating characteristic" |
תיקונים קוסמטיים, בעיקר, אחרי שימוש בכלי התרגום |
||
שורה 1:
־־[[קובץ:Roccurves.png|
ב[[סטטיסטיקה]], '''עקומה אופיינית למסווג''', או '''עקומת ROC''', היא גרף המציג את הביצועים של [[מסווג דו-ערכי]],
ניתוח ROC מספק כלים לבחירת מבחן (או מסווג) אופטימלי, בטרם מתחשבים בהקשר העלות של כל אחת מסוגי הטעויות או בהתפלגות הפרטים בין הקבוצות. ניתוח ROC קשור באופן ישיר וטבעי לניתוח עלות/תועלת של [[קבלת החלטות]].
עקומת ROC פותחה לראשונה על ידי מהנדסי חשמל ורדאר במהלך מלחמת העולם השנייה, על מנת לשפר את הזיהוי של כלי האויב. לאחר זמן לא רב, הרעיון אומץ בתחום ה[[פסיכולוגיה]], כדי להסביר זיהוי של גירויים על ידי החושים. מאז, ניתוח ROC הופעל במגוון תחומים, ביניהם [[רפואה]], [[רדיולוגיה]], [[ביומטריה]]
== עקרונות פעולה ==
מבחן ([[מסווג]]
במקרה שהאבחנה היא בין שתי קטגוריות בלבד ([[מסווג דו-ערכי|סיווג
מתוך מטריצת הטעות, ניתן לחלץ כמה [[מדדי הערכה למסווג דו-ערכי|מדדים]]. עקומות ROC מתחשבת רק בשניים ממדדים אלו: שיעור החיוביים האמיתיים (בקיצור, שח"א), ושיעור החיוביים הכוזבים (שח"כ)
== מרחב ROC ==▼
▲מתוך מטריצת הטעות, ניתן לחלץ כמה [[מדדי הערכה למסווג דו-ערכי|מדדים]]. עקומות ROC מתחשבת רק בשניים ממדדים אלו: שיעור החיוביים האמיתיים (בקיצור, שח"א), ושיעור החיוביים הכוזבים (שח"כ) - שניהם כפונקציה בפרמטר מסויים של המסווג. השח"א מוגדר כמספר החיוביים הנכונים מתוך כל הנדגמים שהיו באמת החיוביים, והשח"כ מוגדר כמספר החיוביים השגויים מתוך כל הנדגמים שהיו באמת השליליים.
מרחב ROC מוגדר על ידי שני מספרים אלו - שח"כ בציר האפקי, ושח"א בציר האנכי, ומבטא את העלות (במונחי שח"כ) והתועלת (במונחי שח"א) למבחן מסויים.▼
[[קובץ:ROC_space-2.png|ממוזער|420px|מרחב ROC, עליו מסומנים ארבעה מסווגים שונים, וקו האקראיות.]]
▲מרחב ROC מוגדר על ידי שני מספרים אלו
האלכסון, אם כן, מחלק את מרחב ROC לשני חלקים: נקודות מעליו מייצגות סיווג מוצלח (עדיף על בחירה אקראית), ונקודות מתחתיו סיווג רע (גרוע מבחירה אקראית). יצויין שאם מסווג נמצא מתחת לאלכסון אחרי בדיקה במדגם גדול מספיק, ניתן פשוט להפוך את הסיווג שלו משלילי לחיובי ולהיפך, כדי לקבל סיווג מוצלח.
בדוגמה הבאה מוצגים ארבעה סיווגים שונים ממדגם שבו 100 פרטים חיוביים
{| class="wikitable"
! A !! B !! C !! C′
|-
|
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 63 || style=" border:thin solid; padding:1em; background:#ffcbcb; color:#700" | 28 || 91
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 37 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 72 || 109
|-
| 100 || 100 || 200
|}
| style="padding-left:1em;" |
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 77 || style=" border:thin solid; padding:1em; background:#ffcbcb; color:#700" | 77 || 154
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 23 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 23 || 46
|-
| 100 || 100 || 200
|}
| style="padding-left:1em;" |
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 24 || style=" border:thin solid; padding:1em; background:#ffcbcb; color:#700" | 88 || 112
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 76 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 12 || 88
|-
| 100 || 100 || 200
|}
| style="padding-left:1em;" |
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 76 || style=" border:thin solid; padding:1em;background:#ffcbcb; color:#700" | 12 || 88
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 24 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 88 || 112
|-
| 100 || 100 || 200
|}
|-
| style="padding-left:1em;" | שח"א = 0.63 || style="padding-left:2em;" | שח"א = 0.77 || style="padding-left:2em;" | שח"א = 0.24 || style="padding-left:2em;" | שח"א = 0.76
|-
| style="padding-left:1em;" | שח"כ = 0.28 || style="padding-left:2em;" | שח"כ = 0.77 || style="padding-left:2em;" | שח"כ = 0.88 || style="padding-left:2em;" | שח"כ = 0.12
|-
| style="padding-left:1em;" | PPV = 0.69 || style="padding-left:2em;" | PPV = 0.50 || style="padding-left:2em;" | PPV = 0.21 || style="padding-left:2em;" | PPV = 0.86
|-
| style="padding-left:1em;" | [[מדד F|F1]] = 0.66 || style="padding-left:2em;" | F1 = 0.61 || style="padding-left:2em;" | F1 = 0.22 || style="padding-left:2em;" | F1 = 0.81
|-
| style="padding-left:1em;" | נכונות = 0.68 || style="padding-left:2em;" | נכונות = 0.50 || style="padding-left:2em;" | נכונות = 0.18 || style="padding-left:2em;" | נכונות = 0.82
|}
ארבעת המסווגים מיוצגים על ידי נקודת במרחב ROC שבתמונה. התמונה מראה בבירור שמסווג A הוא המוצלח ביותר מבין A,
== עקומות במרחב ROC ==
[[קובץ:ROC curves.svg|ממוזער|350px|צפיפות ההסתברות של פרטים מהקטגוריה החיובית (מימין) ופרטים מהקטגוריה השלילית (משמאל). הקו השחור קובע את הסף שמתחתיו המסווג קובע שהפרט שלילי, ומעליו – הפרט חיובי.{{ש}}הזזה של סף ההחלטה שקולה לתנועה על עקומת ה-ROC]]
<div :< ניתן כעת לשרטט את עקומת ROC של המסווג כפונקציה של הפרמטר <math>\beta</math>.
כדוגמה, נניח שרמות החלבונים בדם של חולים ושל בריאים [[התפלגות נורמלית|מתפלגות נורמלית]]
== ערכים נגזרים ==
לעתים, יוצרים מתוך עקומת ROC מדדים נוספים למסווג. דוגמאות נפוצות הן:
* [[סטטיסטי J של יודן]] מופיע בגרף כמרחק בין נקודה מסויימת על העקומה, לבין נקודה על האלכסון בעלת אותו שח"כ.
▲* [[סטטיסטי J של יודן]] מופיע בגרף כמרחק בין נקודה מסויימת על העקומה, לבין נקודה על האלכסון בעלת אותו שח"כ.<br>
▲* השטח מתחת לעקומה (המכונה לפעמים A'<nowiki>{{D}}</nowiki> או איי-פריים.
== רקע היסטורי ==
השימוש הראשון בעקומת ROC היה בימי [[מלחמת העולם השנייה]], לשם ניתוח אותות [[מכ"ם]].
בשנות
יעילותן של עקומות ROC הוכחה גם בהערכת יכולותיהן של שיטות ב[[למידה חישובית]]. אחד המיישמים הראשונים של ניתוח ROC בתחום הלמידה החישובית היה קנת ספקמן, שהדגים את חשיבותן של עקומות ROC בהשוואה בין [[אלגוריתם|אלגוריתמים]]
== ראו גם ==
שורה 52 ⟵ 104:
== הערות שולים ==
<div class="mw-content-ltr"><references></div>
== לקריאה נוספת ==
* Balakrishnan, Narayanaswamy (1991); ''Handbook of the Logistic Distribution'', Marcel Dekker, Inc., [[:en:Special:BookSources/9780824785871|ISBN 978-0-8247-8587-1]]
שורה 64 ⟵ 115:
* Lasko, Thomas A.; Bhagwat, Jui G.; Zou, Kelly H.; and Ohno-Machado, Lucila (2005); [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.9674&rep=rep1&type=pdf&ei=GpRGT_juOo3H0AH3quCqDg&usg=AFQjCNHvAiRwGwk8mRE7sMtPEOKXClmCsA&cad=rja ''The use of receiver operating characteristic curves in biomedical informatics''], Journal of Biomedical Informatics, 38(5):404–415
* Stephan, Carsten; Wesseling, Sebastian; Schink, Tania; and Jung, Klaus (2003); [http://www.clinchem.org/content/49/3/433.abstract ''Comparison of Eight Computer Programs for Receiver-Operating Characteristic Analysis''], Clinical Chemistry, '''49''':433–439
* Swets, John A.; Dawes, Robyn M.; and Monahan, John (2000); ''Better Decisions through Science'', [[סיינטיפיק אמריקן|Scientific American]], October, pp.
* Zou, Kelly H.; O'Malley, A. James; Mauri, Laura (2007); [http://circ.ahajournals.org/content/115/5/654.full ''Receiver-operating characteristic analysis for evaluating diagnostic tests and predictive models''], Circulation, 115(5):654–7
* {{תבנית:Cite book|first1 = Xiao-Hua|last1 = Zhou|first2 = Nancy A.|last2 = Obuchowski|first3 = Donna K.|last3 = McClish|year = 2002|title = Statistical Methods in Diagnostic Medicine|publisher = Wiley & Sons|location = New York, NY|isbn = 978-0-471-34772-9}}
[[קטגוריה:ביוסטטיסטיקה]]
[[קטגוריה:כריית מידע]]
קטגוריה:סיווג (סטטיסטיקה)]]
|