עקומת ROC – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
יצירה באמצעות תרגום הדף "Receiver operating characteristic"
 
תיקונים קוסמטיים, בעיקר, אחרי שימוש בכלי התרגום
שורה 1:
־־[[קובץ:Roccurves.png|right|thumbממוזער|עקומת ROC של שלוש שיטות לניבוי פיצול פפטידים ב[[פרוטאזום]].]]
ב[[סטטיסטיקה]], '''עקומה אופיינית למסווג''', או '''עקומת ROC''', היא גרף המציג את הביצועים של [[מסווג דו-ערכי]],  לאור סף ההחלטה שנקבע לו. העקומה נוצרת על ידי התוויית [[שיעור החיוביים האמיתיים]] (TPR) מול  [[שיעור החיוביים הכוזבים]] (FPR) תחת ספי קבלה שונים. שיעור החיוביים האמיתיים ידוע גם כ[[רגישות (מדד)|רגישות]]  או [[דיוק וכיסוי|כיסוי]] ב[[למידה חישובית]]. שיעור החיוביים הכוזבים ידוע גם כ[[דלף]] וניתן לחשב אותו כ-1כ־1 פחות ה[[סגוליות]]. עקומת ROC היא, אם כן, הרגישות כפונקציה של הדלף. באופן כללי, אם התפלגות ההסתברות ידועה הן לפגיעה והן לאזעקת שווא, ניתן לייצר את עקומת ROC על ידי התוויית [[פונקציית הצטברות|פונקציית ההצטברות]]  של הסתברות הפגיעות ציר ה-yה־y לעומת פונקציית ההצטברות של ההסתברות לאזעקת שווא בציר ה-xה־x.
 
ניתוח ROC מספק כלים לבחירת מבחן (או מסווג) אופטימלי, בטרם מתחשבים בהקשר העלות של כל אחת מסוגי הטעויות או בהתפלגות הפרטים בין הקבוצות. ניתוח ROC קשור באופן ישיר וטבעי לניתוח עלות/תועלת של [[קבלת החלטות]].
 
עקומת ROC פותחה לראשונה על ידי מהנדסי חשמל ורדאר במהלך מלחמת העולם השנייה, על מנת לשפר את הזיהוי של כלי האויב. לאחר זמן לא רב, הרעיון אומץ בתחום ה[[פסיכולוגיה]], כדי להסביר זיהוי של גירויים על ידי החושים. מאז, ניתוח ROC הופעל במגוון תחומים, ביניהם [[רפואה]], [[רדיולוגיה]], [[ביומטריה]]  ועוד. בעת האחרונה גובר השימוש בניתוח זה בתחום [[למידה חישובית|הלמידה החישובית]] וכריית המידע.
 
== עקרונות פעולה ==
מבחן ([[מסווג]]  או [[אבחנה|בדיקת אבחון]]) הוא פונקציה שמקשרת בין כל פרט או מקרה לבין קטגוריה או מחלקה מסויימת. תוצאת הסיווג או האבחון היא לרוב בדידה. אם תוצאת המבחן היא רציפה (בעלת ערך [[מספר ממשי|ממשי]]) - אז דרוש לקבוע סף אבחנה בין הקטגוריות השונות (למשל, כדי לבדוק האם אדם חולה ב[[יתר לחץ דם]], על פי מדידת הלחץ הדם שלו בזמן מסויים, יש לבחור ערך סף שמעליו האדם יוגדר חולה).
 
במקרה שהאבחנה היא בין שתי קטגוריות בלבד ([[מסווג דו-ערכי|סיווג דו-ערכידו־ערכי]]), נהוג לסמן את אחת האפשרויות כ"חיובית" והאחרת - "שלילית". במקרה כזה, קיימות ארבע אפשרויות: אם האבחנה היא חיובית והערך האמיתי גם הוא חיובי, הפרט נקרא "חיובי אמיתי"; אם הערך האמיתי הוא דווקא שלילי, הפרט הוא "חיובי כוזב". מאידך, אם הערך האמיתי הוא שלילי, אם האבחנה גם היא שלילית, הפרט ייקרא "שלילי אמיתי", והפרט ייקרא "שלילי כוזב" אם הערך האמיתי הוא דווקא חיובי. ניתן להציג ערכים אלו בעזרת [[מטריצת טעות]].{{מטריצת טעות}}
 
מתוך מטריצת הטעות, ניתן לחלץ כמה [[מדדי הערכה למסווג דו-ערכי|מדדים]]. עקומות ROC מתחשבת רק בשניים ממדדים אלו: שיעור החיוביים האמיתיים (בקיצור, שח"א), ושיעור החיוביים הכוזבים (שח"כ) - שניהם כפונקציה בפרמטר מסויים של המסווג. השח"א מוגדר כמספר החיוביים הנכונים מתוך כל הנדגמים שהיו באמת החיוביים, והשח"כ מוגדר כמספר החיוביים השגויים מתוך כל הנדגמים שהיו באמת השליליים.
== מרחב ROC ==
[[קובץ:ROC_space-2.png|left|thumb|250x250px|מרחב ROC ]]
מתוך מטריצת הטעות, ניתן לחלץ כמה [[מדדי הערכה למסווג דו-ערכי|מדדים]]. עקומות ROC מתחשבת רק בשניים ממדדים אלו: שיעור החיוביים האמיתיים (בקיצור, שח"א), ושיעור החיוביים הכוזבים (שח"כ) - שניהם כפונקציה בפרמטר מסויים של המסווג. השח"א מוגדר כמספר החיוביים הנכונים מתוך כל הנדגמים שהיו באמת החיוביים, והשח"כ מוגדר כמספר החיוביים השגויים מתוך כל הנדגמים שהיו באמת השליליים.
 
== מרחב ROC ==
מרחב ROC מוגדר על ידי שני מספרים אלו - שח"כ בציר האפקי, ושח"א בציר האנכי, ומבטא את העלות (במונחי שח"כ) והתועלת (במונחי שח"א) למבחן מסויים.
[[קובץ:ROC_space-2.png|ממוזער|420px|מרחב ROC, עליו מסומנים ארבעה מסווגים שונים, וקו האקראיות.]]
מרחב ROC מוגדר על ידי שני מספרים אלו - שח"כ בציר האפקי, ושח"א בציר האנכי, ומבטא את העלות (במונחי שח"כ) והתועלת (במונחי שח"א) למבחן מסויים.
 
במרחב זה, כל מבחן מיוצג כנקודה. המבחן האידאלי (או: הסיווג המושלם) יופיע במרחב כנקודה בפינה השמאלית העליונה (0,1) של המרחב, כלומר כלאין התוצאותפרטים החיוביותחיוביים אמיתיותכוזבים וגם כלואין התוצאותפרטים השלילותשליליים אמיתיותכוזבים.<div><br>
 
</div><div>ניחוש [[אקראיות|אקראי]]  לחלוטין ייוצג כנקודה על הקו האלכסוני מהפינה השמאלית התחתונה לנקודה הימנית העליונה (מקווקו אדום, בתמונה). למשל: [[הטלת מטבע]]  תתקרב, ככל שהמדגם גדל, למבחן שנמצא בנקודה (0.5,0.5). בדומה, מבחן שנותן תוצאה חיובית לכל הפרטים יגרום ל-100ל־100% חיוביים אמיתיים אבל גם ל-100% חיוביים כוזבים, ויסומן כנקודה בפינה הימנית העליונה.</div>
 
האלכסון, אם כן, מחלק את מרחב ROC לשני חלקים: נקודות מעליו מייצגות סיווג מוצלח (עדיף על בחירה אקראית), ונקודות מתחתיו סיווג רע (גרוע מבחירה אקראית). יצויין שאם מסווג נמצא מתחת לאלכסון אחרי בדיקה במדגם גדול מספיק, ניתן פשוט להפוך את הסיווג שלו משלילי לחיובי ולהיפך, כדי לקבל סיווג מוצלח.
 
בדוגמה הבאה מוצגים ארבעה סיווגים שונים ממדגם שבו 100 פרטים חיוביים ו-100ו־100 שליליים:
 
{| class="wikitable"
 
! A !! B !! C !! C′
|-
|
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 63 || style=" border:thin solid; padding:1em; background:#ffcbcb; color:#700" | 28 || 91
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 37 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 72 || 109
|-
| 100 || 100 || 200
|}
| style="padding-left:1em;" |
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 77 || style=" border:thin solid; padding:1em; background:#ffcbcb; color:#700" | 77 || 154
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 23 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 23 || 46
|-
| 100 || 100 || 200
|}
| style="padding-left:1em;" |
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 24 || style=" border:thin solid; padding:1em; background:#ffcbcb; color:#700" | 88 || 112
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 76 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 12 || 88
|-
| 100 || 100 || 200
|}
| style="padding-left:1em;" |
{| style="text-align:center;"
| style=" border:thin solid; padding:1em; background:#b9ffc5; color:#070" | 76 || style=" border:thin solid; padding:1em;background:#ffcbcb; color:#700" | 12 || 88
|-
| style=" border:thin solid; padding:1em; background:#e0e0e0;" | 24 || style=" border:thin solid; padding:1em; background:#ffebad;color:#A15800" | 88 || 112
|-
| 100 || 100 || 200
|}
|-
| style="padding-left:1em;" | שח"א = 0.63 || style="padding-left:2em;" | שח"א = 0.77 || style="padding-left:2em;" | שח"א = 0.24 || style="padding-left:2em;" | שח"א = 0.76
|-
| style="padding-left:1em;" | שח"כ = 0.28 || style="padding-left:2em;" | שח"כ = 0.77 || style="padding-left:2em;" | שח"כ = 0.88 || style="padding-left:2em;" | שח"כ = 0.12
|-
| style="padding-left:1em;" | PPV = 0.69 || style="padding-left:2em;" | PPV = 0.50 || style="padding-left:2em;" | PPV = 0.21 || style="padding-left:2em;" | PPV = 0.86
|-
| style="padding-left:1em;" | [[מדד F|F1]] = 0.66 || style="padding-left:2em;" | F1 = 0.61 || style="padding-left:2em;" | F1 = 0.22 || style="padding-left:2em;" | F1 = 0.81
 
|-
| style="padding-left:1em;" | נכונות = 0.68 || style="padding-left:2em;" | נכונות = 0.50 || style="padding-left:2em;" | נכונות = 0.18 || style="padding-left:2em;" | נכונות = 0.82
|}
 
ארבעת המסווגים מיוצגים על ידי נקודת במרחב ROC שבתמונה. התמונה מראה בבירור שמסווג A הוא המוצלח ביותר מבין A, <nowiki>{{כ}}</nowiki>B ו-Cו־C. תוצאת הסיווג של B נמצאת על קו הניחוש האקראי (האלכסון), וניתן לראות גם שהנכונות של B היא 50%. עם זאת, אם [[שיקוף (מתמטיקה)|נשקף]]  את נקודה C דרך הנקודה (0.5,0.5), התוצאה המתקבלת, C'<nowiki>{{D}}</nowiki> היא מוצלחת אפילו יותר מ-Aמ־A. <nowiki> {{כ}}</nowiki>C'<nowiki>{{D}}</nowiki> פשוט מחליפה בין הקטגוריות של C (כאשר C מסווגת "שלילי",  C'<nowiki>{{D}}</nowiki> מסווגת חיובי, ולהיפך).
 
== עקומות במרחב ROC ==
[[קובץ:ROC curves.svg|ממוזער|350px|צפיפות ההסתברות של פרטים מהקטגוריה החיובית (מימין) ופרטים מהקטגוריה השלילית (משמאל). הקו השחור קובע את הסף שמתחתיו המסווג קובע שהפרט שלילי, ומעליו – הפרט חיובי.{{ש}}הזזה של סף ההחלטה שקולה לתנועה על עקומת ה-ROC]]
[[קובץ:Receiver_Operating_Characteristic.png|left|thumb|300x300px]]
<div style="direction: rtl;">סיווגים מבוססים לעתים רבות על [[משתנה מקרי|משתנה מקרי רציף]]. במקרה כזה, ניתן לכתוב את [[פונקציית צפיפות|צפיפויות ההסתברות]]  של כל אחת מהמחלקות כפונקציה של המשתנה המקרי (T). אם נסמן את ההסתברות לקטגוריה חיובית על ידי <math>P_1(T)</math> ואת ההסתברות לקטגוריה שלילית על ידי P_2(T), נוכל לקבל את הביטויים הבאים לשח"א (TPR) ולשח"כ (FPR) כפונקציה של סף ההחלטה <nowiki><math>\beta</math></nowiki>:</div>
<div styleclass="direction: mw-content-ltr;">:<nowiki></math></nowiki>FPR(\beta)=\int_{\beta}^\infty P_0(T) dT</divmath>
:<div style="direction: ltr;"math>:TPR(\beta)=\int_{\beta}^\infty P_1(T) dT</div><div style="direction: rtl;">ניתן כעת לשרטט את עקומת ROC של המסווג כפונקציה של הפרמטר <nowiki><math>\beta</math></nowiki>.</div>
 
ניתן כעת לשרטט את עקומת ROC של המסווג כפונקציה של הפרמטר <math>\beta</math>.
כדוגמה, נניח שרמות החלבונים בדם של חולים ושל בריאים [[התפלגות נורמלית|מתפלגות נורמלית]]  סביב ממוצע של 2 גרם לד"ל וגרם אחד לד"ל, בהתאמה. בדיקה רפואית מסויימת עשויה למדוד את רמתו של חלבון מסויים בדגימות הדם ולסווג כל דגימה שבה הרמה היא מעל ערך מסויים כדגימה מאדם חולה. על ידי הזזת ערך הסף (שחור באיור) מטה (או שמאלה) ניתן להגדיל את שיעור החיוביים הכוזבים, יחד עם הגדלת שיעור החיוביים הכוזבים, והזזה מעלה (או ימינה) תקטין את שניהם יחד. צורתה של העקומה תיקבע לפי מידת המובחנות בין שני הגירויים (בגרף: כמות החפיפה בין שתי ההתפלגויות.
 
== ערכים נגזרים ==
לעתים, יוצרים מתוך עקומת ROC מדדים נוספים למסווג. דוגמאות נפוצות הן:<div><br>
* [[סטטיסטי J של יודן]] מופיע בגרף כמרחק בין נקודה מסויימת על העקומה, לבין נקודה על האלכסון בעלת אותו שח"כ.<br>
</div>
* השטח מתחת לעקומה (המכונה לפעמים A'<nowiki>{{D}}</nowiki> או איי-פריים).
* [[סטטיסטי J של יודן]] מופיע בגרף כמרחק בין נקודה מסויימת על העקומה, לבין נקודה על האלכסון בעלת אותו שח"כ.<br>
* השטח מתחת לעקומה (המכונה לפעמים A'<nowiki>{{D}}</nowiki> או איי-פריים.
 
== רקע היסטורי ==
השימוש הראשון בעקומת ROC היה בימי [[מלחמת העולם השנייה]], לשם ניתוח אותות [[מכ"ם]].  בעקבות [[המתקפה על פרל הארבור|המתקפה על פרל הרבור]]  בשנת 1941, צבא ארצות הברית החל במחקר חדש על מנת להגדיל את יכולת הזיהוי של כלי טיס יפניים על ידי המכ"מים שבידיו.<nowiki>{{מקור}}</nowiki>
 
בשנות ה-50ה־50 של המאה ה-20ה־20, החלו להימצא עקומות ROC בשימוש התחום ה[[פסיכופיזיקה]] , על מנת להעריך את יכולת הזיהוי של אותות חלשים על ידי אנשים (ולעתים גם על ידי בעלי חיים נוספים). ברפואה, ניתוח ROC נמצא בשימוש נרחב לשם הערכות [[אבחנה|בדיקות אבחון]].  עקומות ROC גם נמצאות בשימוש נרחב ב[[אפידמיולוגיה]] ומחקר רפואי, ולעתים קרובות מוזכרות בהקשר של [[רפואה מבוססת ראיות]]. ב[[רדיולוגיה]], ניתוח ROC הוא טכניקה נפוצה להעריך טכניקות רדיולוגיה חדשות. במדעי החברה, ניתוח ROC, הנקרא בהקשר נקראזה לעתים קרובות יחס נכונות ROC, הוא טכניקה נפוצה לבחינת הנכונות של מודלים הסתברותיים להפרתל[[ריבית הפרה|הפרת הלוואה]]. עקומות ROC נפוצות גם ברפואת מעבדה כדי להעריך את הדיוק האבחנתי של בדיקה, לבחור את הסף האופטימלי לבדיקה ולהשוות את דיוק אבחון של כמה בדיקות.
 
יעילותן של עקומות ROC הוכחה גם בהערכת יכולותיהן של שיטות ב[[למידה חישובית]]. אחד המיישמים הראשונים של ניתוח ROC בתחום הלמידה החישובית היה קנת ספקמן, שהדגים את חשיבותן של עקומות ROC בהשוואה בין [[אלגוריתם|אלגוריתמים]]  שונים לסיווג.<nowiki><ref>Spackman, Kent A. (1989). "Signal detection theory: Valuable tools for evaluating inductive learning". Proceedings of the Sixth International Workshop on Machine Learning. San Mateo, CA: Morgan Kaufmann. pp. 160–163.</ref></nowiki>
 
== ראו גם ==
שורה 52 ⟵ 104:
 
== הערות שולים ==
<div class="mw-content-ltr"><references></div>
<div class="reflist columns references-column-width" style="-webkit-column-width: 30em; list-style-type: decimal; min-height: 5225px;" data-template-mapping="{&quot;targetname&quot;:&quot;Reflist&quot;}"><div style="direction: ltr;"><nowiki><references></nowiki></div></div>
 
== לקריאה נוספת ==
* Balakrishnan, Narayanaswamy (1991); ''Handbook of the Logistic Distribution'', Marcel Dekker, Inc., [[:en:Special:BookSources/9780824785871|ISBN 978-0-8247-8587-1]]
שורה 64 ⟵ 115:
* Lasko, Thomas A.; Bhagwat, Jui G.; Zou, Kelly H.; and Ohno-Machado, Lucila (2005); [http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.97.9674&rep=rep1&type=pdf&ei=GpRGT_juOo3H0AH3quCqDg&usg=AFQjCNHvAiRwGwk8mRE7sMtPEOKXClmCsA&cad=rja ''The use of receiver operating characteristic curves in biomedical informatics''], Journal of Biomedical Informatics, 38(5):404–415
* Stephan, Carsten; Wesseling, Sebastian; Schink, Tania; and Jung, Klaus (2003); [http://www.clinchem.org/content/49/3/433.abstract ''Comparison of Eight Computer Programs for Receiver-Operating Characteristic Analysis''], Clinical Chemistry, '''49''':433–439
* Swets, John A.; Dawes, Robyn M.; and Monahan, John (2000); ''Better Decisions through Science'', [[סיינטיפיק אמריקן|Scientific American]], October, pp.&nbsp; 82–87
* Zou, Kelly H.; O'Malley, A. James; Mauri, Laura (2007); [http://circ.ahajournals.org/content/115/5/654.full ''Receiver-operating characteristic analysis for evaluating diagnostic tests and predictive models''], Circulation, 115(5):654–7
* {{תבנית:Cite book|first1 = Xiao-Hua|last1 = Zhou|first2 = Nancy A.|last2 = Obuchowski|first3 = Donna K.|last3 = McClish|year = 2002|title = Statistical Methods in Diagnostic Medicine|publisher = Wiley & Sons|location = New York, NY|isbn = 978-0-471-34772-9}}
 
 
* <br>
[[קטגוריה:ביוסטטיסטיקה]]
[[קטגוריה:כריית מידע]]
קטגוריה:סיווג (סטטיסטיקה)]]