כריית מידע – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Aaadir (שיחה | תרומות)
אין תקציר עריכה
Aaadir (שיחה | תרומות)
שורה 18:
===כריית המידע===
כריית המידע מטפלת לרוב באחת מהבעיות הבאות:
*[[סיווג סטטיסטי|בעיות סיווג]] - בהתאם לדוגמאות שנאספו בעבר, האלגוריתם לסיווג מסיק מודל סיווג המשמש לסווג מקרים חדשים. למשל [[בנק]] יכול לבנות מודל סיווג של לווי [[משכנתא]] בהתאם לדוגמאות שנאספו בעבר. כאשר מגיע לקוח חדש המבקש משכנתא הוא מסווג לפי מידת הוודאות שהוא אכן יצליח לעמוד בעתיד בהחזרי ההלוואה. אלגוריתמים נפוצים לכך הם [[עץ החלטה]] (Decision Tree), [[אלגוריתם שכן קרוב|שיטת השכן הקרוב]] (Nearest neighbor), [[סיווג בייסיאני נאיבי|סיווג בייס נאיבי]] (Naive Bayes classifier) ו[[רשת עצבית מלאכותית]].
*ניתוח אשכולות - פילוח את הרשומות לאשכולות, כך שבכל אשכול נמצאות רשומות בעלות מאפיינים דומים. למשל ניתן להיעזר באלגוריתם לניתוח אשכולות כדי לפלח את לקוחות החברה.
*רגרסיה - ניסיון למצוא פונקציה הממדלת את הנתונים תוך מזעור שגיאת הניבוי. לדוגמה תוך שימוש ב[[רגרסיה ליניארית]].