כריית מידע – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
להגיד שתכנות גנטי היא השיטה המקובלת לרגרסיה, זה פשוט לא נכון. תיקנתי.
שורה 21:
*ניתוח אשכולות - פילוח את הרשומות לאשכולות, כך שבכל אשכול נמצאות רשומות בעלות מאפיינים דומים. למשל ניתן להיעזר באלגוריתם לניתוח אשכולות כדי לפלח את לקוחות החברה.
*רגרסיה - נסיון למצוא פונקציה הממדלת את הנתונים תוך מזעור שגיאת הניבוי. לדוגמה תוך שימוש ב[[רגרסיה לינארית]].
*למידת חוקי אסוציאציה - נועד למצוא אסוציאציה או קשר מעניין בין פריטים שונים של נתונים. לרוב משמש כדי להציג חוקיות בין שדות שונים בבסיס הנתונים. הדוגמה הנפוצה ביותר היא ניתוח סל קניות. במקרה זה מנסים למצוא האם יש חוקיות בין מוצרים שונים אשר נרכשו על ידי אותו לקוח באותה קניה. למשל ניתן לדעת אילו מוצרים נרכשים בדרך כלל יחדיו ([[ממרח שוקולד]] ו[[לחם]]ולחם). בהתאם לתוצאות ניתן לסדר את המוצרים במרכול בצורה האופטימלית.
 
===אימות תוצאות===