פתיחת התפריט הראשי

Weka (למידת מכונה)

ערך זה זקוק לעריכה: הסיבה לכך היא: קישורים לא טובים, עניינים סגנוניים, אנגלית לא תקינה.
אתם מוזמנים לסייע ולתקן את הבעיות, אך אנא אל תורידו את ההודעה כל עוד לא תוקן הדף. אם אתם סבורים כי אין בדף בעיה, ניתן לציין זאת בדף השיחה.

Weka (ראשי התיבות של Waikato Environment for Knowledge Analysis; מבוטא בחריזה עם המילה "מכה") היא חבילה פופולרית של התוכנות הנפוצות ללמידת מכונה, שנכתבו בשפת Java, שפותחה באוניברסיטת Waikato, ניו זילנד. זו תוכנה חופשית תחת הרישיון הציבורי הכללי (GNU). השפה קרויה על שם ציפור הווקה אשר נפוצה בניו זילנד בלבד.[1]

Weka
Weka (software) logo.png
Weka-3.5.5.png
מפתח University of Waikato
גרסה אחרונה 3.8.1 (stable)‏ (April 14, 2016; 9 months ago (2016-04-14))
גרסת בטא 3.9.1
ב־December 19, 2016; 53 days ago (2016-12-19)
מערכת הפעלה Windows, OS X, Linux
נכתבה בשפות Java
סוג רישיון הרישיון הציבורי הכללי של גנו
קטגוריה למידת מכונה, כריית מידע
http://www.cs.waikato.ac.nz/ml/weka/
לעריכה בוויקינתונים שמשמש מקור לחלק מהמידע בתבנית OOjs UI icon info big.svg

תיאורעריכה

Weka הוא שולחן עבודה[2] המכיל אוסף של כלי ויזואליזציה ואלגוריתמים לניתוח נתונים וחיזוי מודלים, יחד עם ממשקי משתמש גרפיים עבור גישה קלה לפונקציות אלה. הגרסה העדכנית והמלאה יותר המבוססת ג'אווה (Weka 3), עבורה התחיל הפיתוח בשנת 1997, משמשת כעת בכל מיני תחומי יישום, בפרט למטרות לימוד ומחקר.

היתרונות של Weka כוללים:

  • גישה חופשית תחת הרישיון הציבורי הכללי (GNU).
  • ניידות, שכן היא תיושם במלואה בשפת תכנות - Java ובכך פועלת כמעט על כל פלטפורמת מחשוב מודרנית.
  • אוסף מקיף של טכניקות מודל לעיבוד מקדים של נתונים.
  • קלות השימוש בשל ממשקי המשתמש הגרפיים שלה.

כל הטכניקות של Weka מושתתים על ההנחה כי הנתונים זמינים כקובץ או ביחס שטוח אחד, כאשר כל נקודת נתונים מתוארת על ידי מספר קבוע של תכונות (בדרך כלל, תכונות מספריות או נומינליות, אך סוגים מסוימים של תכונות אחרות גם נתמכים). Weka מספקת גישת מסדי נתונים של SQL באמצעות קישוריות מסד נתונים Java ויכולה לעבד את התוצאה שהוחזרה על ידי שאילתת מסד נתונים. היא אינה מסוגלת לבצע כריית נתונים רב-יחסיים, אך ישנה תוכנה נפרדת להמרת אוסף טבלאות למסד נתונים המקושר לטבלה אחת כך שיתאים לעיבוד באמצעות Weka.[3] תחום חשוב נוסף שכיום אינו מכוסה באלגוריתם שכלול בWeka הוא מודל רציף.

ממשקי משתמשעריכה

ממשק המשתמש הראשי של Weka הוא ה - Explorer, אך בעצם ניתן לגשת לאותה פונקציונליות דרך ממשק מבוסס רכיב, זרימת ידע, ומתוך שורת הפקודה. בנוסף, קיים הנסיין, אשר מאפשר השוואה שיטתית עבור ביצועים חזויים של האלגוריתמים במסגרת הלמידה החישובית של Weka, על אוסף של מערכי נתונים.

סייר הממשק כולל מספר לוחות הבטחת גישה למרכיבים העיקריים של שולחן העבודה:

  • ללוח של המעבד המקדים יש שירותים לייבוא נתונים ממסד נתונים, קבצים מופרדים בפסיקים (CSV) וכו', עיבוד המקדים של נתונים אלה נקרא אלגוריתם סינון. מסננים אלה יכולים לשמש כדי להפוך את הנתונים (למשל, הפיכת תכונות נומריות לדיסקרטיות), ולאפשר מחיקת מקרים ותכונות לפי קריטריונים ספציפיים.
  • לוח הסיווג מאפשר החלת אלגוריתמי סיווג ורגרסיה ('מסווגים' שנקראים 'ללא אבחנה' ב Weka) אל בסיס הנתונים כדי להעריך את רמת הדיוק של מודל החיזוי שכתוצאה מכך, ממחיש תחזיות שגויות, מאפיין מקלט הפעלה (ROC) עקום וכו', או כדי להעריך את המודל עצמו (אם המודל הוא נוח ויזואלית כמו, למשל, עץ החלטה).
  •  הלוח המשותף מספק גישה הלומדת על פי חוקים אסוציאטיביים שמנסים לזהות את כל יחסי הגומלין החשובים בין התכונות בנתונים. 
  • לוח הקלסטר (Cluster) מספק גישה לטכניקות קיבוץ ב- Weka, למשל, האלגוריתם הפשוט k-means. יש גם יישום של אלגוריתם מקסום ציפייה ללימוד תערובת של התפלגויות נורמליות.
  • לוח התכונות הנבחר מספק אלגוריתמים לזיהוי התכונות החזויות ביותר במערך.
  • הלוח הוויזואלי מציג מטריצת גרף פיזור, בו מגרשים בודדים, מפוזרים ומוגדלים יכולים להיבחר וניתנים לניתוח נוסף באמצעות אופרטורי מיון שונים.

חבילות הרחבהעריכה

בגרסת 3.7.2 (שאינה זמינה בגרסת ה"ספר" של Weka) התווסף מנהל חבילות, על מנת לאפשר התקנה קלה של חבילות הרחבה.[4] מספר שימושים שהיו בעבר כלולים ב-Weka הועברו לתוך חבילות הרחבה, אך השינוי הזה גם מקל על אחרים לתרום להרחבות ב-Weka ולשמור על התוכנה, כמו הארכיטקטורה המודולרית המאפשרת עדכונים עצמאיים של ליבת Weka והרחבות אינדיוידואליות.

היסטוריהעריכה

גרסת Weka המקורית שאינה מבוססת Java הייתה Tcl/Tk חזיתי (בעיקר צד שלישי) של מודלים אלגוריתמים אשר יושמו בשפות תכנות אחרות, בתוספת לכלי עזר עיבוד מקדים של נתונים בשפת C, ומערכת מבוססת-מקאפי (Makefile) לעריכת ניסויי למידת מכונה. גרסה מקורית זו נועדה בראש ובראשונה ככלי לניתוח נתונים מתחומים חקלאיים.[5][6]

נקודות ציוןעריכה

  •  בשנת 1993, אוניברסיטת וויקאטו בניו זילנד החלה בפיתוח הגרסה המקורית של Weka, אשר הפך שילוב של Tcl/Tk, C, Makefiles.
  • בשנת 1997, הוחלט לפתח מחדש את Weka מאפס ב- Java כולל מימושים של דגמי אלגוריתמים .[7]
  • בשנת 2005, Weka קיבל את פרס SIGKDD כריית נתונים ושירות גילוי ידע[8][9]
  • ב-2006, חברת Pentaho רכשה רישיון בלעדי לשימוש ב Weka עבור מודיעין עסקי.[דרוש מקור] הדבר מהווה את כריית הנתונים האנליטיים לניבוי רכיב של חבילת הבינה העסקית.
  • בדירוג כל הזמנים[10] על Sourceforge.net ליום 26-8-2011, 243 (עם 2,487,213 הורדות).

כלים קשוריםעריכה

  • סביבה לפיתוח KDD-יישומים נתמכים על ידי מדד מבנים (Elki) הוא פרויקט דומה ל- Weka עם דגש על ניתוח אשכולות, למשל, שיטות ללא השגחה.
  • KNIME היא למידת מכונה וכריית נתוני תוכנה המיושמת ב- Java.
  • ניתוח מסיבי באינטרנט (MOA) הוא פרויקט קוד פתוח עבור כרייה בקנה מידה גדולה של זרמי נתונים, שפותחו גם באונ' וויקאטו בניו זילנד.
  • מעצב עצבי הוא תוכנת כריית נתונים המבוססים על טכניקות למידה עמוקות אשר נכתבו בשפת C++.
  • אורנג' הוא פרויקט קוד פתוח דומה עבור כריית נתונים, למידת מכונה וויזואליזציה tar כתוב בשפות Python ו - C++.
  • RapidMiner היא מסגרת לימוד מכונה מסחרית המיושמת ב- Java שמשלבת Weka.

ראו גםעריכה

קישורים חיצונייםעריכה

  מדיה וקבצים בנושא Weka בוויקישיתוף

הערות שולייםעריכה

  1. ^ Weka 3 - Data Mining with Open Source Machine Learning Software in Java, www.cs.waikato.ac.nz
  2. ^ Ian H. Witten; Eibe Frank; Mark A. Hall (2011). "Data Mining: Practical machine learning tools and techniques, 3rd Edition". Morgan Kaufmann, San Francisco. בדיקה אחרונה ב-19 בינואר 2011. 
  3. ^ P. Reutemann; B. Pfahringer; E. Frank (2004). "Proper: A Toolbox for Learning from Relational Data with Propositional and Multi-Instance Learners". 17th Australian Joint Conference on Artificial Intelligence (AI2004). Springer-Verlag. בדיקה אחרונה ב-25 ביוני 2007. 
  4. ^ "weka - How do I use the package manager?". בדיקה אחרונה ב-20 בספטמבר 2014. 
  5. ^ G. Holmes; A. Donkin; I.H. Witten (1994). "Weka: A machine learning workbench". Proc Second Australia and New Zealand Conference on Intelligent Information Systems, Brisbane, Australia. בדיקה אחרונה ב-25 ביוני 2007. 
  6. ^ S.R. Garner; S.J. Cunningham; G. Holmes; C.G. Nevill-Manning; I.H. Witten (1995). "Applying a machine learning workbench: Experience with agricultural databases". Proc Machine Learning in Practice Workshop, Machine Learning Conference, Tahoe City, CA, USA. עמ' 14–21. בדיקה אחרונה ב-25 ביוני 2007. 
  7. ^ Ian H. Witten; Eibe Frank; Len Trigg; Mark Hall; Geoffrey Holmes; Sally Jo Cunningham (1999). "Weka: Practical Machine Learning Tools and Techniques with Java Implementations". Proceedings of the ICONIP/ANZIIS/ANNES'99 Workshop on Emerging Knowledge Engineering and Connectionist-Based Information Systems. עמ' 192–196. בדיקה אחרונה ב-26 ביוני 2007. 
  8. ^ Gregory Piatetsky-Shapiro (28 ביוני 2005). "KDnuggets news on SIGKDD Service Award 2005". בדיקה אחרונה ב-25 ביוני 2007. 
  9. ^ "Overview of SIGKDD Service Award winners". 2005. בדיקה אחרונה ב-25 ביוני 2007. 
  10. ^ http://sourceforge.net/top/topalltime.php?type=downloads&offset=200