Gradient descent – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
Avner-Y (שיחה | תרומות)
מ טיפול בניסוח.
Avner-Y (שיחה | תרומות)
מ ←‏מבוא אינטואיטיבי: טיפול בניסוח.
שורה 3:
 
==מבוא אינטואיטיבי==
השיטה עובדת על [[שדה סקלרי]] של נתונים. שדה סקלרי הוא מרחב בו לכלכל נקודה ישנםמורכבת כמהמכמה מספרים המייצגים עליה נתונים שונים. מרחב זה יכול להיות בעל מספר רב של ממדים כך שכל מימד מייצג קטגוריה של ערכים. דוגמה לשדה סקלרי בעל שלושה ממדים הוא מפה טופוגרפית בה יש אורך, רוחב וגובה. לפי השיטה משתמשים בגרדיאנט, שהוא כלי מתמטי וקטורי, כלומר בעל כיוון, המאפשר למצוא את הכיוון אליו הנגזרת מקסימלית דהיינו הכיוון בו נמצא השינוי הדרסטי ביותר בין הנתונים סביב נקודה מסוימת. במפה הטופוגרפית יהווה הגרדיאנט את הכיוון בו זווית המדרון מקסימלית, והאלגוריתם מוצא את הדרך האופטימלית להגיע למינימום בשדה הסקלרי., שהוא בהקבלה במפה הנקודה הנמוכה ביותר במפה.
 
השיטה עובדת כך שבכל שלב של ההפעלה היא מתקדמת לכיוון הפוך לגרדיאנט (כיוון שהגרדיאנט מראה את השיפוע כלפי מעלה) כך שבכל שלב יש התקדמות נגד השיפוע המקסימלי עד שמגיעשמגיעים לנקודה מספיק מינימליתנמוכה המוגדרת בשלבבתנאי העצירה. דבר זה דומה לאדם העומד בנקודה על המפה הטופוגרפית אך ישנו ערפל סמיך אשר עוצר בעדו. לכן באפשרותו לבדוק רק בסביבה הקרובה לו איפההיכן הזווית הכי תלולה של המדרון ודרכה הוא יורד.
 
== תיאור מתמטי==