אופטימיזציה (מתמטיקה) – הבדלי גרסאות

תוכן שנמחק תוכן שנוסף
מאין תקציר עריכה
שורה 87:
 
== שימושים ==
 
=== כלכלה ===
====מיקרו-כלכלה====
שורה 128 ⟵ 127:
==== למידת חיזוק ====
בלמידת חיזוק בדרך כלל מטרת האלגוריתם היא למצוא את הפעולה או את המדיניות האופטימלית בעבור הסוכן, בכדי למקסם את התגמול. לשם כך נשתמש באלגוריתמי אופטימיזציה כגון אלגוריתם [[Q-learning]] למציאת מדיניות.
 
 
==בעיות NP באופטימיזציה==