אופטימיזציה (מתמטיקה) – הבדלי גרסאות
תוכן שנמחק תוכן שנוסף
מאין תקציר עריכה |
|||
שורה 87:
== שימושים ==
=== כלכלה ===
====מיקרו-כלכלה====
שורה 128 ⟵ 127:
==== למידת חיזוק ====
בלמידת חיזוק בדרך כלל מטרת האלגוריתם היא למצוא את הפעולה או את המדיניות האופטימלית בעבור הסוכן, בכדי למקסם את התגמול. לשם כך נשתמש באלגוריתמי אופטימיזציה כגון אלגוריתם [[Q-learning]] למציאת מדיניות.
==בעיות NP באופטימיזציה==
|