یادگیری ماشین - جلسه 18
پاداش¬های حالت-عمل، MDP با افق محدود، مفهوم سیستم¬های دینامیکی، مثالی از مدل¬های دینامیک، تعدیل درجه دو خطی، خطی¬سازی یک مدل غیر خطی، محاسبه¬ی پاداش، معادله¬ی ریکاتی
ویدئو های کامل درس در:
http://maktabkhooneh.org/course?course=andrew647