یادگیری ماشین - جلسه 16 کاربردهای یادگیری تقویتی، فرایند تصمیم مارکوف (MDP)، تعریف توابع ارزش و سیاست، تابع ارزش، تابع ارزش بهینه، الگوریتم تکرار ارزش، الگوریتم تکرار سیاست ویدئو های کامل درس در:http://maktabkhooneh.org/course?course=andrew647
1:17:18
masnadi 2803 مشاهده
1:16:59
masnadi 2591 مشاهده
1:16:37
masnadi 2938 مشاهده
1:27
masnadi 3316 مشاهده
5:49
masnadi 4596 مشاهده
21:13
simpliv 904 مشاهده
13:23
marm0lak 2667 مشاهده