اپیزود یک: معرفی RL00:46:44
اپیزود دو: Multi Armed Bandit00:41:28
اپیزود سه: Markov Decision2:12:34
مبانی و پیشنیازهای ریاضی – بخش دوم00:00
مبانی ریاضی و پیشنیازها – بخش سوم00:00
اپیزود پنج، قسمت یک: Model free prediction1:57:29
اپیزود پنج، قسمت دو: Model free prediction00:41:54
اپیزود شش، قسمت یک : Model free Control00:52:35
اپیزود شش، قسمت دو : Model free Control00:24:12
اپیزود شش، قسمت سه : Model free Control00:45:2
اپیزود هفت، قسمت یک: Value function1:40:11
اپیزود هفت قسمت دو: Value function1:24:21
الگوریتمهای مبتنی بر TD00:00
مسئله باندیت چند مسلح (MAB Problem) بخش اول: تعریف و مثال00:00
مسئله باندیت چند مسلح (MAB Problem) بخش دوم: استراتژیهای اکتشاف00:00
کاربردها و باندیتهای متنی (Applications and Contextual Bandits) بخش اول: کاربردها و مثالها00:00
کاربردها و باندیتهای متنی (Applications and Contextual Bandits) بخش دوم: باندیت متنی (Contextual Bandit)00:00