西湖大学:强化学习的数学原理
课程简介
- 先修要求:随机过程,深度学习
- 主要内容:强化学习基础的数学推导,包括 Bellman (optimal) equation、value/policy iteration、Monte Carlo 算法、时序差分算法、value/policy function approximation 等内容
这门课程由西湖大学的赵世钰老师讲授,主要包括强化学习的基础内容,总体偏向数学,但给出了必要的伪代码。虽然说这门课是一门数学课,但是赵世钰老师浅显易懂地讲授方式和无比连贯的授课思路非常引人入胜,在观看的过程中你会“无意识间”学会诸多基础算法,并且从源头上知道它们是怎么样一步一步推导出来的。
不过,这门课的内容相对简单,适合于仅仅想了解强化学习或者想要入门的同学,更深入的话还需要学习其它课程。
如果你想在学习理论的同时也进行一些代码实践,可以考虑参考DRL-pytorch这个仓库,或者参考上海交大张伟楠老师的动手学强化学习的代码部分(个人感觉该书理论部分写得不太好,不推荐阅读)。
相关链接
- 课程视频:BiliBili
- 课程教材和 PPT 见视频简介。
- 参考代码: https://github.com/jwk1rose/RL_Learning