欢迎光临
我们一直在努力

《深入浅出强化学习:编程实战》-郭宪

《深入浅出强化学习:编程实战》-郭宪

内容简介:

本书是《深入浅出强化学习:原理入门》的姊妹篇,写作的初衷是通过编程实例帮助那些想要学习强化学习算法的读者更深入、更清楚地理解算法。本书首先介绍马尔可夫决策过程的理论框架,然后介绍基于动态规划的策略迭代算法和值迭代算法,在此基础上分3篇介绍了目前强化学习算法中很基本的算法。篇讲解基于值函数的强化学习算法,介绍了基于两种策略评估方法(蒙特卡洛策略评估和时间差分策略评估)的强化学习算法,以及如何将函数逼近的方法引入强化学习算法中。第2篇讲解直接策略搜索方法,介绍了基本的策略梯度方法、AC方法、PPO方法和DDPG算法。第3篇讲解基于模型的强化学习方法,介绍了基于MPC的方法、AlphaZero算法基本原理及在五子棋上的具体实现细节。建议读者根据书中的代码亲自动手编程,并修改程序中的超参数,根据运行结果不断体会算法原理。

下载地址:

此站大部分下载链接失效了,以后只在新的网站更新维护。新的电子书网址:https://www.mq59.com

[ARFormslite id=100]
赞(0) 打赏
免责声明:本站所有资源来源于互联网,仅供个人学习交流,网站本身不存储任何相关资源文件,如资源下载链接侵犯到版权方,请发送邮件到1401211620@qq.com,站长核实后会第一时间移除,谢谢!
请于下载后24小时内删除,不允许用于商业用途,否则法律问题自行承担。
分享到: 更多 (0)

宝阳读书小站-mobi+epub+azw3+pdf电子书免费下载

联系我们关于我们

收集不易,觉得内容对你有帮助,可以打赏资助下站长

非常感谢你的打赏

支付宝扫一扫打赏

微信扫一扫打赏