无锡城市职业技术学院图书馆书目检索系统

| 暂存书架(0) | 登录

MARC状态:审校  文献类型:中文图书 浏览次数:18 

题名/责任者:
Python深度强化学习入门:强化学习和深度学习的搜索与控制/(日) 伊藤多一 ... [等] 著 王卫兵, 杨秋香等译
出版发行项:
北京:机械工业出版社,2022.4
ISBN及定价:
978-7-111-70072-2/CNY89.00
载体形态项:
xi, 239页:图;24cm
其它题名:
强化学习和深度学习的搜索与控制
个人责任者:
伊藤多一
个人责任者:
今津义充
个人责任者:
须藤广大
个人次要责任者:
王卫兵
个人次要责任者:
杨秋香
学科主题:
软件工具-程序设计
中图法分类号:
TP311.561
中图法分类号:
TP311
题名责任附注:
题名页题其余责任者:今津义充, 须藤广大, 仁平将人等
出版发行附注:
由翔泳社授权
书目附注:
有书目 (第238-239页)
提要文摘附注:
本书共7章。其中,第1章介绍了机器学习的分类、强化学习的学习机制以及深度强化学习的概念;第2章通过强化学习的基本概念、马尔科夫决策过程和贝尔曼方程、贝尔曼方程的求解方法、无模型控制等介绍了强化学习的基本算法;第3章通过深度学习、卷积神经网络(CNN)、循环神经网络(RNN)介绍了强化学习中深度学习的特征提取方法;第4章通过行动价值函数的网络表示、策略函数的网络表示介绍了深度强化学习的实现;第5章通过策略梯度法的连续控制、学习算法和策略模型等,详细介绍了深度强化学习在连续控制问题中的应用及具体实现;第6章通过巡回推销员问题和魔方问题详细介绍了深度强化学习在组合优化中的应用及具体实现;第7章通过SeqGAN的文本生成和神经网络的架构搜索详细介绍了深度强化学习在时间序列数据生成的应用。在附录中还给出了Colaboratory和Docker等深度强化学习开发环境的构建。
使用对象附注:
软件程序设计人员。
全部MARC细节信息>>
索书号 条码号 年卷期 馆藏地 附件 说明 书刊状态 还书位置
TP311/613 000905257   六楼书库 图书定位    可借 六楼书库
显示全部馆藏信息
借阅趋势

您可能感兴趣的图书(点击查看)
同名作者的其他著作(点击查看)
用户名:
密码:
验证码:
请输入下面显示的内容
  证件号 条码号 Email
 
姓名:
手机号:
送 书 地:
收藏到: 管理书架