MARC状态:审校 文献类型:中文图书 浏览次数:34
- 题名/责任者:
- ChatGPT原理与实战:大型语言模型的算法、技术和私有化/刘聪等著
- 出版发行项:
- 北京:机械工业出版社,2023-08-01
- ISBN及定价:
- 978-7-111-73303-4/CNY99.00
- 载体形态项:
- 304页;24cm
- 个人责任者:
- 刘聪
- 学科主题:
- 人工智能-应用-自然语言处理-软件工具
- 中图法分类号:
- TP391
- 提要文摘附注:
- 本书从逻辑上分三部分。第一部分(第1和2章)从宏观角度带领读者了解ChatGPT。第1章介绍ChatGPT的由来、发展史以及用例。第2章对ChatGPT进行解构,基于AIGC相关背景知识逐步展开ChatGPT背后所应用的技术栈,让读者对ChatGPT有更加完整的认知。第二部分(第3~9章)介绍ChatGPT的核心技术。第3章介绍基于Transformer结构的预训练语言模型。第4章介绍强化学习的基础知识。第5章介绍从提示学习与大型语言模型涌现出来的上下文学习、思维链等能力。第6章介绍大型语言模型的训练方法及常见的分布式训练框架。第7章重点对GPT系列模型进行分析。第8章介绍PPO强化学习算法以及基于人工反馈的强化学习整体框架的设计。第9章进行类ChatGPT的实战,通过文档生成问题任务模拟完整的ChatGPT训练过程。第三部分(第10章)对ChatGPT的未来发展进行展望。从AIGC未来发展方向出发,探索云边协同、工具应用、可控生成、辅助决策四方面内容,分别从C端场景和B端场景探索ChatGPT与实际应用场景的结合点,并给出从事AIGC行业的参考建议。
- 使用对象附注:
- 程序员及相关读者
全部MARC细节信息>>



