MARC状态:审校 文献类型:中文图书 浏览次数:16
- 题名/责任者:
- DeepSeek架构详解与应用实战/薛栋 ... [等] 编著
- 出版发行项:
- 北京:人民邮电出版社,2025.07
- ISBN及定价:
- 978-7-115-66930-8/CNY89.80
- 载体形态项:
- 228页:图;24cm
- 个人责任者:
- 薛栋 编著
- 个人责任者:
- 刘昌鑫 编著
- 个人责任者:
- 陶阳 编著
- 个人责任者:
- 万锋 编著
- 学科主题:
- 人工智能
- 非控制主题词:
- DeepSeek
- 中图法分类号:
- TP18
- 题名责任附注:
- 题名页题其余责任者: 刘昌鑫, 陶阳, 万锋
- 责任者附注:
- 薛栋, 华东理工大学信息科学与工程学院副教授、硕士生导师, 德国慕尼黑工业大学工学博士, 上海市浦江人才计划入选者 ; 长期从事与人工智能和大数据相关的研究, 如自然语言处理与大语言模型、工业互联网与工业软件、复杂网络与多智能体系统等 ; 以第一作者或通讯作者身份在IEEE TAC.IEEE TSP、IEEE TNSE等国际期刊上发表SCI论文30余篇 ; 主持和参与完成多个项目, 如国家自然科学基金项目、上海市人才计划项目、企业科研攻关项目等;所在的X-D Lab (心动实验室) 致力于人工智能技术的探索与研究, 实验室已发布多个垂直领域的大模型项目, 如心理领域的MindChat (漫谈)、医疗领域的Sunsimiao (孙思邈)、教育领域的GradChat (锦鲤)。
- 提要文摘附注:
- 本书系统地介绍了DeepSeek大模型的底层架构、原理、技术创新以及应用实战。全书共分为10章, 内容涵盖了DeepSeek的介绍、架构设计、硬件协同、训练与推理技术、语义理解与生成、多模态处理、API应用以及模型微调与定制等方面。在架构设计方面, 书中详细阐述了DeepSeek的整体框架、模块划分以及混合专家架构 (MoE) 等核心技术, 同时对比分析了其与其他主流大模型的差异。
全部MARC细节信息>>



