机读格式显示(MARC)
- 000 01804nam0 2200301 450
- 010 __ |a 978-7-115-66930-8 |d CNY89.80
- 100 __ |a 20251025d2025 em y0chiy50 ea
- 200 1_ |a DeepSeek架构详解与应用实战 |A DeepSeek jia gou xiang jie yu ying yong shi zhan |f 薛栋 ... [等] 编著
- 210 __ |a 北京 |c 人民邮电出版社 |d 2025.07
- 215 __ |a 228页 |c 图 |d 24cm
- 304 __ |a 题名页题其余责任者: 刘昌鑫, 陶阳, 万锋
- 314 __ |a 薛栋, 华东理工大学信息科学与工程学院副教授、硕士生导师, 德国慕尼黑工业大学工学博士, 上海市浦江人才计划入选者 ; 长期从事与人工智能和大数据相关的研究, 如自然语言处理与大语言模型、工业互联网与工业软件、复杂网络与多智能体系统等 ; 以第一作者或通讯作者身份在IEEE TAC.IEEE TSP、IEEE TNSE等国际期刊上发表SCI论文30余篇 ; 主持和参与完成多个项目, 如国家自然科学基金项目、上海市人才计划项目、企业科研攻关项目等;所在的X-D Lab (心动实验室) 致力于人工智能技术的探索与研究, 实验室已发布多个垂直领域的大模型项目, 如心理领域的MindChat (漫谈)、医疗领域的Sunsimiao (孙思邈)、教育领域的GradChat (锦鲤)。
- 330 __ |a 本书系统地介绍了DeepSeek大模型的底层架构、原理、技术创新以及应用实战。全书共分为10章, 内容涵盖了DeepSeek的介绍、架构设计、硬件协同、训练与推理技术、语义理解与生成、多模态处理、API应用以及模型微调与定制等方面。在架构设计方面, 书中详细阐述了DeepSeek的整体框架、模块划分以及混合专家架构 (MoE) 等核心技术, 同时对比分析了其与其他主流大模型的差异。
- 606 0_ |a 人工智能 |A ren gong zhi neng
- 610 0_ |a DeepSeek |A Deepseek
- 701 _0 |a 薛栋 |A xue dong |4 编著
- 701 _0 |a 刘昌鑫 |A liu chang xin |4 编著
- 701 _0 |a 陶阳 |A tao yang |4 编著
- 701 _0 |a 万锋 |A wan feng |4 编著
- 801 _0 |a CN |b 人天书店 |c 20251025
- 905 __ |a WXCSXY |d TP18/996