MARC状态:审校 文献类型:中文图书 浏览次数:15
- 题名/责任者:
- 数据科学与大数据技术导论/(美) 奥弗·曼德勒维奇, 凯西·斯特拉, 道格拉斯·伊德里恩著 唐金川译
- 出版发行项:
- 北京:机械工业出版社,2018
- ISBN及定价:
- 978-7-111-60034-3/CNY59.00
- 载体形态项:
- xiv, 178页:图;26cm
- 统一题名:
- Practical data science with hadoop and spark designing and building effective analytics at scale
- 丛编项:
- 数据科学与工程技术丛书
- 个人责任者:
- 曼德勒维奇 (Mendelevitch, Ofer) 著
- 个人责任者:
- 斯特拉 (Stella, Casey) 著
- 个人责任者:
- 伊德里恩 (Eadline, Douglas) 著
- 个人次要责任者:
- 唐金川 译
- 学科主题:
- 数据处理
- 中图法分类号:
- TP274
- 出版发行附注:
- 本书中文简体字版由Pearson Education (培生教育出版集团) 授权机械工业出版社在中华人民共和国境内独家出版发行
- 责任者附注:
- 奥弗·曼德勒维奇, 是Lendup公司的数据科学副总裁。凯西·斯特拉, 是Hortonworks的首席数据科学家。道格拉斯·伊德里恩, 是以Linux集群高性能计算解决方案的实践者和高性能计算发展编年史撰写者开始职业生涯的。唐金川, 《美国机器学习实践》联合作者。
- 提要文摘附注:
- 本书概要介绍了如何使用Hadoop和Spark处理数据科学涉及的一系列主题: 数据提取、数据再加工 (data munging, 通常包含数据清洗和整合)、特征提取、机器学习、预测建模、异常检测和自然语言处理。整书侧重于具体的例子, 并通过不同方式来提供对商业价值的洞察, 全书共分三部分, 第一部分包括第1、2、3章, 概述了数据科学及其历史演变, Hadoop及其演进史, 以及Hadoop生态系统中的各种工具; 第二部分包括第4、5、6章, 讨论了将数据集从外部源导入Hadoop的各种工具和技术、使用Hadoop进行数据再加工, 以及大数据的可视化; 第三部分包括第7、8、9、10、11、12章, 介绍了对机器学习的高层次理解, 预测建模的基本算法和各种Hadoop工具, 各种聚类分析, 异常检测的各种方法和算法, 将数据科学应用于自然语言处理, 以及Hadoop环境下数据科学的未来, 最后在附录中提供了本书参考材料。
全部MARC细节信息>>



