机读格式显示(MARC)
- 000 01473nam0 2200265 450
- 010 __ |a 978-7-121-30236-7 |d CNY99.00
- 100 __ |a 20170111d2017 em y0chiy50 ea
- 200 1_ |a 图解Spark |A tu jieSpark |e 核心技术与案例实战 |f 郭景瞻编著
- 210 __ |a 北京 |c 电子工业出版社 |d 2017.1
- 215 __ |a 466页 |c 图 |d 24cm
- 330 __ |a 本书以Spark 2.0版本为基础进行编写,全面介绍了Spark核心及其生态圈组件技术。主要内容包括Spark生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介绍了消息通信框架、作业调度、容错执行、监控管理、存储管理以及运行框架,同时还介绍了Spark生态圈相关组件,包括了Spark SQL的即席查询、Spark Streaming的实时流处理应用、MLbase/MLlib的机器学习、GraphX的图处理、SparkR的数学计算和Alluxio的分布式内存文件系统等。本书从Spark核心技术进行深入分析,重要章节会结合源代码解读其实现原理,围绕着技术原理介绍了相关典型实例,读者通过这些实例可以更加深入地理解Spark的运行机制。另外本书还应用了大量的图表进行说明,通过这种方式让读者能够更加直观地理解Spark相关原理。
- 333 __ |a 本书不仅适合大数据、spark从业人员阅读,同时也适合大数据爱好者、架构师和软件开发人员阅读。
- 517 1_ |a 核心技术与案例实战 |A he xin ji shu yu an li shi zhan
- 606 0_ |a 数据处理软件 |A shu ju chu li ruan jian |j 图解
- 701 _0 |a 郭景瞻 |A guo jing zhan |4 编著
- 801 _0 |a CN |b WXCSXY |c 20180626
- 905 __ |a WXCSXY |d TP274/317