作者:
出版社: 东南大学出版社
CIP号:2015165737
书号:978-7-5641-5917-7
出版地:南京
出版时间:2015.8
定价:¥99.0
通过这本综合性指南的第四版,你将会学习到如何通过Apache Hadoop建立和维护可靠的、可扩展的分布式系统。本书是期望分析任意大小的数据集的程序员以及想建立和运行Hadoop集群的管理员的理想选择。在这本面向Hadoop 2的新版书籍中,作者Tom White增加了关于YARN和一些Hadoop的相关项目如Parquet, Flume, Crunch和Spark的新章节。你将会了解到Hadoop版本的最新变化,并且研究在医疗健康系统和基因数据处理中Hadoop的应用案例。