Hadoop生态系统

《Hadoop生态系统》

作者:

出版社: 中国电力出版社

CIP号:2016174896

书号:978-7-5123-9598-5

出版地:北京

出版时间:2016.7

定价:¥28


简介

本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在。主要包括如下主题:核心技术,Hadoop分布式文件系统(HDFS)、MapReduce、YARN和Spark。数据库和数据管理,Cassandra、HBase、MongoDB和Hive。序列化,Avro、JSON和Parquet。管理和监视,Puppet、Chef、Zookeeper和Oozie。分析辅助,Pig、Mahout和MLLib。数据传输,Scoop、Flume、distcp和Storm。安全、访问控制和审计——Sentry、Kerberos和Knox。云计算和虚拟化——Serengeti、Docker和Whirr。

推荐

车牌查询
桂ICP备20004708号-3