作者:
出版社: 中国铁道出版社有限公司
CIP号:2019119302
书号:978-7-113-25919-8
出版地:北京
出版时间:2019.6
定价:¥36.0
本书从Hadoop的原理和使用出发,在重点介绍Hadoop生态系统的重要组件HDFS、MapReduce、YARN、Hive和Spark的同时,注重大数据分析能力的全面提高。本书共分13章,主要内容包括Hadoop简介、HDFS文件系统、YARN资源管理、MapReduce计算框架、Hive简介,Hive数据定义、Hive数据操作、Hive数据查询、Spark简介、Spark大数据处理、Spark机器学习流程,Spark有监督学习和Spark无监督学习模型。本书内容丰富、体系新颖、结构合理、文句精练,适合作为普通高等院校信息类专业的Hadoop大数据分析课程的教材,也可以作为数据科学行业相关从业人员的自学教材。