作者:王瑞军, 苏蕊著
出版社: 中国原子能出版社
CIP号:2019149805
书号:978-7-5022-9904-0
出版地:北京
出版时间:2019.7
定价:¥158.0
大数据时代,大量数据的采集、分析、挖掘、开发和利用促使产业转型升级,利用大数据技术对海量数据进行相关分析,对产业发展做出准确预测,指导产业生产经营管理正确决策。本书以“大数据技术基础”为选题,共分为两篇:理论篇围绕大数据技术、Linux操作系统、hadoop使用、分布式文件系统HDFS、网络爬虫技术、Hadoop上的数据仓库Hive、Spark的安装和使用、GPU计算基础和分布式数据库HBase展开论述;实践篇重点探讨阿里云中搭建大数据实验环境、评分推荐系统、用户行为分析以及实时日志流处理。