全书在内容上共分成12章:第1章主要讲解了大数据技术概念、架构、整体技术;第2章大数据采集及预处理;第3章主要讲解了大数据分析的方法、流程、主要技术;第4章大数据可视化,主要讲解了大数据可视化的过程和可视化工具Tableau;第5章主要讲解了Hadoop的架构;第6章主要讲解了HDFS的体系结构、工作原理和Common模块;第7章主要讲解了MapReduce的架构、原理和工作流程;第8章主要讲解了NoSQL的基本知识和典型工具;第9章主要讲解了Spark生态系统的组成;第10章主要讲解了云计算的服务模式、部署模式;第11章典型大数据解决方案,主要讲解了各种大数据解决方案;第12章大数据应用案例分析(医疗领域),主要讲解了大数据在医疗领域的应用案例。