本书分为三篇,分别是认知篇、分化篇、实践篇。认知篇(第1~7章)归纳了什么是科学,数据科学的范围、定义与实践价值,以及辩证思维、哲学和实验的关系等问题。这些是认知观点的基石。分化篇(第8~11章)重点介绍了数据科学中与现代社会各行业联系最为紧密的统计学、信息论、算法学,另外把混沌论作为一个知识点进行了补充。这些是认知观点在不同细分学科中所形成的一些具体解决问题的思维方式和科学观点。实践篇(第12~18章)沿着数据生命周期进行演进。任何行业的数据生命周期都是按照采集、存储、统计与建模、算法、可视化与分析、决策支持的沿革来进行的。本篇对各个环节的注意事项和思维方式都做了详细的讨论,第18章介绍了两个具体的数据分析案例。