本教程以大数据和人工智能专业的学生为读者对象,讲解数据准备、数据清洗、特征工程、特征选择和划分数据集的方法与实践,从而使学习者掌握数据准备和预处理的流程及常用方法,为将来的项目实践奠定基础。强调工程实践,这也是本书作者所有书籍的共同特点。书中通过大量案例,向读者演示了各种方法的具体实现方式。基础与前沿结合。书中在“基础知识”环节介绍相关的基本实现方法,但是因为现实项目的复杂性,除了基础知识之外,在具体项目中,还会用到各种工具,也包括最新的研发成果。为此专设了“扩展探究”,读者通过此“天窗“了解更精彩的内容。以案例为载体,传授思想方法。数据科学项目需要严谨、科学的思想方法,这些方法又不是简单说教就能让学习者掌握的,本书中以“项目案例”为载体,不仅讲述操作技法,还让读者体验其中的思想方法,并且在“动手练习”中提供了练习项目,借以检验和巩固所学内容。