作者 |
康海刚 段班祥 |
丛书名 |
出版社 |
机械工业出版社* |
ISBN |
9787111645603 |
简要 |
简介 |
内容简介 机械工业出版社本教材首先介绍了数据分析的基本概念和方法,然后通过大量实例介绍了如何使用Matlab实现数据分析,并深入浅出地介绍了数据建模过程中的有关方法。本教材共分8章,主要内容包括:数据的基本概念及其应用、Matlab基础、随机模拟、数据预处理、数据探索与分析、多元线性回归模型、聚类分析和分类。本教材可作为职业院校计算机相关专业的教学用书,也可供相关技术人员参考。 |
目录 |
前言 第1章数据的基本概念及其应用 11数据与数据处理 111数据的相关基本概念 112数据处理的主要概念 113数据处理的流程 114数据处理的误区 12数据处理涉及的主要领域 121统计学 122数据挖掘 123云计算 13数据处理的主要方法 131数据采集 132数据预处理 133数据分析 134数据挖掘算法 第2章Matlab基础 21Matlab简介 211Matlab的特点 212Matlab窗口简介 22数组及其运算 221变量和数组 222变量的初始化 223多维数组 224子数组 225单元阵列 226显示输出数据 227数据文件 228数组运算和矩阵运算 229内置函数 23作图入门 231简单的直角坐标系作图 232作图的附加特性 24Matlab程序设计 241关系运算符和逻辑运算符 242选择结构 243循环结构 25自定义函数 第3章随 机 模 拟 31随机数的生成 32蒙特卡罗模拟 321蒙特卡罗模拟估计面积 322蒙特卡罗模拟寻求近似圆周率 323蒙特卡罗模拟解决生日问题 33随机行为的模拟 34蒙特卡罗模拟应用案例:理发店系统研究 Matlab数据分析第1章数据的基本概念及其应用第4章数据预处理 41认识数据 411属性 412离散属性和连续属性 42数据预处理概述 421数据清洗 422数据集成 423数据归约 424数据变换 43Matlab与Excel的数据交互 431以交互方式导入数据 432读取和写入表 433大型文件和大型数据简介 434数据的清理、平滑和分组等 第5章数据探索与分析 51数据的特征统计量 511中心度量趋势:均值、中位数、众数 512常用的变异程度度量 513分布形态 52基本统计描述的可视化 521分类型数据频数分布及其可视化 522直方图 523分位数图和经验累计分布函数 524分位数分位数图——qq图 525箱形图 526散点图 53度量数据的相似性和相异性 531数据矩阵、相异性矩阵、相似性矩阵 532数值属性的相似性:相关系数 533数值属性的相异性:距离 54数据降维——主成分分析 第6章多元线性回归模型 61概述 62一元曲线拟合 621案例1——百货商场销售额 622确定最优拟合 623导出模型到工作空间 63多元线性回归模型 631案例2——牙膏的销售量 632案例3——自变量含有分类变量的处理 64逐步回归模型 第7章聚 类 分 析 71简介 711聚类分析的类型 712聚类分析的依据 72谱系聚类 73k均值聚类 731k均值聚类概述 732k均值聚类算法的Matlab函数 733k均值聚类算法的特点 734k均值聚类算法综合应用 74层次聚类 741概述 742层次聚类算法的Matlab实现 743层次聚类算法的特点 75高斯混合模型聚类 751简介 752高斯混合模型聚类算法的Matlab实现 第8章分类 81分类算法简介 811逻辑回归分类算法 812K近邻分类算法 813支持向量机分类算法 814人工神经网络分类算法 815朴素贝叶斯分类算法 816判别分析分类算法 817决策树分类算法 818集成学习分类算法 82分类的评判 821评判指标 822ROC曲线和AUC 83判别分析分类的具体应用 831判别分析的定义、特点和类型 832距离判别 833贝叶斯判别 84使用Classification Learner App实现分类 参 考 文 献 |