机器学习原理及应用

作者
吕云翔 王渌汀 袁琪
丛书名
面向新工科普通高等教育系列教材
出版社
机械工业出版社*
ISBN
9787111682943
简要
简介
内容简介书籍计算机书籍 《机器学习原理及应用》以机器学习及其算法为主题,详细介绍其理论细节与应用方法。《机器学习原理及应用》共19章,分别介绍了机器学习概述、线性回归与*大熵模型、k近邻算法、决策树模型、朴素贝叶斯分类器、支持向量机模型、集成学习、EM算法、降维算法、聚类算法、神经网络模型等基础模型或算法,以及8个综合项目实例。《机器学习原理及应用》重视理论与实践相结合,希望为读者提供全面而细致的学习指导。 《机器学习原理及应用》可作为高等院校计算机科学与技术、软件工程等相关专业的教材,也适合机器学习初学者、相关行业从业人员阅读。
目录
前言
第1章机器学习概述
1.1机器学习的组成
1.2分类问题和回归问题
1.3监督学习、半监督学习和
无监督学习
1.4生成模型和判别模型
1.5模型评估
1.5.1训练误差和泛化误差
1.5.2过拟合和欠拟合
1.6正则化
1.7Scikitlearn模块
1.7.1数据集
1.7.2模型选择
1.8习题
第2章线性回归及最大熵模型
2.1线性回归
2.1.1一元线性回归
2.1.2多元线性回归
2.2广义线性回归
2.2.1逻辑回归
2.2.2多分类逻辑回归
2.2.3交叉熵损失函数
2.3最大熵模型
2.3.1最大熵模型的导出
2.3.2最大熵模型与逻辑回归之间的
关系
2.4评价指标
2.4.1混淆矩阵
2.4.2准确率
2.4.3精确率与召回率
2.4.4PR曲线
2.4.5ROC曲线与AUC曲线
2.5实例:基于逻辑回归实现乳腺癌
预测
2.6习题
第3章k近邻算法
3.1k值的选取
3.2距离的度量
3.3快速检索
3.4实例:基于k近邻实现鸢尾花
分类
3.5习题
第4章决策树模型
4.1特征选择
4.1.1信息增益
4.1.2信息增益比
4.2决策树生成算法CART
4.3决策树剪枝
4.3.1预剪枝
4.3.2后剪枝
4.4实例:基于决策树实现葡萄酒
分类
4.5习题
第5章朴素贝叶斯分类器
5.1极大似然估计
5.2朴素贝叶斯分类
5.3拉普拉斯平滑
5.4朴素贝叶斯分类器的极大似然
估计解释
5.5实例:基于朴素贝叶斯实现垃圾
短信分类
5.6习题
第6章支持向量机模型
6.1最大间隔及超平面
6.2线性可分支持向量机
6.3合页损失函数
6.4核技巧
6.5二分类问题与多分类问题
6.5.1一对一
6.5.2一对多
6.5.3多对多
6.6实例:基于支持向量机实现
葡萄酒分类
6.7习题
第7章集成学习
7.1偏差与方差
7.2Bagging及随机森林
7.2.1Bagging
7.2.2随机森林
7.3Boosting及AdaBoost
7.3.1Boosting
7.3.3AdaBoost
7.4提升树
7.4.1残差提升树
7.4.2GBDT
7.4.3XGBoost
7.5Stacking
7.6实例:基于梯度下降树实现
波士顿房价预测
7.7习题
第8章EM算法及其应用
8.1Jensen不等式
8.2EM算法
8.3高斯混合模型
8.4隐马尔可夫模型
8.4.1计算观测概率的输出
8.4.2估计隐马尔可夫模型的参数
8.4.3隐变量序列预测
8.5实例:基于高斯混合模型实现
鸢尾花分类
8.6习题
第9章降维算法
9.1主成分分析
9.1.1方差即协方差的无偏估计
9.1.2实例:基于主成分分析实现
鸢尾花数据降维
9.2奇异值分解
9.2.1奇异值分解的构造
9.2.2奇异值分解用于数据压缩
9.2.3SVD与PCA的关系
9.2.4奇异值分解的几何解释
9.2.5实例:基于奇异值分解实现图片
压缩
9.3习题
第10章聚类算法
10.1距离度量
10.1.1闵可夫斯基距离
10.1.2余弦相似度
10.1.3马氏距离
10.1.4汉明距离
10.2层次聚类
10.3KMeans聚类
10.4KMedoids聚类
10.5DBSCAN
10.6实例:基于KMeans实现
鸢尾花聚类
10.7习题
第11章神经网络与深度学习
11.1神经元模型
11.2多层感知机
11.3损失函数
11.4反向传播算法
11.4.1梯度下降法
11.4.2梯度消失及梯度爆炸
11.5卷积神经网络
11.5.1卷积
11.5.2池化
11.5.3网络架构
11.6循环神经网络
11.7生成对抗网络
11.8图卷积神经网络
11.9深度学习发展
11.10实例:基于卷积神经网络
实现手写数字识别
11.10.1MINST数据集
11.10.2基于卷积神经网络的手写
数字识别
11.11习题
第12章案例1:基于回归问题、
XGBoost的房价预测
12.1XGBoost模型介绍
12.2技术方案
12.2.1数据分析
12.2.2XGBoost模型参数
12.2.3调参过程
12.3完整代码及结果展示
第13章案例2:影评数据分析与
电影推荐
13.1明确目标与数据准备
13.2工具选择
13.3初步分析
13.3.1用户角度分析
13.3.2电影角度分析
13.4电影推荐
第14章案例3:汽车贷款违约的
数据分析
14.1数据分析常用的Python
工具库
14.2数据样本分析
14.2.1数据样本概述
14.2.2变量类型分析
14.2.3Python代码实践
14.3数据分析的预处理
14.3.1目标变量探索
14.3.2X变量初步探索
14.3.3连续变量的缺失值处理
14.3.4分类变量的缺失值处理
14.4数据分析的模型建立与模型
评估
14.4.1数据的预处理与训练集划分
14.4.2采用回归模型进行数据分析
14.4.3采用决策树模型进行数据
分析
14.4.4采用随机森林模型优化
决策树模型
第15章案例4:基于KNN模型预测
葡萄酒种类的数据分析与
可视化
15.1KNN模型的初级构建
15.2使用专业工具包构建KNN
模型
15.3数据可视化
第16章案例5:使用Keras进行人
脸关键点检测
16.1深度学习模型
16.1.1数据集获取
16.1.2卷积神经网络的搭建与训练
16.2模型评价
16.3训练历史可视化
第17章案例6:股价预测
17.1使用tsfresh进行升维和特征
工程
17.2程序设计思路
17.3程序设计步骤
17.3.1读入数据,分析数据
17.3.2移窗
17.3.3升维
17.3.4方差过滤
17.3.5使用Adaboost模型进行回归
预测
17.3.6预测结果分析
第18章案例7:用户流失预警
18.1读入数据
18.2数据预处理
18.3五折交叉验证
18.4代入三种模型
18.5调整prob阈值,输出精度
评估
第19章案例8:机器人最优路径
走迷宫
19.1关键技术
19.1.1马尔科夫决策过程
19.1.2Bellman方程
19.2程序设计步骤
19.2.1初始化迷宫地图
19.2.2计算不同位置最优路径
参考文献

推荐

车牌查询
桂ICP备20004708号-3