[套装书]程序员必会的40种算法+机器学习算法(原书第2版)(2册)

作者
伊姆兰·艾哈迈德 朱塞佩·博纳科尔索
丛书名
华章程序员书库
出版社
机械工业出版社
ISBN
9782109241731
简要
简介
内容简介书籍计算机书籍 ---------------------------8083974 - 程序员必会的40种算法--------------------------- 本书致力于利用算法求解实际问题。第1部分介绍算法的核心内容,探讨什么是算法、如何设计算法,同时学习在算法中使用的数据结构。重点讲解排序算法、查找算法和求解图问题的算法。第二部分讨论各种机器学习算法,包括无监督机器学习算法和传统有监督学习算法,详细讨论一些自然语言处理算法和推荐引擎。第三部分讨论更高级的算法概念,重点介绍了密码算法和大规模算法。本书还包含一些案例分析(如天气预测、推文聚类和电影推荐引擎),用来说明如何才能更好地应用这些算法。 ---------------------------8067792 - 机器学习算法(原书第2版)--------------------------- 本书介绍了数据科学领域常用的所有重要机器学习算法以及TensorFlow和特征工程等相关内容。涵盖的算法包括线性回归、逻辑回归、支持向量机、朴素贝叶斯、k均值、随机森林等,这些算法可以用于监督学习、非监督学习、强化学习或半监督学习。 在本书中,你将学会如何使用这些算法来解决所遇到的问题,并了解这些算法的工作方式。本书还将介绍自然语言处理和推荐系统,这些内容将帮助大家进行多种算法的实践。 阅读完本书后,面对你所遇到的问题,你将了解如何选择合适的聚类、分类或回归的机器学习算法。
目录
[套装书具体书目]
8067792 - 机器学习算法(原书第2版) - 9787111645788 - 机械工业出版社 - 定价 99
8083974 - 程序员必会的40种算法 - 9787111690337 - 机械工业出版社 - 定价 99



---------------------------8083974 - 程序员必会的40种算法---------------------------


译者序
前言
关于作者
关于审校者
第一部分 基础与核心算法
第1章 算法概述2
1.1 什么是算法2
1.2 描述算法逻辑4
1.2.1 理解伪代码4
1.2.2 使用代码片段6
1.2.3 制定执行计划6
1.3 Python包简介7
1.3.1 Python包8
1.3.2 通过Jupyter Notebook执行Python9
1.4 算法设计技术10
1.4.1 数据维度11
1.4.2 计算维度12
1.5 性能分析13
1.5.1 空间复杂度分析13
1.5.2 时间复杂度分析14
1.5.3 性能评估14
1.5.4 选择算法15
1.5.5 大O记号15
1.6 验证算法19
1.6.1 精确算法、近似算法和随机算法19
1.6.2 可解释性20
1.7 小结20
第2章 算法中的数据结构21
2.1 Python中的数据结构21
2.1.1 列表22
2.1.2 元组26
2.1.3 字典27
2.1.4 集合28
2.1.5 数据帧30
2.1.6 矩阵32
2.2 抽象数据类型33
2.2.1 向量33
2.2.2 栈34
2.2.3 队列36
2.2.4 栈和队列背后的基本思想37
2.2.5 树38
2.3 小结40
第3章 排序算法和查找算法41
3.1 排序算法简介41
3.1.1 在Python中交换变量42
3.1.2 冒泡排序42
3.1.3 插入排序44
3.1.4 归并排序46
3.1.5 希尔排序48
3.1.6 选择排序50
3.2 查找算法简介51
3.2.1 线性查找52
3.2.2 二分查找52
3.2.3 插值查找53
3.3 实际应用54
3.4 小结56
第4章 算法设计57
4.1 算法设计基本概念57
4.1.1 第一点—所设计算法是否能产生预期的结果58
4.1.2 第二点—所设计算法是否是获取结果的最佳方法58
4.1.3 第三点—所设计算法在更大的数据集上表现如何61
4.2 理解算法策略61
4.2.1 分治策略62
4.2.2 动态规划策略64
4.2.3 贪心算法64
4.3 实际应用—求解TSP65
4.3.1 使用蛮力策略66
4.3.2 使用贪心算法68
4.4 PageRank算法70
4.4.1 问题定义70
4.4.2 实现PageRank算法70
4.5 了解线性规划73
4.6 实例—用线性规划实现产量规划73
4.7 小结76
第5章 图算法77
5.1 图的表示77
5.1.1 图的类型79
5.1.2 特殊类型的边81
5.1.3 自我中心网络82
5.1.4 社交网络分析82
5.2 网络分析理论简介83
5.2.1 理解最短路径83
5.2.2 创建邻域84
5.2.3 理解中心性度量85
5.2.4 用Python计算中心性指标87
5.3 理解图的遍历88
5.3.1 广度优先搜索89
5.3.2 深度优先搜索92
5.4 实例—欺诈分析93
5.4.1 进行简单的欺诈分析96
5.4.2 瞭望塔欺诈分析法97
5.5 小结99
第二部分 机器学习算法
第6章 无监督机器学习算法102
6.1 无监督学习简介102
6.1.1 数据挖掘生命周期中的无监督学习103
6.1.2 无监督学习的当前研究趋势105
6.1.3 实例106
6.2 理解聚类算法107
6.2.1 量化相似性107
6.2.2 分层聚类113
6.2.3 评估聚类效果115
6.2.4 聚类算法的应用115
6.3 降维116
6.3.1 主成分分析116
6.3.2 主成分分析的局限性118
6.4 关联规则挖掘119
6.4.1 实例119
6.4.2 市场购物篮分析119
6.4.3 关联规则120
6.4.4 排序规则122
6.4.5 关联分析算法123
6.5 实例—聚类相似推文127
6.5.1 主题建模128
6.5.2 聚类128
6.6 异常检测算法129
6.6.1 基于聚类的异常检测129
6.6.2 基于密度的异常检测129
6.6.3 基于支持向量机的异常检测129
6.7 小结130
第7章 传统监督学习算法131
7.1 理解监督机器学习131
7.1.1 描述监督机器学习132
7.1.2 理解使能条件134
7.1.3 区分分类器和回归器134
7.2 理解分类算法135
7.2.1 分类器挑战性问题135
7.2.2 评估分类器139
7.2.3 分类器的各个阶段142
7.2.4 决策树分类算法143
7.2.5 理解集成方法146
7.2.6 逻辑回归149
7.2.7 支持向量机算法151
7.2.8 理解朴素贝叶斯算法153
7.2.9 各种分类算法的胜者156
7.3 理解回归算法156
7.3.1 回归器挑战性问题156
7.3.2 线性回归158
7.3.3 回归树算法162
7.3.4 梯度提升回归算法163
7.3.5 各种回归算法的胜者163
7.4 实例—预测天气164
7.5 小结166
第8章 神经网络算法167
8.1 理解人工神经网络168
8.2 人工神经网络的演化169
8.3 训练神经网络171
8.3.1 解析神经网络结构171
8.3.2 定义梯度下降172
8.3.3 激活函数173
8.4 工具和框架178
8.4.1 Keras178
8.4.2 理解TensorFlow181
8.4.3 理解神经网络的类型183
8.5 迁移学习185
8.6 实例—用深度学习实现欺诈检测186
8.7 小结189
第9章 自然语言处理算法190
9.1 自然语言处理简介190
9.1.1 理解自然语言处理术语191
9.1.2 自然语言工具包192
9.2 基于词袋的自然语言处理193
9.3 词嵌入简介195
9.3.1 词的邻域195
9.3.2 词嵌入的性质195
9.4 用循环神经网络实现自然语言处理196
9.5 用自然语言处理实现情感分析197
9.6 实例—电影评论情感分析198
9.7 小结200
第10章 推荐引擎201
10.1 推荐系统简介201
10.2 推荐引擎的类型202
10.2.1 基于内容的推荐引擎202
10.2.2 协同过滤推荐引擎204
10.2.3 混合推荐引擎205
10.3 理解推荐系统的局限性207
10.3.1 冷启动问题207
10.3.2 元数据需求207
10.3.3 数据稀疏性问题207
10.3.4 由社会影响产生的偏差207
10.3.5 有限的数据207
10.4 实际应用领域208
10.5 实例—创建推荐引擎208
10.6 小结210
第三部分 高 级 主 题
第11章 数据算法212
11.1 数据算法简介212
11.2 数据存储算法简介213
11.3 流数据算法简介216
11.4 数据压缩算法简介216
11.5 实例—推文实时情感分析218
11.6 小结221
第12章 密码算法222
12.1 密码算法简介222
12.1.1 理解最薄弱环节的重要性223
12.1.2 基本术语223
12.1.3 理解安全性需求224
12.1.4 理解密码基本设计225
12.2 理解加密技术类型228
12.2.1 加密哈希函数228
12.2.2 对称加密231
12.2.3 非对称加密233
12.3 实例—机器学习模型部署时的安全问题236
12.3.1 MITM攻击236
12.3.2 避免伪装238
12.3.3 数据加密和模型加密238
12.4 小结240
第13章 大规模算法241
13.1 大规模算法简介241
13.1.1 定义精心设计的大规模算法241
13.1.2 术语242
13.2 并行算法设计242
13.2.1 阿姆达尔定律243
13.2.2 任务粒度245
13.2.3 负载均衡246
13.2.4 局部化问题246
13.2.5 在Python中启用并发处理246
13.3 制定多资源处理策略246
13.3.1 CUDA简介247
13.3.2 集群计算250
13.3.3 混合策略251
13.4 小结252
第14章 实践中要考虑的要素253
14.1 实践要素简介253
14.2 算法的可解释性254
14.3 理解伦理和算法258
14.3.1 使用学习算法易出现的问题258
14.3.2 理解伦理因素259
14.4 减少模型偏差260
14.5 处理NP难问题261
14.5.1 简化问题261
14.5.2 改造类似问题的已知求解方案261
14.5.3 使用概率方法262
14.6 何时使用算法262
14.7 小结264



---------------------------8067792 - 机器学习算法(原书第2版)---------------------------


译者序
前言
第1章机器学习简介
1.1简介——经典机器和自适应的机器
1.1.1描述性分析
1.1.2预测性分析
1.2关于学习
1.2.1监督学习
1.2.2无监督学习
1.2.3半监督学习
1.2.4强化学习
1.2.5计算神经科学
1.3超越机器学习——深度学习和基于生物启发的适应系统
1.4机器学习和大数据
1.5本章小结
第2章机器学习的重要元素
2.1数据格式
2.2可学习性
2.2.1欠拟合和过拟合
2.2.2误差度量和成本函数
2.2.3PAC学习
2.3统计学习方法介绍
2.3.1最大后验概率学习
2.3.2最大似然学习
2.4类平衡
2.4.1可置换的重采样
2.4.2合成少数类过采样
2.5信息论的要素
2.5.1熵
2.5.2交叉熵和互信息
2.5.3两个概率分布的散度
2.6本章小结
第3章特征选择与特征工程
3.1scikit-learn的toy数据集
3.2创建训练集和测试集
3.3管理分类数据
3.4管理缺失特征
3.5数据缩放和归一化
3.6特征选择和过滤
3.7主成分分析
3.7.1非负矩阵分解
3.7.2稀疏PCA
3.7.3核PCA
3.8独立成分分析
3.9原子提取和字典学习
3.10使用t-SNE可视化高维数据集
3.11本章小结
第4章回归算法
4.1线性模型
4.2一个二维的例子
4.3基于scikit-learn的线性回归和更高维
4.3.1决定系数
4.3.2可解释方差
4.3.3回归的解析表达
4.4Ridge回归、Lasso回归和ElasticNet
4.4.1Ridge回归
4.4.2Lasso回归
4.4.3ElasticNet
4.5稳健回归
4.5.1随机抽样一致算法
4.5.2Huber回归
4.6贝叶斯回归
4.7多项式回归
4.8保序回归
4.9本章小结
第5章线性分类算法
5.1线性分类
5.2逻辑回归
5.3实现和优化
5.4随机梯度下降算法
5.5被动攻击算法
5.6通过网格搜索找到最优超参数
5.7评估分类的指标
5.7.1混淆矩阵
5.7.2精确率
5.7.3召回率
5.7.4F-Beta
5.7.5Kappa系数
5.7.6分类报告
5.7.7学习曲线
5.8ROC曲线
5.9本章小结
第6章朴素贝叶斯和判别分析
6.1贝叶斯定理
6.2朴素贝叶斯分类器
6.3scikit-learn中的朴素贝叶斯
6.3.1伯努利朴素贝叶斯
6.3.2多项式朴素贝叶斯
6.3.3高斯朴素贝叶斯
6.4判别分析
6.5本章小结
第7章支持向量机
7.1线性支持向量机
7.2scikit-learn实现
7.3基于内核的分类
7.3.1径向基函数
7.3.2多项式核
7.3.3Sigmoid核
7.3.4自定义核
7.3.5非线性例子
7.4受控支持向量机
7.5支持向量回归
7.6半监督支持向量机简介
7.7本章小结
第8章决策树和集成学习
8.1二元决策树
8.1.1二元决策
8.1.2不纯度的衡量
8.1.3特征重要度
8.2基于scikit-learn的决策树分类
8.3决策树回归
8.4集成学习简介
8.4.1随机森林
8.4.2AdaBoost
8.4.3梯度树提升
8.4.4投票分类器
8.5本章小结
第9章聚类原理
9.1聚类基础
9.2k-NN算法
9.3高斯混合
9.4k-means
9.5基于样本标记的评价方法
9.5.1同质性
9.5.2完整性
9.5.3修正兰德指数
9.6本章小结
第10章高级聚类
10.1DBSCAN
10.2谱聚类
10.3在线聚类
10.3.1mini-batch k-means
10.3.2BIRCH
10.4双聚类
10.5本章小结
第11章层次聚类
11.1分层策略
11.2凝聚聚类
11.2.1树形图
11.2.2scikit-learn中的凝聚聚类
11.2.3连接限制
11.3本章小结
第12章推荐系统介绍
12.1朴素的基于用户的系统
12.2基于内容的系统
12.3无模式(或基于内存的)协同过滤
12.4基于模型的协同过滤
12.4.1奇异值分解策略
12.4.2交替最小二乘法策略
12.4.3用Apache Spark MLlib实现交替最小二乘法策略
12.5本章小结
第13章自然语言处理简介
13.1NLTK和内置语料库
13.2词袋策略
13.2.1标记
13.2.2停止词的删除
13.2.3词干抽取
13.2.4向量化
13.3词性
13.4示例文本分类器
13.5本章小结
第14章NLP中的主题建模与情感分析
14.1主题建模
14.1.1隐性语义分析
14.1.2概率隐性语义分析
14.1.3隐性狄利克雷分配
14.2使用Gensim的Word2vec简介
14.3情感分析
14.4本章小结
第15章神经网络介绍
15.1深度学习简介
15.2基于Keras的MLP
15.3本章小结
第16章高级深度学习模型
16.1深层结构
16.2基于Keras的深度卷积网络示例
16.3基于Kears的LSTM网络示例
16.4TensorFlow简介
16.4.1梯度计算
16.4.2逻辑回归
16.4.3用多层感知器进行分类
16.4.4图像卷积
16.5本章小结
第17章创建机器学习架构
17.1机器学习框架
17.1.1数据收集
17.1.2归一化
17.1.3降维
17.1.4数据扩充
17.1.5数据转换
17.1.6建模、网格搜索和交叉验证
17.1.7可视化
17.1.8GPU支持
17.1.9分布式架构简介
17.2用于机器学习架构的scikit-learn工具
17.2.1管道
17.2.2特征联合
17.3本章小结

推荐

车牌查询
桂ICP备20004708号-3