| 作者 |
| 李国庆 刘莹 庞禄申 等 |
| 丛书名 |
| 出版社 |
| 人民邮电出版社 |
| ISBN |
| 9787115478559 |
| 简要 |
| 简介 |
| 内容简介书籍计算机书籍 本书以数据分析与挖掘思想为主线,深入剖析关联、分类、回归、聚类、顺序模式挖掘、深度学习以及异常检测等算法的原理、实现、相似算法、改进思路以及地学案例,具有很强的系统性、完整性以及落地性,可以作为各行业特别是地球科学领域中希望驾驭大数据并发掘其价值的科研人员和工程人员的参考书,读者既可以通过本书系统掌握大数据分析挖掘的思想方法,也可以将其作为算法工具书查阅。 |
| 目录 |
| 第 1章 关联规则 001 1.1 Apriori算法 002 1.1.1 算法概要 002 1.1.2 算法原理 002 1.1.3 实例说明 004 1.1.4 算法优缺点 010 1.1.5 优化改进 010 1.1.6 大数据适应度分析 012 1.1.7 地球科学应用案例 013 1.2 FP-growth算法 015 1.2.1 算法概要 015 1.2.2 算法原理 015 1.2.3 实例说明 017 1.2.4 优化改进 019 1.2.5 大数据适应度分析 021 1.2.6 地球科学应用案例 024 参考文献 026 第 2章 分类 027 2.1 决策树算法 028 2.1.1 算法概要 028 2.1.2 算法原理 028 2.1.3 算法优缺点 031 2.1.4 优化改进 032 2.1.5 决策树衍生算法 033 2.1.6 大数据适应度分析 035 2.1.7 地球科学应用案例 037 2.2 贝叶斯分类算法 038 2.2.1 算法概要 038 2.2.2 算法原理 038 2.2.3 实例说明 040 2.2.4 算法优缺点 042 2.2.5 优化改进 042 2.2.6 大数据适应度分析 045 2.2.7 地球科学应用案例 046 2.3 神经网络分类算法 047 2.3.1 算法概要 047 2.3.2 算法原理 047 2.3.3 算法优缺点 051 2.3.4 优化改进 052 2.3.5 大数据适应度分析 053 2.3.6 地球科学应用案例 053 2.4 粗糙集分类 055 2.4.1 算法概要 055 2.4.2 算法原理 055 2.4.3 实例说明 062 2.4.4 算法优缺点 064 2.4.5 优化改进 064 2.4.6 大数据适应度分析 065 2.4.7 地球科学应用案例 066 2.5 支持向量机 066 2.5.1 算法概要 066 2.5.2 算法原理 067 2.5.3 实例说明 073 2.5.4 算法优缺点 074 2.5.5 优化改进 074 2.5.6 大数据适应度分析 076 2.5.7 地球科学应用案例 077 2.6 K-最近邻算法 078 2.6.1 算法概要 078 2.6.2 算法原理 078 2.6.3 算法优缺点 080 2.6.4 优化改进 080 2.6.5 大数据适应度分析 082 2.6.6 地球科学应用案例 085 2.7 Bagging算法 086 2.7.1 算法概要 086 2.7.2 算法原理 087 2.7.3 实例说明 090 2.7.4 优化改进 093 2.7.5 大数据适应度分析 094 2.7.6 地球科学应用案例 095 2.8 AdaBoost算法 096 2.8.1 算法概要 096 2.8.2 算法原理 097 2.8.3 训练过程 099 2.8.4 同类算法 100 2.8.5 大数据适应度分析 103 2.8.6 地球科学应用案例 103 参考文献 105 第3章 回归 115 3.1 线性回归 116 3.1.1 算法概要 116 3.1.2 算法原理 116 3.1.3 实例说明 119 3.1.4 算法优缺点 120 3.1.5 优化改进 121 3.1.6 大数据适应度分析 123 3.1.7 地球科学应用案例 123 3.2 逻辑回归 124 3.2.1 算法概要 124 3.2.2 算法原理 125 3.2.3 算法实现 127 3.2.4 SoftMax算法 129 3.2.5 大数据适应度分析 129 3.2.6 地球科学应用案例 130 参考文献 131 第4章 聚类 133 4.1 K-means算法 134 4.1.1 算法概要 134 4.1.2 算法原理 134 4.1.3 实例说明 135 4.1.4 算法优缺点 138 4.1.5 优化改进 138 4.1.6 大数据适应度分析 140 4.1.7 地球科学应用案例 141 4.2 K-medoids算法 142 4.2.1 算法概要 142 4.2.2 算法原理 142 4.2.3 实例说明 144 4.2.4 算法优缺点 147 4.2.5 优化改进 148 4.2.6 大数据适应度分析 149 4.2.7 地球科学应用案例 149 4.3 层次聚类算法 151 4.3.1 算法概要 151 4.3.2 距离度量 151 4.3.3 算法流程 153 4.3.4 改进优化 154 4.3.5 大数据适应度分析 158 4.3.6 地球科学应用案例 159 4.4 基于密度的聚类算法 160 4.4.1 算法概要 160 4.4.2 算法原理 160 4.4.3 实例说明 162 4.4.4 算法优缺点 164 4.4.5 优化改进 165 4.4.6 大数据适应度分析 166 4.4.7 地球科学应用案例 167 4.5 基于网格的聚类算法 168 4.5.1 算法概要 168 4.5.2 STING 168 4.5.3 CLIQUE 170 4.5.4 优化改进 173 4.5.5 大数据适应度分析 176 4.5.6 地球科学应用案例 177 参考文献 179 第5章 序列模式挖掘 183 5.1 GSP算法 184 5.1.1 算法概要 184 5.1.2 算法原理 184 5.1.3 实例说明 189 5.1.4 算法优缺点 191 5.1.5 GSP衍生算法 192 5.1.6 大数据适应度分析 194 5.1.7 地球科学应用案例 195 5.2 SPADE算法 196 5.2.1 算法概要 196 5.2.2 算法原理 197 5.2.3 实例说明 203 5.2.4 算法优缺点 206 5.2.5 优化改进 206 5.2.6 SPADE衍生算法 207 5.2.7 大数据适应度分析 209 5.2.8 地球科学应用案例 213 参考文献 215 第6章 深度学习 217 6.1 深度信念网 218 6.1.1 算法概要 218 6.1.2 算法原理 219 6.1.3 优化改进 225 6.1.4 大数据适应度分析 226 6.1.5 地球科学应用案例 227 6.2 卷积神经网络 228 6.2.1 算法概要 228 6.2.2 算法原理 228 6.2.3 实例说明 229 6.2.4 模型演化 231 6.2.5 优化改进 234 6.2.6 大数据适应度分析 235 6.2.7 地球科学应用案例 235 6.3 自动编码器算法 237 6.3.1 算法概要 237 6.3.2 算法原理 238 6.3.3 算法实现 240 6.3.4 衍生算法 241 6.3.5 优化改进 243 6.3.6 大数据适应度分析 244 6.3.7 地球科学应用案例 245 参考文献 245 第7章 异常检测 249 7.1 概述 250 7.2 基于统计的异常检测算法 251 7.2.1 算法原理 251 7.2.2 典型算法 251 7.3 基于距离的方法 252 7.3.1 算法原理 252 7.3.2 典型算法 252 7.4 基于深度的异常检测方法 256 7.4.1 算法原理 256 7.4.2 典型算法 257 7.5 基于密度的异常检测算法 258 7.5.1 算法原理 258 7.5.2 典型算法 258 7.6 基于偏离的异常检测算法 262 7.6.1 算法原理 262 7.6.2 典型算法 263 7.7 基于聚类的异常检测算法 265 7.7.1 算法原理 265 7.7.2 典型算法 265 7.8 大数据适应度分析 268 7.9 地球科学应用案例 269 参考文献 271 附录A 软件、源码及开发包 275 |