| 作者 |
| (印)苏尼拉·格拉普蒂(Sunila Gollapudi) |
| 丛书名 |
| 数据科学与工程技术丛书 |
| 出版社 |
| 机械工业出版社 |
| ISBN |
| 9787111598886 |
| 简要 |
| 简介 |
| 内容简介书籍计算机书籍 本书探索了一系列广泛应用的机器学习技术,用实际例子揭示了常见数据中隐藏的处理技巧和窍门。本书还探讨了机器学习的前沿进展,提供了一些关于深度学习和强化学习的范例和指导原则,完美演绎了实操过程及算法原理。本书的目标读者为那些想了解机器学习实践通过机器学习技术解决现实应用的数据科学家。 |
| 目录 |
| 推荐序一 推荐序二 译者序 前言 关于作者 关于审校者 第1章机器学习简介 11机器学习 111定义 112核心概念与术语 113什么是学习 114机器学习中的数据不一致性 115机器学习实践范例 116机器学习问题类型 12性能度量 13机器学习的相关领域 131数据挖掘 132人工智能 133统计学习 134数据科学 14机器学习处理流程及解决方案架构 15机器学习算法 151基于决策树的算法 152基于贝叶斯的算法 153基于核方法的算法 154聚类算法 155人工神经网络 156降维方法 157集成方法 158基于实例的算法 159基于回归分析的算法 1510基于关联规则的算法 16机器学习工具与框架 17小结 第2章机器学习和大规模数据集 21大数据和大规模机器学习 211功能与架构:方法论的失配 212机器学习的可扩展性和性能 213模型选择过程 214大规模机器学习的潜在问题 22算法和并发 23垂直扩展的机器学习技术方案 231MapReduce编程架构 232利用消息传递接口进行高性能计算 233LINQ框架 234使用LINQ操作数据集 235GPU 236FPGA 237多核或多处理器系统 24小结 第3章Hadoop架构和生态系统简介 31Apache Hadoop简介 311Hadoop的演化 312Hadoop及其核心要素 32基于Hadoop的大数据机器学习解决方案架构 321数据源层 322数据摄入层 323Hadoop数据存储层 324Hadoop基础设施层 325Hadoop平台/处理层 326分析层 327数据消费层 328MapReduce 33Hadoop 2x 331Hadoop生态系统组件 332Hadoop安装和配置 333Hadoop发行版和供应商 34小结 第4章机器学习工具、库及框架 41机器学习工具概览 42Apache Mahout 421Mahout如何工作 422安装和设置Apache Mahout 423Mahout软件包详解 424Mahout中的vector实现 43R 431安装和设置R 432R与Apache Hadoop集成 44Julia 441安装和设置Julia 442在命令行中执行Julia程序 443例解Julia 444变量与赋值 445使用Julia的好处 446Julia与Hadoop集成 45Python 451Python中工具包的选择 452例解Python 46Apache Spark 461Scala 462RDD编程 47Spring XD 48小结 第5章基于决策树的学习 51决策树 511术语 512目标与用途 513构造决策树 514特殊的决策树 52实现决策树 53小结 第6章基于实例和核方法的学习 61基于实例的学习 611最近邻 612实现kNN 62基于核方法的学习 621核函数 622支持向量机 623实现SVM 63小结 第7章关联规则学习 71关联规则学习 711关联规则的定义 712Apriori算法 713FPgrowth算法 714Apriori与FPgrowth 72实现Apriori及FPgrowth算法 73小结 第8章聚类学习 81聚类学习 82聚类的类型 821层次聚类 822划分式聚类 83kmeans聚类算法 831kmeans算法的收敛性 832kmeans算法的优点 833kmeans算法的缺点 834距离度量 835复杂度度量 84实现kmeans聚类 85小结 第9章贝叶斯学习 91贝叶斯学习 911统计学家的视角 912贝叶斯定理 913朴素贝叶斯分类器 92实现朴素贝叶斯算法 93小结 第10章基于回归的学习 101回归分析 1011重温统计学 1012混杂 1013效应修饰 102回归方法 1021简单线性回归 1022多元线性回归 1023多项式回归 1024广义线性模型 1025逻辑回归(logit连接) 1026泊松回归 103实现线性回归和逻辑回归 104小结 第11章深度学习 111背景知识 1111人类大脑结构 1112神经网络 1113反向传播算法 1114Softmax回归算法 112深度学习类型 1121卷积神经网络 1122循环神经网络 1123受限玻尔兹曼机 1124深度玻尔兹曼机 1125自动编码器 113实现ANN和深度学习方法 114小结 第12章强化学习 121强化学习 1211强化学习的背景知识 1212强化学习的主要特点 122强化学习算法 1221动态规划 1222蒙特卡罗方法 1223时序差分学习 1224Qlearning(异策略TD) 1225actorcritic方法(同策略) 1226Rlearning(异策略) 123实现强化学习方法 124小结 第13章集成学习 131集成学习方法 1311群体智慧 1312经典应用 1313集成方法 132实现集成学习方法 133小结 第14章下一代机器学习数据架构 141数据架构的演进 142机器学习的现代数据架构 1421语义数据架构 1422多模型数据库架构/混合持久化 1423Lambda架构 143小结 |