| 作者 |
| 陆晟 刘振川 汪关盛 等 |
| 丛书名 |
| 出版社 |
| 人民邮电出版社 |
| ISBN |
| 9787115496836 |
| 简要 |
| 简介 |
| 内容简介书籍计算机书籍 本书主要面向架构师,或者是有具体大数据问题需要解决的工程师;也适合从零开始搭建大数据结构,或者需要将现有的非大数据的需求修改成大数据方案的读者。你将从书中学到以下方面的知识: ◎数据存储 ◎计算资源 ◎计算模型 ◎大数据应用 ◎数据治理 ◎大数据与人工智能 |
| 目录 |
| 第 1 章 概述 1 大数据处理的特征 / 3 基本处理模型 / 5 工程角度的大数据历史 / 8 大数据的基本处理框架 / 10 大数据的技术实施方法 / 13 第 2 章 数据 21 数据存储 / 23 数据寻址 / 28 列式存储 / 34 键值对高速缓存 / 43 持久化的高速缓存 / 54 大数据表 / 65 第 3 章 计算资源 73 集群总线 / 75 资源调度 / 91 资源控制 / 97 第 4 章 计算模型 109 MapReduce / 111 SQL 类查询 / 115 流式计算 / 119 图计算 / 125 第 5 章 大数据应用 133 搜索信息匹配 / 136 搜索信息排名 / 140 文档相似性判定 / 147 文档主题生成 / 152 用户画像 / 163 广告投放决策 / 175 基数计算 / 191 第 6 章 数据治理 199 元数据管理 / 202 主数据管理 / 207 数据标准 / 209 数据管理成熟度评估 / 213 数据资产 / 220 数据治理的组织构架 / 230 第 7 章 大数据和人工智能 233 大数据和计算机视觉 / 236 大数据和语音识别 / 259 大数据和博弈 / 284 术语表 291 作者介绍 299 |