[套装书]企业级数据与AI项目成功之道+企业级大数据平台构建:架构与实现(2册)

作者
[美]尼尔·菲什曼(Neal Fishman),[美]科尔·斯特莱克(Cole Stryker) 等
丛书名
出版社
机械工业出版社
ISBN
9782110261653
简要
简介
内容简介书籍计算机书籍 ---------------------------8084498 - 企业级数据与AI项目成功之道--------------------------- 只有在可以一致地提供预测性的业务见解并在整个组织范围内扩展时,数据分析和AI才能产生价值。这也是众多企业所面临的巨大挑战。本书概述了有效且实用的组织、管理和评估数据的方法,因此有助于建立信息体系结构以更好地推动AI和数据科学的发展。本书主要包括以下内容:简化数据管理,使数据随时随地可用;缩短实现AI用例的价值实现时间;使整个企业都可以访问AI和数据洞察力;动态、实时地扩展复杂的AI场景;开发可带来可预测的、可重复的价值的信息体系结构。本书可以使包括架构师、开发人员、产品所有者和业务主管在内的各种角色受益。 ---------------------------7738077 - 企业级大数据平台构建:架构与实现--------------------------- 本书第1章介绍了信息安全人员做安全评估、渗透测试常用的系统环境与网络环境配置。第2章介绍了黑客入门基础——社会工程学。第3章介绍了密码学理论和开源工具GnuPG与OpenSSL的配置与使用。第4章介绍了一些常用的黑客手法,然后引出相对应的防护策略,并且介绍了一款开源漏洞扫描工具。第5章介绍了三种常见的Web安全问题:欺骗攻击、数据库注入与XSS跨站攻击。第6章介绍了入侵检测工具Snort和开源蜜罐体系Honeyd。第7章介绍了WiFi中WEP和WPA/WPA2的破解方法以及无线路由中常见的UPnP带来的安全隐患。第8章介绍了国家推动信息安全战略的依据及测评流程,并针对与真实测评一致的部分内容进行模拟测评。 本书既可作为面向计算机工程、软件工程、信息工程等IT相关学科的信息安全实训教材,还可作为信息安全相关人员的培训教材。
目录
[套装书具体书目]
7738077 - 企业级大数据平台构建:架构与实现 - 9787111595953 - 机械工业出版社 - 定价 69
8084498 - 企业级数据与AI项目成功之道 - 9787111684763 - 机械工业出版社 - 定价 89



---------------------------8084498 - 企业级数据与AI项目成功之道---------------------------


题记
本书赞誉
序言
前言
致谢
关于作者
第1章 攀登人工智能阶梯1
1.1 人工智能的数据准备2
1.2 重点技术领域2
1.3 一步一个脚印地攀登阶梯3
1.4 不断适应以保持组织的相关性6
1.5 基于数据的推理在现代业务中至关重要8
1.6 朝着以人工智能为中心的组织迈进11
1.7 本章小结12
第2章 框架部分I:使用人工智能的注意事项14
2.1 数据驱动决策制定15
2.1.1 通过询问来获得洞见15
2.1.2 信任矩阵16
2.1.3 衡量标准和人类洞见的重要性18
2.2 使数据与数据科学民主化18
2.3 是的,先决条件:组织数据必须有先见之明20
2.4 促进变革之风:有组织的数据如何缩短反应时间23
2.5 质疑一切24
2.6 本章小结26
第3章 框架部分II:使用数据和人工智能的注意事项27
3.1 个性化每个用户的数据体验28
3.2 上下文的影响:选择正确的数据显示方式29
3.3 民族志研究:通过专业数据增进理解32
3.4 数据治理和数据质量33
3.4.1 分解数据的价值34
3.4.2 通过数据治理提供结构34
3.4.3 为训练进行数据策管35
3.4.4 创造价值的其他注意事项35
3.5 本体论:封装知识的手段36
3.6 人工智能成果的公平、信任和透明度38
3.7 可访问的、准确的、经过策管的和经过组织的数据41
3.8 本章小结42
第4章 分析回顾:不只是个锤子44
4.1 曾经的情况:回顾企业数据仓库44
4.2 传统数据仓库的缺点49
4.3 范式转变52
4.4 现代分析环境:数据湖53
4.4.1 两者对比55
4.4.2 本地数据56
4.4.3 差异属性56
4.5 数据湖的要素58
4.6 新常态:大数据即普通数据60
4.6.1 从单一数据模型的刚性中解放出来60
4.6.2 流数据61
4.6.3 适合任务的工具61
4.6.4 易访问性61
4.6.5 降低成本61
4.6.6 可扩展性62
4.6.7 人工智能的数据管理和数据治理62
4.7 Schema-On-Read与Schema-On-Write63
4.8 本章小结65
第5章 分析前瞻:不是所有事物都是钉子67
5.1 组织的需求67
5.1.1 暂存区域69
5.1.2 原始区域70
5.1.3 发现与探索区域71
5.1.4 对齐区域71
5.1.5 协调区域76
5.1.6 策管区域77
5.2 数据拓扑78
5.2.1 区域地图80
5.2.2 数据管道81
5.2.3 数据地形81
5.3 扩展、添加、移动和删除区域83
5.4 启用区域84
5.4.1 摄入84
5.4.2 数据治理86
5.4.3 数据存储和保留87
5.4.4 数据处理89
5.4.5 数据访问90
5.4.6 管理和监控91
5.4.7 元数据91
5.5 本章小结92
第6章 人工智能阶梯的运营准则93
6.1 时光流逝94
6.2 创建98
6.2.1 稳定性99
6.2.2 障碍99
6.2.3 复杂性99
6.3 执行100
6.3.1 摄入101
6.3.2 可见性102
6.3.3 合规性102
6.4 运行102
6.4.1 质量103
6.4.2 依赖104
6.4.3 可复用性104
6.5 xOps三重奏:DevOps/MLOps、DataOps和AIOps105
6.5.1 DevOps/MLOps105
6.5.2 DataOps107
6.5.3 AIOps109
6.6 本章小结111
第7章 最大化运用数据:以价值为导向112
7.1 迈向价值链113
7.1.1 通过关联链接116
7.1.2 启用操作117
7.1.3 扩大行动手段118
7.2 策管119
7.3 数据治理121
7.4 集成数据管理123
7.4.1 载入125
7.4.2 组织125
7.4.3 编目126
7.4.4 元数据127
7.4.5 准备128
7.4.6 预配129
7.4.7 多租户129
7.5 本章小结132
第8章 通过统计分析评估数据并启用有意义的访问133
8.1 派生价值:将数据当作资产进行管理133
8.2 数据可访问性:并非所有用户都是平等的139
8.3 向数据提供自助服务140
8.4 访问:添加控件的重要性141
8.5 为了数据治理,使用自底向上的方法对数据集进行排序142
8.6 各行业如何使用数据和人工智能143
8.7 受益于统计数字144
8.8 本章小结151
第9章 长期构建152
9.1 改变习惯的需要:避免硬编码152
9.1.1 过载153
9.1.2 锁定154
9.1.3 所有权和分解156
9.1.4 避免变化的设计156
9.2 通过人工智能扩展数据的价值157
9.3 混合持久化159
9.4 受益于数据素养163
9.4.1 理解主题165
9.4.2 技能集165
9.4.3 全部都是元数据167
9.4.4 正确的数据,在正确的上下文
中,使用正确的接口168
9.5 本章小结170
第10章 终章:人工智能的信息架构171
10.1 人工智能开发工作172
10.2 基本要素:基于云的计算、数据和分析175
10.2.1 交集:计算容量和存储容量180
10.2.2 分析强度181
10.2.3 跨要素的互操作性183
10.2.4 数据管道飞行路径:飞行前、飞行中、飞行后186
10.2.5 数据水坑、数据池和数据湖的数据管理187
10.3 驱动行动:上下文、内容和决策者188
10.4 保持简单190
10.5 筒仓已死,筒仓长存192
10.6 分类:组织数据区域194
10.7 开放平台的功能197
10.8 本章小结200
附录 缩略语对照表203



---------------------------7738077 - 企业级大数据平台构建:架构与实现---------------------------


推荐序 思者常新,厚积薄发
前 言
第1章 浅谈企业级大数据平台的重要性 1
1.1 缺乏统一大数据平台的问题 2
1.1.1 资源浪费 2
1.1.2 数据孤岛 2
1.1.3 服务孤岛 3
1.1.4 安全存疑 3
1.1.5 缺乏可维护性和可扩展性 3
1.1.6 缺乏可复制性 4
1.2 构建统一大数据平台的优势 4
1.3 企业级大数据平台需要具备的基本能力 6
1.3.1 集群管理与监控 7
1.3.2 数据接入 7
1.3.3 数据存储与查询 7
1.3.4 数据计算 8
1.3.5 平台安全与管理 10
1.4 平台辅助工具 12
1.5 本章小结 13
第2章 企业级大数据平台技术栈介绍 15
2.1 HDFS 16
2.1.1 概述 16
2.1.2 RAID技术 17
2.1.3 核心设计目标 18
2.1.4 命名空间 19
2.1.5 数据模型 20
2.1.6 Namenode和Datanode 20
2.1.7 使用场景 21
2.2 Zookeeper 22
2.2.1 概述 22
2.2.2 核心特性 23
2.2.3 命名空间 24
2.2.4 数据模型 24
2.2.5 节点状态监听 25
2.2.6 原子消息广播协议 25
2.2.7 使用场景 32
2.3 HBase 33
2.3.1 概述 33
2.3.2 数据模型 34
2.3.3 Regions 34
2.3.4 HBase Master 35
2.3.5 Region Server 36
2.3.6 MemStore与HFile 37
2.3.7 使用场景 37
2.4 YARN 38
2.4.1 概述 38
2.4.2 资源模型和Container 40
2.4.3 ResourceManager 40
2.4.4 ApplicationMaster 40
2.4.5 NodeManager 41
2.4.6 单一集群架构 41
2.4.7 工作流程 41
2.4.8 使用场景 43
2.5 Spark 43
2.5.1 概述 43
2.5.2 数据模型 45
2.5.3 编程模型和作业调度 45
2.5.4 依赖 46
2.5.5 容错 47
2.5.6 集群模式 47
2.5.7 使用场景 48
2.6 本章小结 49
第3章 使用Ambari安装Hadoop集群 50
3.1 概述 50
3.2 集群设计 52
3.2.1 主控节点 52
3.2.2 存储与计算节点 53
3.2.3 安全认证与管理节点 54
3.2.4 协同管理与其他节点 54
3.3 Ambari的安装、配置与启动 55
3.3.1 安装前的准备 55
3.3.2 安装Ambari-Server 62
3.3.3 Ambari-Server结构 64
3.3.4 配置Ambari-Server 65
3.3.5 启动Ambari-Server 66
3.4 新建集群 67
3.4.1 设置集群名称并配置HDP安装包 67
3.4.2 配置集群 69
3.5 Ambari控制台功能简介 77
3.5.1 集群服务管理 78
3.5.2 集群服务配置 80
3.5.3 辅助工具 82
3.6 本章小结 86
第4章 构建企业级平台安全方案 87
4.1 浅谈企业级大数据平台面临的安全隐患 88
4.1.1 缺乏统一的访问控制机制 88
4.1.2 缺乏统一的资源授权策略 88
4.1.3 缺乏Hadoop服务安全保障 89
4.2 初级安全方案 89
4.2.1 访问控制 89
4.2.2 数据授权与管理 97
4.3 本章小结 110
第5章 Hadoop服务安全方案 111
5.1 Kerberos协议简介 111
5.2 使用FreeIPA安装Kerberos和LDAP 113
5.2.1 安装FreeIPA 115
5.2.2 IPA-Server管理控制台功能介绍 119
5.2.3 IPA CLI功能介绍 122
5.3 开启Ambari的Kerberos安全选项 127
5.3.1 集成前的准备 127
5.3.2 集成IPA 129
5.3.3 测试Kerberos认证 133
5.4 本章小结 136
第6章 单点登录与用户管理 137
6.1 集成单点登录 139
6.1.1 CAS简介 140
6.1.2 安装CAS-Server 141
6.1.3 集成Knox网关与CAS-
Server 148
6.1.4 集成Ranger与CAS-Server 151
6.1.5 集成Ambari与CAS-Server 152
6.2 实现统一的用户管理系统 155
6.3 使用Java程序调用脚本 161
6.4 创建Ranger扩展用户 166
6.5 本章小结 169
第7章 搭建平台管理端RESTful服务 170
7.1 搭建RESTful服务框架 170
7.2 用户查询 174
7.2.1 引入LDAP模块 174
7.2.2 配置LDAP 174
7.2.3 实现持久层 177
7.2.4 实现服务层 181
7.2.5 实现RESTful服务 181
7.2.6 整合用户管理 183
7.3 RESTful服务安全认证 184
7.3.1 用户登录服务 185
7.3.2 使用JWT认证 185
7.3.3 创建用户登录RESTful服务 188
7.3.4 认证过滤器 194
7.3.5 测试服务安全认证 198
7.4 数据仓库数据查询 200
7.4.1 创建JDBC连接 200
7.4.2 Kerberos登录 202
7.4.3 使用JDBC协议查询 202
7.4.4 实现服务层与RESTful服务 206
7.4.5 测试查询 207
7.5 数据仓库元数据查询 208
7.5.1 使用query服务查询数仓元数据 208
7.5.2 引入JdbcTemplate模块 209
7.5.3 增加Hive元数据库配置 210
7.5.4 实现元数据持久层 211
7.5.5 实现元数据服务层与RESTful服务 216
7.5.6 测试元数据查询 218
7.6 本章小结 219
第8章 Spark任务与调度服务 220
8.1 提交Spark任务的3种方式 220
8.1.1 使用Spark-Submit脚本提交 220
8.1.2 使用Spark Client提交 226
8.1.3 使用YARN RESTful API提交 229
8.2 查询Spark日志 234
8.3 任务调度 236
8.3.1 引入Quartz模块 237
8.3.2 增加Quartz配置 237
8.3.3 编写调度任务 240
8.3.4 改进空间 241
8.4 本章小结 241
附录A Hadoop简史 242
附录B Hadoop生态其他常用组件一览 245
附录C 常用组件配置说明 248

推荐

车牌查询
桂ICP备20004708号-3