作者 |
张伟 |
丛书名 |
出版社 |
电子工业出版社 |
ISBN |
9787121417474 |
简要 |
简介 |
内容简介 本书源于阿里巴巴千亿级知识图谱构建与产业化应用的工作总结,对知识图谱理论和大规模工业实践进行了全面和深入的阐述。本书以阿里巴巴的实战经验为中心,以深厚的理论成果为支撑,详细阐述了知识图谱的方方面面。首先介绍工业场景下知识图谱的现状、存在的问题和架构设计;然后从知识表示、知识融合、知识获取、知识推理、知识存储和知识图谱前沿方向等方面入手,介绍大规模商品知识图谱的构建方法;后结合阿里巴巴的业务实践,详细介绍知识图谱的产品设计、技术实现和业务应用细节。通过阅读本书,读者不仅可以从零开始认识知识图谱,了解知识图谱技术方法和前沿技术方向,而且可以熟悉知识图谱工业实践的实现路径,清楚知识图谱的应用方向和方法。本书介绍的成果获得钱伟长中文信息处理科学技术一等奖。本书在知识图谱的广度和深度上兼具极强的参考性,适合人工智能相关行业的管理者和研发人员、高等院校的计算机专业学生阅读。 |
目录 |
第1章 工业级知识图谱概述 / 1 1.1 知识图谱概述 / 2 1.1.1 通用知识图谱 / 2 1.1.2 行业知识图谱 / 3 1.2 工业级知识图谱实战原则 / 4 1.2.1 实践中的典型问题 / 4 1.2.2 实战原则 / 4 1.3 阿里巴巴知识引擎技术架构 / 8 1.3.1 平台产品:知识建模与管理 / 9 1.3.2 平台产品:知识生产 / 11 1.3.3 业务、平台产品:知识服务 / 16 1.4 本章小结 / 19 第2章 商品知识的表示和建模 / 20 2.1 知识表示简介 / 21 2.1.1 基于符号逻辑的知识表示方法 / 21 2.1.2 面向互联网的知识表示方法 / 23 2.1.3 基于连续向量的知识表示 / 25 2.2 行业知识建模 / 27 2.2.1 基于专家的知识建模 / 27 2.2.2 基于机器学习的知识建模 / 29 2.3 商品知识建模实践 / 32 2.3.1 术语抽取 / 33 2.3.2 商品概念及上下位关系生成 / 36 2.4 构建商品知识体系 / 37 2.4.1 通用域知识图谱 / 37 2.4.2 阿里商品域知识体系 / 39 2.5 商品知识建模应用场景 / 48 2.5.1 服务国家和社会机构应用 / 48 2.5.2 零售业务应用 / 49 2.6 小结 / 50 2.6.1 知识建模技术的未来发展 / 50 2.6.2 知识体系设计的未来发展 / 51 第3章 商品知识融合 / 53 3.1 知识融合概述 / 54 3.1.1 知识融合的主要难点 / 54 3.1.2 知识融合的基本步骤 / 55 3.2 本体对齐 / 57 3.2.1 基于语言学特征的方法 / 58 3.2.2 基于结构特征的方法 / 61 3.2.3 商品知识图谱本体对齐算法 / 63 3.3 实体对齐 / 70 3.3.1 实体对齐的流程 / 70 3.3.2 实体对齐的技术路线 / 71 3.3.3 商品知识图谱实体对齐实践 / 80 3.4 信息融合 / 91 3.4.1 无监督的信息融合方法 / 92 3.4.2 有监督和半监督的信息融合方法 / 99 3.4.3 商品知识图谱信息融合算法实践 / 100 3.5 跨语言知识融合 / 103 3.5.1 跨语言知识融合的挑战 / 103 3.5.2 跨语言实体对齐的技术路线 / 104 3.5.3 基于规则的跨语言实体对齐方法 / 104 3.5.4 基于翻译的跨语言实体对齐方法 / 105 3.5.5 基于表示学习的跨语言实体对齐方法 / 107 3.6 知识融合质量评估体系 / 110 3.6.1 知识融合评估指标介绍 / 110 3.6.2 离线融合效果评估 / 112 3.6.3 在线融合效果评估 / 117 3.7 本章小结 / 119 第4章 商品知识获取 / 120 4.1 知识获取概述 / 121 4.1.1 知识获取相关任务 / 121 4.1.2 知识获取相关测评会议 / 123 4.2 命名实体识别 / 125 4.2.1 命名实体识别概览 / 125 4.2.2 标注体系及常用数据集 / 126 4.2.3 基于规则的命名实体识别 / 128 4.2.4 基于统计模型的命名实体识别 / 128 4.2.5 基于神经网络的实体识别 / 130 4.3 实体链接 / 133 4.3.1 实体链接概述 / 133 4.3.2 候选实体生成 / 133 4.3.3 候选实体排序 / 135 4.3.4 端到端的实体链接方法 / 138 4.4 关系抽取 / 139 4.4.1 关系抽取概述 / 139 4.4.2 基于模板的关系抽取方法 / 140 4.4.3 基于监督学习的关系抽取方法 / 140 4.4.4 基于半监督学习的关系抽取方法 / 149 4.4.5 基于无监督学习的关系抽取方法 / 154 4.5 槽填充与属性补全 / 156 4.5.1 槽填充与属性补全概述 / 156 4.5.2 基于模板的方法 / 158 4.5.3 基于关系分类的方法 / 160 4.6 面向半结构化数据的知识获取 / 160 4.6.1 百科类网站数据抽取 / 160 4.6.2 面向Web网页的知识获取 / 161 4.7 低资源条件下知识获取 / 162 4.7.1 基于监督学习和弱监督学习的方法 / 163 4.7.2 基于迁移学习的方法 / 163 4.7.3 基于元学习的方法 / 164 4.7.4 基于知识增强的方法 / 165 4.8 电商领域知识获取实践 / 166 4.8.1 电商知识获取框架 / 166 4.8.2 面向场景导购的知识获取示例 / 169 4.8.3 低资源商品知识获取示例 / 177 4.9 本章小结 / 180 第5章 商品知识推理 / 182 5.1 知识推理概述 / 183 5.1.1 知识推理的作用 / 183 5.1.2 专家系统与知识推理 / 184 5.1.3 神经网络与知识推理 / 185 5.2 基于符号逻辑的知识推理 / 186 5.2.1 基于本体的知识推理方法 / 187 5.2.2 基于规则的知识推理方法 / 191 5.2.3 基于规则学习的知识图谱推理 / 197 5.3 基于表示学习的知识推理 / 200 5.3.1 基于分布式表示的知识推理 / 200 5.3.2 基于神经网络的知识推理 / 210 5.4 基于图数据库的商品知识推理引擎工程实践 / 218 5.4.1 技术框架简介 / 219 5.4.2 与传统规则推理引擎的对比 / 223 5.5 可解释的商品知识图谱推理应用实践 / 226 5.5.1 电商应用背景 / 226 5.5.2 技术实践方案 / 228 5.5.3 实验结果及案例分析 / 233 5.6 基于强化学习的商品规则学习与推理应用实践 / 236 5.6.1 电商应用背景 / 236 5.6.2 技术实践方案 / 238 5.6.3 实验结果及案例分析 / 240 5.7 本章小结 / 241 第6章 知识图谱的存储、服务与质量 / 243 6.1 知识图谱的存储 / 244 6.1.1 数据模型 / 244 6.1.2 存储系统选型 / 247 6.1.3 图查询语言 / 252 6.1.4 关键技术与选择 / 254 6.2 知识图谱的服务 / 257 6.2.1 基于知识图谱的搜索 / 258 6.2.2 基于知识图谱的推荐 / 264 6.2.3 搜索推荐在业务智能中的应用 / 274 6.2.4 基于知识图谱的问答系统 / 278 6.3 知识图谱质量保障 / 281 6.3.1 质量保障架构 / 281 6.3.2 测试原则与方法 / 282 6.4 本章小结 / 284 第7章 大规模商品知识图谱 预训练 / 285 7.1 知识预训练概述 / 286 7.1.1 预训练语言模型 / 286 7.1.2 知识图谱中的结构化上下文信息 / 288 7.1.3 基于知识增强的预训练模型 / 289 7.1.4 预训练知识图谱模型与预训练语言模型的区别 / 293 7.2 商品知识图谱静态预训练模型 / 294 7.2.1 预训练知识图谱查询框架 / 294 7.2.2 预训练知识图谱查询模块 / 295 7.2.3 预训练知识图谱查询服务 / 296 7.2.4 在任务模块中使用查询服务 / 297 7.3 商品知识图谱动态预训练模型 / 299 7.3.1 上下文模块和整合模块 / 299 7.3.2 预训练阶段和微调阶段 / 301 7.4 商品知识图谱预训练实践案例 / 303 7.4.1 基于知识图谱预训练的商品分类 / 304 7.4.2 基于知识图谱预训练的商品对齐 / 309 7.4.3 基于知识图谱预训练的商品推荐 / 312 7.4.4 基于商品知识预训练的实体识别 / 316 7.4.5 基于商品知识预训练的关系抽取与属性补齐 / 318 7.4.6 基于商品知识预训练的标题生成 / 324 7.5 总结与展望 / 325 参考文献 / 326 |