作者 |
何塞·曼努埃尔·戈麦斯-佩雷斯,罗纳德·德诺,安德烈·加西亚-席尔瓦 邵浩 张凯 李方圆 张云柯 戴锡强 |
丛书名 |
智能科学与技术丛书 |
出版社 |
机械工业出版社 |
ISBN |
9782109109504 |
简要 |
简介 |
内容简介书籍计算机书籍 ---------------------------8083978 - 基于混合方法的自然语言处理:神经网络模型与知识图谱的结合--------------------------- 本书分为三个部分:基于知识图谱和神经网络的构建部分;结合知识图谱和神经网络的混合体系结构;实际应用部分。在三个部分中,主题通常是独立的,允许读者快速、轻松地阅读所需的信息。本书的两个特点是实用性和拥有前沿信息。书中准确地演示了如何创建和使用上下文表示,对意义嵌入和知识图谱嵌入有着明确的处理方法,解释了使用它们的语言模型和Transformer体系结构。 ---------------------------8082646 - 从零构建知识图谱:技术、方法与案例--------------------------- 内容简介 这是一本能让读者快速从零开始构建工业级知识图谱的著作。作者是知识图谱和自然语言处理领域的专家,本书得到了OpenKG联合创始人王昊奋、清华大学教授李涓子、东南大学教授漆桂林、美团知识图谱团队负责人张富峥、文因互联创始人鲍捷等学界和业界知识图谱扛旗人的一致好评和推荐。 本书不仅详细讲解了知识图谱的技术原理和构建工具,而且还循序渐进地讲解了知识图谱的构建方法、步骤和行业应用。配有大量实战案例,并且开放了源代码,确保读者能学会并落地。 全书一共8章: 第1章介绍了知识图谱的概念、模式、应用场景和技术架构; 第2章围绕知识图谱的技术体系,详细阐述了知识的表示与建模、抽取与挖掘、存储与融合,以及检索与推理; 第3章通过具体的实例介绍了各种知识图谱工具的使用; 第4章和第5章从工业实践的角度讲解了从0到1构建通用知识图谱和领域知识图谱的步骤和方法,并配备详细的代码解读; . 第6~7章讲解了知识图谱的具体应用和一个综合性的知识图谱案例——问答系统,进一步指导读者实践; 第8章对知识图谱的未来发展进行了总结和展望。 |
目录 |
[套装书具体书目] 8082646 - 从零构建知识图谱:技术、方法与案例 - 9787111686835 - 机械工业出版社 - 定价 99 8083978 - 基于混合方法的自然语言处理:神经网络模型与知识图谱的结合 - 9787111690696 - 机械工业出版社 - 定价 99 ---------------------------8083978 - 基于混合方法的自然语言处理:神经网络模型与知识图谱的结合--------------------------- 推荐序一 推荐序二 译者序 前言 第一部分 预备知识和构建模块 第1章 混合自然语言处理简介 2 1.1 知识图谱、嵌入和语言模型简史 2 1.2 自然语言处理中知识图谱和神经网络方法的结合 4 第2章 单词、意义和知识图谱嵌入 6 2.1 引言 6 2.2 分布式单词表示 6 2.3 词嵌入 7 2.4 意义和概念嵌入 8 2.5 知识图谱嵌入 9 2.6 本章小结 13 第3章 理解词嵌入和语言模型 14 3.1 引言 14 3.2 语言模型 15 3.2.1 统计语言模型 15 3.2.2 神经语言模型 16 3.3 NLP迁移学习的预训练模型微调 16 3.3.1 ELMo 16 3.3.2 GPT 17 3.3.3 BERT 17 3.4 机器人检测中预训练语言模型的微调 18 3.4.1 实验结果与讨论 21 3.4.2 使用Transformer库对BERT进行微调 21 3.5 本章小结 27 第4章 从文本中捕获意义作为词嵌入 28 4.1 引言 28 4.2 下载一个小文本语料库 29 4.3 一种学习词嵌入的算法 29 4.4 使用Swivel prep生成共现矩阵 30 4.5 从共现矩阵中学习嵌入 31 4.6 读取并检查存储的二进制嵌入 32 4.7 练习:从古腾堡工程中创建词嵌入 33 4.7.1 下载语料库并进行预处理 33 4.7.2 学习嵌入 34 4.7.3 检查嵌入 34 4.8 本章小结 34 第5章 捕获知识图谱嵌入 35 5.1 引言 35 5.2 知识图谱嵌入 35 5.3 为WordNet创建嵌入 37 5.3.1 选择嵌入算法:HolE 37 5.3.2 将WordNet知识图谱转换为所需输入 39 5.3.3 学习嵌入 44 5.3.4 检查嵌入结果 44 5.4 练习 47 5.4.1 练习:在自己的知识图谱上训练嵌入 47 5.4.2 练习:检查WordNet 3.0的预计算嵌入 47 5.5 本章小结 48 第二部分 神经网络与知识图谱的结合 第6章 从文本语料库、知识图谱和语言模型中构建混合表达 50 6.1 引言 50 6.2 准备工作和说明 51 6.3 Vecsigrafo的概念及构建方式 51 6.4 实现 53 6.5 训练Vecsigrafo 54 6.5.1 标记化和词义消歧 56 6.5.2 词汇表和共现矩阵 58 6.5.3 从共现矩阵学习嵌入 62 6.5.4 检查嵌入 64 6.6 练习:探索一个预先计算好的Vecsigrafo 66 6.7 从Vecsigrafo到Transigrafo 68 6.7.1 安装设置 70 6.7.2 训练Transigrafo 71 6.7.3 扩展知识图谱的覆盖范围 73 6.7.4 评估 Transigrafo 73 6.7.5 检查Transigrafo中的义项嵌入 75 6.7.6 探索Transigrafo嵌入的稳定性 77 6.7.7 额外的反思 81 6.8 本章小结 81 第7章 质量评估 82 7.1 引言 82 7.2 评估方法的概述 83 7.3 练习1:评估单词和概念嵌入 84 7.3.1 可视化探索 84 7.3.2 内在评估 85 7.3.3 词汇预测图 87 7.3.4 外在评估 90 7.4 练习2:评价通过嵌入获取的关系知识 90 7.4.1 下载embrela项目 91 7.4.2 下载生成的数据集 91 7.4.3 加载待评估的嵌入 92 7.4.4 学习模型 94 7.4.5 分析模型的结果 94 7.4.6 数据预处理:合并且增加字段 96 7.4.7 计算范围阈值和偏差数据集检测 97 7.4.8 发现统计上有意义的模型 99 7.4.9 关系型知识的评估结论 101 7.5 案例研究:评估和对比Vecsigrafo嵌入 101 7.5.1 比较研究 101 7.5.2 讨论 111 7.6 本章小结 114 第8章 利用Vecsigrafo捕获词法、语法和语义信息 116 8.1 引言 116 8.2 方法 118 8.2.1 Vecsigrafo:基于语料的单词–概念嵌入 118 8.2.2 联合嵌入空间 119 8.2.3 嵌入的评估 119 8.3 评估 120 8.3.1 数据集 121 8.3.2 单词相似度 121 8.3.3 类比推理 124 8.3.4 单词预测 125 8.3.5 科学文档的分类 127 8.4 讨论 129 8.5 练习:使用surface form对科学文献进行分类 130 8.5.1 导入所需的库 130 8.5.2 下载surface form的词嵌入和SciGraph论文 131 8.5.3 读取并准备分类数据集 131 8.5.4 surface form的词嵌入 133 8.5.5 创建嵌入层 134 8.5.6 训练一个卷积神经网络 134 8.6 本章小结 136 第9章 知识图谱的词嵌入空间对齐与应用 137 9.1 引言 137 9.2 概述及可能的应用 138 9.2.1 知识图谱的补全 139 9.2.2 超越多语言性:跨模态的词嵌入 139 9.3 词嵌入空间的对齐技术 140 9.3.1 线性对齐 140 9.3.2 非线性对齐 146 9.4 练习:寻找古代英语和现代英语的对应 146 9.4.1 下载小型文本语料库 146 9.4.2 学习基于老莎士比亚语料库的Swivel词嵌入 147 9.4.3 在WordNet之上加载UMBC的Vecsigrafo 149 9.4.4 练习的结论 149 9.5 本章小结 150 第三部分 应用 第10章 一种虚假信息分析的混合方法 152 10.1 引言 152 10.2 虚假信息检测 153 10.2.1 定义和背景 153 10.2.2 技术方法 155 10.3 应用:构建断言数据库 156 10.3.1 训练一个语义断言编码器 156 10.3.2 创建嵌入的一个语义索引并进行探索 165 10.3.3 以STS-B开发数据集填充索引 165 10.3.4 为一个断言数据集创建另一个索引 166 10.3.5 加载数据集到一个Pandas的DataFrame 167 10.3.6 构建一个断言数据库的总结 171 10.4 应用:假新闻和欺骗性语言检测 171 10.4.1 使用深度学习的基本文档分类 172 10.4.2 使用HolE的嵌入 176 10.4.3 使用Vecsigrafo UMBC WNet的嵌入 178 10.4.4 HoLE和UMBC嵌入的结合 179 10.4.5 讨论与结果 180 10.5 通过一个知识图谱得到传播虚假信息的评分 182 10.5.1 Data Commons Claim-Review的知识图谱 182 10.5.2 不可信度评分的传播 187 10.6 本章小结 190 第11章 科学领域中文本与视觉信息的联合学习 191 11.1 引言 191 11.2 图例–标题对应分析的模型与架构 193 11.3 数据集 195 11.4 评估图例–标题的对应分析任务 195 11.5 图例–标题的对应分析与图像–句子匹配的对比 197 11.6 标题与图例的分类 199 11.7 教科书问答的多模态机器理解 200 11.8 图例–标题对应分析的练习 201 11.8.1 预备步骤 201 11.8.2 图例–标题的对应分析 203 11.8.3 图像–句子匹配 216 11.8.4 标题/图例分类 219 11.8.5 教科书问答 223 11.9 本章小结 228 第12章 展望自然语言处理的未来 229 12.1 最终的评论、想法和愿景 229 12.2 趋势是什么?社会各界的意见 231 参考文献 238 ---------------------------8082646 - 从零构建知识图谱:技术、方法与案例--------------------------- 推荐序 前言 第1章 知识图谱概览 1 1.1 知识图谱序言 1 1.2 知识图谱基本概念 3 1.2.1 知识图谱背景 3 1.2.2 知识图谱的定义 5 1.2.3 典型知识图谱示例 7 1.3 知识图谱的模式 10 1.4 为什么需要知识图谱 13 1.5 知识图谱的典型应用 15 1.6 知识图谱的技术架构 17 参考文献 18 第2章 知识图谱技术体系 19 2.1 知识表示与知识建模 19 2.1.1 知识表示 19 2.1.2 知识建模 26 2.2 知识抽取与知识挖掘 29 2.2.1 知识抽取 29 2.2.2 知识挖掘 38 2.3 知识存储与知识融合 42 2.3.1 知识存储 42 2.3.2 知识融合 47 2.4 知识检索与知识推理 52 2.4.1 知识检索 53 2.4.2 知识推理 58 参考文献 61 第3章 知识图谱工具 63 3.1 知识建模工具 63 3.1.1 Protégé 64 3.1.2 其他本体建模工具 79 3.1.3 本体建模工具的选择 83 3.2 知识抽取工具 84 3.2.1 DeepDive 84 3.2.2 其他知识抽取工具 102 3.2.3 知识抽取工具对比 106 3.3 知识存储工具 107 3.3.1 Neo4j 108 3.3.2 Neo4j安装与部署 109 3.3.3 可视化 113 3.3.4 图模型 115 3.3.5 其他图数据库 120 参考文献 122 第4章 从零构建通用知识图谱 123 4.1 通用知识表示与抽取 123 4.1.1 通用知识数据来源 123 4.1.2 实体层构建 126 4.1.3 表述层构建 131 4.1.4 概念层构建 134 4.2 知识增强 135 4.2.1 实体层知识增强 135 4.2.2 模式完善 139 4.2.3 实体链接:表述层与实体层之间的映射 144 4.2.4 实体分类:实体层与概念层之间的映射 146 4.3 百科知识存储与更新 153 4.3.1 属性图存储模型 154 4.3.2 知识存储 156 4.3.3 知识更新 168 第5章 领域知识图谱构建 172 5.1 领域知识图谱概览 172 5.2 医药领域知识图谱 173 5.2.1 领域模式构建 174 5.2.2 领域知识抽取 176 5.2.3 领域图谱构建 178 5.2.4 图谱展示 182 5.3 用户画像图谱 183 5.3.1 用户画像知识表示 183 5.3.2 知识抽取和挖掘 185 5.3.3 抽取案例 194 参考文献 207 第6章 知识图谱应用 208 6.1 知识可视化 208 6.1.1 D3 208 6.1.2 ECharts 213 6.1.3 其他工具介绍 220 6.1.4 小结 225 6.2 实体链接 225 6.2.1 实体链接的定义 225 6.2.2 实体链接的步骤 226 6.2.3 实体链接工具 232 6.2.4 实体链接的应用 242 6.3 知识问答 245 6.3.1 知识问答系统概述 245 6.3.2 知识问答系统的主要流程 247 6.3.3 主流知识问答系统介绍 252 6.3.4 问答系统实战 260 6.4 联想 277 6.4.1 联想整体流程 278 6.4.2 话题识别 279 6.4.3 候选话题生成 280 6.4.4 候选话题排序 282 6.4.5 联想回复生成 290 参考文献 292 第7章 基于知识图谱的问答系统 297 7.1 简介 297 7.2 自然语言理解 300 7.2.1 概述 300 7.2.2 基础NLU 301 7.2.3 意图理解 309 7.2.4 实体识别与链接 317 7.2.5 文本相似度与向量化 317 7.3 对话管理 322 7.3.1 概述 322 7.3.2 知识问答 327 7.3.3 闲聊 331 7.4 自然语言生成 332 7.5 服务化 333 参考文献 335 第8章 总结与展望 336 参考文献 338 |