[套装书]自然语言处理基础教程+基于混合方法的自然语言处理:神经网络模型与知识图谱的结合(2册)

作者
王刚 郭蕴 王晨 等
丛书名
人工智能技术丛书
出版社
机械工业出版社
ISBN
9782111161413
简要
简介
内容简介书籍计算机书籍 ---------------------------8084692 - 自然语言处理基础教程--------------------------- 本书面向初学者介绍了自然语言处理的基础知识,包括词法分析、句法分析、基于机器学习的文本分析、深度学习与神经网络、词嵌入与词向量以及自然语言处理与卷积神经网络、循环神经网络技术及应用。本书深入浅出,案例丰富,可作为高校人工智能、大数据、计算机及相关专业本科生的教材,也可供对自然语言处理有兴趣的技术人员作为参考书。 ---------------------------8083978 - 基于混合方法的自然语言处理:神经网络模型与知识图谱的结合--------------------------- 本书分为三个部分:基于知识图谱和神经网络的构建部分;结合知识图谱和神经网络的混合体系结构;实际应用部分。在三个部分中,主题通常是独立的,允许读者快速、轻松地阅读所需的信息。本书的两个特点是实用性和拥有前沿信息。书中准确地演示了如何创建和使用上下文表示,对意义嵌入和知识图谱嵌入有着明确的处理方法,解释了使用它们的语言模型和Transformer体系结构。
目录
[套装书具体书目]
8083978 - 基于混合方法的自然语言处理:神经网络模型与知识图谱的结合 - 9787111690696 - 机械工业出版社 - 定价 99
8084692 - 自然语言处理基础教程 - 9787111692591 - 机械工业出版社 - 定价 69



---------------------------8084692 - 自然语言处理基础教程---------------------------


前言
第1章 自然语言处理概述1
1.1 自然语言处理的基本概念1
1.1.1 什么是自然语言处理1
1.1.2 自然语言处理的层次2
1.1.3 自然语言处理的发展历程3
1.2 自然语言处理技术面临的困难6
1.2.1 歧义6
1.2.2 知识的获取、表达及运用7
1.2.3 计算问题8
1.3 自然语言处理的主要研究任务和应用8
1.3.1 自然语言处理的主要研究任务8
1.3.2 自然语言处理的典型应用10
1.4 搭建自然语言处理开发环境11
1.4.1 Anaconda11
1.4.2 scikit-learn15
1.4.3 Jupyter Notebook15
1.5 本章小结16
1.6 习题17
第2章 词法分析18
2.1 什么是词法分析18
2.2 分词19
2.2.1 中文分词简介19
2.2.2 基于词典的分词方法20
2.2.3 基于统计的分词方法21
2.2.4 实例—使用N-gram语言模型进行语法纠正24
2.2.5 中文分词工具简介27
2.2.6 实例—使用jieba进行高频词提取30
2.3 关键词提取32
2.3.1 TF-IDF算法32
2.3.2 TextRank算法33
2.3.3 实例—提取文本关键词34
2.4 词性标注40
2.4.1 词性标注简介40
2.4.2 隐马尔可夫模型41
2.4.3 Viterbi算法43
2.4.4 最大熵模型44
2.5 命名实体识别46
2.5.1 命名实体识别简介46
2.5.2 条件随机场模型47
2.5.3 实例—使用jieba进行日期识别48
2.6 本章小结52
2.7 习题53
第3章 句法分析54
3.1 什么是句法分析54
3.2 句法分析树库及性能评测56
3.2.1 句法分析语料库56
3.2.2 句法分析模型的性能评测59
3.3 概率上下文无关文法59
3.4 依存句法分析62
3.4.1 基于图模型的依存句法分析63
3.4.2 基于转移模型的依存句法分析63
3.5 中文句法分析工具简介65
3.6 实例—中文句法分析66
3.7 本章小结68
3.8 习题68
第4章 基于机器学习的文本分类69
4.1 机器学习简介69
4.1.1 scikit-learn简介71
4.1.2 机器学习基本概念72
4.1.3 机器学习问题分类73
4.2 朴素贝叶斯分类器76
4.3 逻辑回归分类器80
4.4 支持向量机分类器84
4.5 文本聚类89
4.6 实例—垃圾邮件分类94
4.7 本章小结99
4.8 习题99
第5章 深度学习与神经网络101
5.1 深度学习与神经网络简介101
5.2 人工神经网络102
5.2.1 生物神经元102
5.2.2 感知器103
5.2.3 激活函数105
5.2.4 神经网络110
5.3 前馈神经网络110
5.3.1 前馈神经网络的结构110
5.3.2 前向传播111
5.3.3 损失函数112
5.3.4 反向传播算法113
5.3.5 优化方法114
5.4 深度学习框架116
5.4.1 TensorFlow116
5.4.2 Keras118
5.4.3 PyTorch119
5.4.4 PaddlePaddle120
5.5 实例—使用MLP实现手写数字识别122
5.5.1 数据准备122
5.5.2 创建MLP122
5.5.3 模型训练123
5.5.4 模型评价124
5.6 本章小结125
5.7 习题126
第6章 词嵌入与词向量127
6.1 文本向量化127
6.2 One-Hot编码128
6.3 词嵌入130
6.3.1 什么是词嵌入130
6.3.2 词嵌入的实现131
6.3.3 语义信息132
6.4 Word2Vec133
6.4.1 Word2Vec简介133
6.4.2 Word2Vec的应用134
6.4.3 使用gensim包训练词向量136
6.5 Doc2Vec138
6.5.1 PV-DM139
6.5.2 PV-DBOW140
6.6 实例—利用Doc2Vec计算文档相似度140
6.6.1 准备语料库140
6.6.2 定义和训练模型141
6.6.3 分析文本相似度142
6.7 本章小结145
6.8 习题145
第7章 卷积神经网络与自然语言处理146
7.1 卷积神经网络简介146
7.1.1 深层神经网络用于图像处理存在的问题146
7.1.2 什么是卷积148
7.1.3 填充150
7.1.4 步长151
7.1.5 什么是卷积神经网络151
7.2 应用卷积神经网络解决自然语言处理问题152
7.2.1 NLP中的卷积层152
7.2.2 NLP中的池化层154
7.2.3 NLP中CNN的基本架构155
7.3 CNN在应用中的超参数选择156
7.3.1 激活函数156
7.3.2 卷积核的大小和个数156
7.3.3 dropout层156
7.3.4 softmax分类器157
7.4 实例—使用CNN实现新闻文本分类158
7.4.1 准备数据158
7.4.2 定义和训练模型163
7.5 本章小结165
7.6 习题166
第8章 循环神经网络与自然语言处理167
8.1 循环神经网络的基本结构168
8.2 循环神经网络应用于自然语言处理170
8.2.1 序列到类别170
8.2.2 同步序列到序列171
8.2.3 异步序列到序列172
8.3 循环神经网络的训练173
8.3.1 随时间反向传播算法173
8.3.2 权重的更新174
8.3.3 梯度消失与梯度爆炸175
8.4 长短期记忆网络175
8.4.1 细胞状态177
8.4.2 门控机制 177
8.5 门控循环单元网络 181
8.6 更深的网络184
8.6.1 堆叠循环神经网络184
8.6.2 双向循环神经网络185
8.7 实例—使用LSTM网络实现文本情感分析186
8.7.1 数据准备186
8.7.2 构建和训练模型187
8.8 本章小结190
8.9 习题191
第9章 序列到序列模型与注意力机制192
9.1 序列到序列模型192
9.1.1 什么是序列到序列模型192
9.1.2 编码–解码架构193
9.1.3 编码器194
9.1.4 解码器195
9.1.5 模型训练197
9.2 注意力机制198
9.2.1 什么是注意力机制198
9.2.2 计算语义向量200
9.2.3 自注意力机制200
9.2.4 Transformer模型202
9.3 实例—基于注意力机制的机器翻译203
9.3.1 准备数据203
9.3.2 构建并训练模型207
9.3.3 使用模型进行翻译211
9.4 本章小结212
9.5 习题213
参考文献215



---------------------------8083978 - 基于混合方法的自然语言处理:神经网络模型与知识图谱的结合---------------------------


推荐序一
推荐序二
译者序
前言
第一部分 预备知识和构建模块
第1章 混合自然语言处理简介 2
1.1 知识图谱、嵌入和语言模型简史 2
1.2 自然语言处理中知识图谱和神经网络方法的结合 4
第2章 单词、意义和知识图谱嵌入 6
2.1 引言 6
2.2 分布式单词表示 6
2.3 词嵌入 7
2.4 意义和概念嵌入 8
2.5 知识图谱嵌入 9
2.6 本章小结 13
第3章 理解词嵌入和语言模型 14
3.1 引言 14
3.2 语言模型 15
3.2.1 统计语言模型 15
3.2.2 神经语言模型 16
3.3 NLP迁移学习的预训练模型微调 16
3.3.1 ELMo 16
3.3.2 GPT 17
3.3.3 BERT 17
3.4 机器人检测中预训练语言模型的微调 18
3.4.1 实验结果与讨论 21
3.4.2 使用Transformer库对BERT进行微调 21
3.5 本章小结 27
第4章 从文本中捕获意义作为词嵌入 28
4.1 引言 28
4.2 下载一个小文本语料库 29
4.3 一种学习词嵌入的算法 29
4.4 使用Swivel prep生成共现矩阵 30
4.5 从共现矩阵中学习嵌入 31
4.6 读取并检查存储的二进制嵌入 32
4.7 练习:从古腾堡工程中创建词嵌入 33
4.7.1 下载语料库并进行预处理 33
4.7.2 学习嵌入 34
4.7.3 检查嵌入 34
4.8 本章小结 34
第5章 捕获知识图谱嵌入 35
5.1 引言 35
5.2 知识图谱嵌入 35
5.3 为WordNet创建嵌入 37
5.3.1 选择嵌入算法:HolE 37
5.3.2 将WordNet知识图谱转换为所需输入 39
5.3.3 学习嵌入 44
5.3.4 检查嵌入结果 44
5.4 练习 47
5.4.1 练习:在自己的知识图谱上训练嵌入 47
5.4.2 练习:检查WordNet 3.0的预计算嵌入 47
5.5 本章小结 48
第二部分 神经网络与知识图谱的结合
第6章 从文本语料库、知识图谱和语言模型中构建混合表达 50
6.1 引言 50
6.2 准备工作和说明 51
6.3 Vecsigrafo的概念及构建方式 51
6.4 实现 53
6.5 训练Vecsigrafo 54
6.5.1 标记化和词义消歧 56
6.5.2 词汇表和共现矩阵 58
6.5.3 从共现矩阵学习嵌入 62
6.5.4 检查嵌入 64
6.6 练习:探索一个预先计算好的Vecsigrafo 66
6.7 从Vecsigrafo到Transigrafo 68
6.7.1 安装设置 70
6.7.2 训练Transigrafo 71
6.7.3 扩展知识图谱的覆盖范围 73
6.7.4 评估 Transigrafo 73
6.7.5 检查Transigrafo中的义项嵌入 75
6.7.6 探索Transigrafo嵌入的稳定性 77
6.7.7 额外的反思 81
6.8 本章小结 81
第7章 质量评估 82
7.1 引言 82
7.2 评估方法的概述 83
7.3 练习1:评估单词和概念嵌入 84
7.3.1 可视化探索 84
7.3.2 内在评估 85
7.3.3 词汇预测图 87
7.3.4 外在评估 90
7.4 练习2:评价通过嵌入获取的关系知识 90
7.4.1 下载embrela项目 91
7.4.2 下载生成的数据集 91
7.4.3 加载待评估的嵌入 92
7.4.4 学习模型 94
7.4.5 分析模型的结果 94
7.4.6 数据预处理:合并且增加字段 96
7.4.7 计算范围阈值和偏差数据集检测 97
7.4.8 发现统计上有意义的模型 99
7.4.9 关系型知识的评估结论 101
7.5 案例研究:评估和对比Vecsigrafo嵌入 101
7.5.1 比较研究 101
7.5.2 讨论 111
7.6 本章小结 114
第8章 利用Vecsigrafo捕获词法、语法和语义信息 116
8.1 引言 116
8.2 方法 118
8.2.1 Vecsigrafo:基于语料的单词–概念嵌入 118
8.2.2 联合嵌入空间 119
8.2.3 嵌入的评估 119
8.3 评估 120
8.3.1 数据集 121
8.3.2 单词相似度 121
8.3.3 类比推理 124
8.3.4 单词预测 125
8.3.5 科学文档的分类 127
8.4 讨论 129
8.5 练习:使用surface form对科学文献进行分类 130
8.5.1 导入所需的库 130
8.5.2 下载surface form的词嵌入和SciGraph论文 131
8.5.3 读取并准备分类数据集 131
8.5.4 surface form的词嵌入 133
8.5.5 创建嵌入层 134
8.5.6 训练一个卷积神经网络 134
8.6 本章小结 136
第9章 知识图谱的词嵌入空间对齐与应用 137
9.1 引言 137
9.2 概述及可能的应用 138
9.2.1 知识图谱的补全 139
9.2.2 超越多语言性:跨模态的词嵌入 139
9.3 词嵌入空间的对齐技术 140
9.3.1 线性对齐 140
9.3.2 非线性对齐 146
9.4 练习:寻找古代英语和现代英语的对应 146
9.4.1 下载小型文本语料库 146
9.4.2 学习基于老莎士比亚语料库的Swivel词嵌入 147
9.4.3 在WordNet之上加载UMBC的Vecsigrafo 149
9.4.4 练习的结论 149
9.5 本章小结 150
第三部分 应用
第10章 一种虚假信息分析的混合方法 152
10.1 引言 152
10.2 虚假信息检测 153
10.2.1 定义和背景 153
10.2.2 技术方法 155
10.3 应用:构建断言数据库 156
10.3.1 训练一个语义断言编码器 156
10.3.2 创建嵌入的一个语义索引并进行探索 165
10.3.3 以STS-B开发数据集填充索引 165
10.3.4 为一个断言数据集创建另一个索引 166
10.3.5 加载数据集到一个Pandas的DataFrame 167
10.3.6 构建一个断言数据库的总结 171
10.4 应用:假新闻和欺骗性语言检测 171
10.4.1 使用深度学习的基本文档分类 172
10.4.2 使用HolE的嵌入 176
10.4.3 使用Vecsigrafo UMBC WNet的嵌入 178
10.4.4 HoLE和UMBC嵌入的结合 179
10.4.5 讨论与结果 180
10.5 通过一个知识图谱得到传播虚假信息的评分 182
10.5.1 Data Commons Claim-Review的知识图谱 182
10.5.2 不可信度评分的传播 187
10.6 本章小结 190
第11章 科学领域中文本与视觉信息的联合学习 191
11.1 引言 191
11.2 图例–标题对应分析的模型与架构 193
11.3 数据集 195
11.4 评估图例–标题的对应分析任务 195
11.5 图例–标题的对应分析与图像–句子匹配的对比 197
11.6 标题与图例的分类 199
11.7 教科书问答的多模态机器理解 200
11.8 图例–标题对应分析的练习 201
11.8.1 预备步骤 201
11.8.2 图例–标题的对应分析 203
11.8.3 图像–句子匹配 216
11.8.4 标题/图例分类 219
11.8.5 教科书问答 223
11.9 本章小结 228
第12章 展望自然语言处理的未来 229
12.1 最终的评论、想法和愿景 229
12.2 趋势是什么?社会各界的意见 231
参考文献 238

推荐

车牌查询
桂ICP备20004708号-3