作者 |
[加] 大卫·L. 普尔(David L. Poole) 阿兰·K. 麦克沃斯(Alan K. Mackworth) |
丛书名 |
智能科学与技术丛书 |
出版社 |
机械工业出版社 |
ISBN |
9787111684350 |
简要 |
简介 |
内容简介书籍计算机书籍 本书是人工智能领域的经典书籍,新版做了全面修订,增加了关于机器学习的内容,并更新了代码示例和练习。本书主要讨论智能体(agent)的基本概念和体系结构,从计算的角度介绍相关的规划、学习、推理、协商、交互机制等理论,基于自主送货机器人、诊断助手、智能辅导系统和交易智能体四个原型应用,在一个连贯的框架下研究智能体的设计、构建和实现,并从十个维度考虑设计空间的复杂性。本书适合作为高等院校计算机科学等相关专业的人工智能入门教材,也适合该领域的技术人员参考。 |
目录 |
译者序 前言 致谢 第一部分 世界中的智能体:什么是智能体?如何创建智能体? 第1章 人工智能与智能体2 1.1 什么是人工智能2 1.1.1 人工智能和自然智能3 1.2 人工智能简史5 1.2.1 与其他学科的关系7 1.3 环境中的智能体7 1.4 设计智能体8 1.4.1 设计时间计算、离线计算和在线计算8 1.4.2 任务10 1.4.3 定义解决方案11 1.4.4 表示12 1.5 智能体设计空间14 1.5.1 模块性14 1.5.2 规划视野14 1.5.3 表示15 1.5.4 计算限制16 1.5.5 学习17 1.5.6 不确定性18 1.5.7 偏好19 1.5.8 智能体数量19 1.5.9 交互性20 1.5.10 各维度的相互作用20 1.6 原型应用21 1.6.1 自主送货机器人22 1.6.2 诊断助手24 1.6.3 智能辅导系统25 1.6.4 交易智能体27 1.6.5 智能家居28 1.7 本书概览29 1.8 回顾29 1.9 参考文献和进一步阅读30 1.10 练习31 第2章 智能体的体系结构与层次控制32 2.1 智能体32 2.2 智能体系统33 2.2.1 智能体的功能33 2.3 层级控制36 2.4 用推理行动42 2.4.1 智能体建模世界42 2.4.2 知识和行动43 2.4.3 设计时间计算和离线计算44 2.4.4 在线计算45 2.5 回顾46 2.6 参考文献和进一步阅读46 2.7 练习47 第二部分 确定性推理、规划与学习 第3章 搜索解决方案50 3.1 以搜索的方式解决问题50 3.2 状态空间51 3.3 图搜索53 3.3.1 形式化图搜索53 3.4 通用搜索算法55 3.5 无信息搜索策略57 3.5.1 广度优先搜索57 3.5.2 深度优先搜索59 3.5.3 迭代深化62 3.5.4 最低代价优先搜索64 3.6 启发式搜索65 3.6.1 A搜索66 3.6.2 设计启发式函数69 3.7 搜索空间的修剪70 3.7.1 环修剪70 3.7.2 多路径修剪70 3.7.3 搜索策略小结72 3.8 更复杂的搜索73 3.8.1 分支定界73 3.8.2 搜索的方向75 3.8.3 动态规划77 3.9 回顾79 3.10 参考文献和进一步阅读80 3.11 练习80 第4章 约束推理83 4.1 可能世界、变量和约束83 4.1.1 变量和世界83 4.1.2 约束86 4.1.3 约束满足问题87 4.2 生成和测试算法88 4.3 使用搜索求解CSP88 4.4 一致性算法89 4.5 域分割93 4.6 变量消除94 4.7 局部搜索96 4.7.1 迭代最佳改进98 4.7.2 随机算法98 4.7.3 局部搜索的变体99 4.7.4 评估随机算法102 4.7.5 随机重启104 4.8 基于种群的方法104 4.9 优化器106 4.9.1 系统化的优化方法108 4.9.2 用于优化的局部搜索110 4.10 回顾111 4.11 参考文献和进一步阅读112 4.12 练习112 第5章 命题与推理115 5.1 命题115 5.1.1 命题演算的语法115 5.1.2 命题演算的语义116 5.2 命题约束119 5.2.1 用于一致性算法的子句形式120 5.2.2 在局部搜索中利用命题结构121 5.3 命题确定子句121 5.3.1 问题和答案123 5.3.2 证明124 5.4 知识表示问题129 5.4.1 背景知识和观察129 5.4.2 查询用户130 5.4.3 知识层面的解释131 5.4.4 知识层面的调试133 5.5 反证法137 5.5.1 霍恩子句137 5.5.2 假设与冲突138 5.5.3 基于一致性的诊断139 5.5.4 用假设和霍恩子句进行推理140 5.6 完备知识假设143 5.6.1 非单调推理145 5.6.2 否定作为失败的证明过程146 5.7 溯因法148 5.8 因果模型152 5.9 回顾153 5.10 参考文献和进一步阅读153 5.11 练习154 第6章 确定性规划161 6.1 状态、动作、目标的表示161 6.1.1 显式状态空间表示162 6.1.2 STRIPS表示163 6.1.3 基于特征的动作表示164 6.1.4 初始化状态和目标166 6.2 前向规划166 6.3 回归规划168 6.4 CSP规划169 6.4.1 动作特征171 6.5 偏序规划173 6.6 回顾175 6.7 参考文献和进一步阅读176 6.8 练习176 第7章 有监督机器学习179 7.1 学习问题179 7.2 有监督学习181 7.2.1 评估预测值183 7.2.2 误差类型187 7.2.3 无输入特征的点估算189 7.3 有监督学习的基本模型190 7.3.1 学习决策树191 7.3.2 线性回归和分类195 7.4 过拟合200 7.4.1 伪计数202 7.4.2 正则化203 7.4.3 交叉验证204 7.5 神经网络与深度学习207 7.6 复合模型211 7.6.1 随机森林212 7.6.2 集成学习212 7.7 基于案例的推理214 7.8 实现精炼假设空间的学习216 7.8.1 版本空间学习217 7.8.2 可能近似正确的学习219 7.9 回顾221 7.10 参考文献和进一步阅读221 7.11 练习222 第三部分 不确定性推理、学习与行动 第8章 不确定性推理228 8.1 概率228 8.1.1 概率的语义229 8.1.2 概率的公理230 8.1.3 条件概率232 8.1.4 期望值236 8.1.5 信息237 8.2 独立性238 8.3 信念网络239 8.3.1 观察和查询241 8.3.2 构造信念网络241 8.4 概率推理246 8.4.1 信念网络的变量消去247 8.4.2 表示条件概率和因子253 8.5 序贯概率模型255 8.5.1 马尔可夫链256 8.5.2 隐马尔可夫模型257 8.5.3 监控和平滑的算法261 8.5.4 动态信念网络262 8.5.5 时间粒度263 8.5.6 语言的概率模型263 8.6 随机模拟268 8.6.1 单变量采样268 8.6.2 信念网络的前向采样269 8.6.3 拒绝采样270 8.6.4 似然加权271 8.6.5 重要性采样272 8.6.6 粒子滤波273 8.6.7 马尔可夫链蒙特卡罗275 8.7 回顾276 8.8 参考文献和进一步阅读276 8.9 练习277 第9章 不确定性规划283 9.1 偏好和效用284 9.1.1 理性公理284 9.1.2 因子化效用288 9.1.3 前景理论290 9.2 一次性决策291 9.2.1 单阶段决策网络294 9.3 序贯决策296 9.3.1 决策网络296 9.3.2 策略299 9.3.3 决策网络的变量消去300 9.4 信息和控制的价值303 9.5 决策过程305 9.5.1 策略308 9.5.2 价值迭代310 9.5.3 策略迭代313 9.5.4 动态决策网络314 9.5.5 部分可观察决策过程316 9.6 回顾317 9.7 参考文献和进一步阅读317 9.8 练习318 第10章 不确定性学习324 10.1 概率学习324 10.1.1 学习概率324 10.1.2 概率分类器326 10.1.3 决策树的MAP学习330 10.1.4 描述长度331 10.2 无监督学习332 10.2.1 k-均值332 10.2.2 用于软聚类的期望最大化335 10.3 学习信念网络338 10.3.1 学习概率338 10.3.2 隐藏变量339 10.3.3 缺失值340 10.3.4 结构学习340 10.3.5 信念网络学习的一般情况341 10.4 贝叶斯学习341 10.5 回顾345 10.6 参考文献和进一步阅读345 10.7 练习345 第11章 多智能体系统347 11.1 多智能体框架347 11.2 博弈的表示348 11.2.1 博弈的标准形式348 11.2.2 博弈的扩展形式349 11.2.3 多智能体决策网络351 11.3 完美信息计算策略352 11.4 不完美信息推理354 11.4.1 计算纳什均衡359 11.5 群体决策360 11.6 机制设计361 11.7 回顾363 11.8 参考文献和进一步阅读363 11.9 练习364 第12章 学习行动366 12.1 强化学习问题366 12.2 进化算法368 12.3 时间差分369 12.4 Q-学习370 12.5 探索和利用371 12.6 评估强化学习算法372 12.7 同策学习373 12.8 基于模型的强化学习375 12.9 使用特征的强化学习377 12.9.1 线性函数近似的SARSA377 12.10 多智能体强化学习379 12.10.1 完美信息游戏379 12.10.2 学会协作379 12.11 回顾383 12.12 参考文献和进一步阅读383 12.13 练习383 第四部分 基于个体和关系的推理、学习与行动 第13章 个体与关系386 13.1 利用关系结构386 13.2 符号和语义387 13.3 Datalog:一种关系规则语言388 13.3.1 基础Datalog的语义390 13.3.2 解释变量392 13.3.3 带变量的查询395 13.4 证明与替换397 13.4.1 实例和替换397 13.4.2 带变量的自下而上的程序398 13.4.3 合一化400 13.4.4 带变量的确定性解析401 13.5 函数符号403 13.5.1 带函数符号的证明程序406 13.6 自然语言中的应用408 13.6.1 在无上下文的语法中使用确定子句409 13.6.2 增强语法412 13.6.3 用于非终止的构建结构412 13.6.4 罐装的文本输出413 13.6.5 强制执行限制因素414 13.6.6 构建数据库的自然语言接口415 13.6.7 限制418 13.7 相等性419 13.7.1 允许相等性断言419 13.7.2 唯一名称假设420 13.8 完备知识假设422 13.8.1 完备知识假设证明程序425 13.9 回顾426 13.10 参考文献和进一步阅读426 13.11 练习427 第14章 本体论与知识库系统431 14.1 知识共享431 14.2 灵活的表示432 14.2.1 选择个体和关系432 14.2.2 图形化表示434 14.2.3 类435 14.3 本体论和知识共享437 14.3.1 统一资源标识符442 14.3.2 描述逻辑442 14.3.3 顶层本体448 14.4 实现知识库系统450 14.4.1 基础语言和元语言450 14.4.2 一个普通的元解释器452 14.4.3 拓展基础语言453 14.4.4 深度受限搜索454 14.4.5 建立证明树的元解释器455 14.4.6 延迟目标455 14.5 回顾456 14.6 参考文献和进一步阅读457 14.7 练习457 第15章 关系规划、学习与概率推理461 15.1 个体和关系的规划461 15.1.1 情境演算461 15.1.2 事件演算467 15.2 关系学习468 15.2.1 结构化学习:归纳逻辑编程468 15.2.2 学习隐藏属性:协作过滤472 15.3 统计关系型人工智能476 15.3.1 关系概率模型476 15.4 回顾483 15.5 参考文献和进一步阅读484 15.6 练习484 第五部分 回顾与展望 第16章 回顾与展望488 16.1 复杂性维度的回顾488 16.2 社会和道德后果491 16.3 参考文献和进一步阅读495 16.4 练习495 附录A 数学基础与标记496 参考文献 参考文献为网络资源,请访问华章网站www.hzbook.com下载。——编辑注 |