作者 |
纪强 韦斯利·E.斯奈德 戚海蓉 |
丛书名 |
智能科学与技术丛书 |
出版社 |
机械工业出版社 |
ISBN |
9782109109563 |
简要 |
简介 |
内容简介书籍计算机书籍 ---------------------------8083979 - 概率图模型及计算机视觉应用--------------------------- 本书是美国伦斯勒理工学院(Rensselaer Polytechnic Institute, RPI)纪强(Qiang Ji)教授专门为概率图模型编写的一本专著。本书介绍了计算机视觉中的概率图模型(PGM),讨论了PGM及其在解决计算机视觉中存在的问题,提供了基本概念、定义和属性。专注于PGM的理论,以伪代码和推导的方式对PGM进行了详细的解释。 ---------------------------8074503 - 计算机视觉基础--------------------------- 计算机视觉的应用越来越广泛,已经成功的被应用到机器人、自动驾驶、医学成像和诊断、监控、视频分析等领域,甚至已将跟踪用于体育分析中。本书为读者提供了重要的数学和算法工具,使他们能够深入了解任何完整的计算机视觉系统的基本组成部分,并设计出同样的系统。这些内容包括识别局部特征,如在存在噪声情况下角或边的识别、边缘保持下的平滑、连通成分的标记、立体视觉、阈值处理、聚类、分割,以及描述、匹配形状和场景等。 本书使用了各种广泛的例子,包括面部图片、卡通图片、动物脚印和血管造影图片等等。另外,本书每个章节后都留有对应作业和建议实验的项目。 本书可以作为高年级本科生和低年级研究生的参考用书,也可以作为从事计算机视觉技术研究的从业者和科技人员的参考用书。 |
目录 |
[套装书具体书目] 8074503 - 计算机视觉基础 - 9787111663799 - 机械工业出版社 - 定价 119 8083979 - 概率图模型及计算机视觉应用 - 9787111690320 - 机械工业出版社 - 定价 99 ---------------------------8083979 - 概率图模型及计算机视觉应用--------------------------- 译者序 第1章 知识背景和学习动机1 1.1 引言1 1.2 本书目标和特点4 1.3 PGM介绍4 1.3.1 PGM的主要问题5 1.4 本书大纲6 参考文献7 第2章 基础概念9 2.1 引言9 2.2 随机变量与概率9 2.2.1 随机变量与概率定义9 2.2.2 基本的概率法则10 2.2.3 独立性和条件独立性11 2.2.4 均值、协方差、相关性和独立性11 2.2.5 概率不等式13 2.2.6 概率分布14 2.3 基本的估计方法17 2.3.1 极大似然法17 2.3.2 贝叶斯估计法19 2.4 优化方法19 2.4.1 连续优化19 2.4.2 离散优化21 2.5 采样和样本估计21 2.5.1 采样技术21 2.5.2 样本估计22 参考文献23 第3章 有向概率图模型25 3.1 引言25 3.2 贝叶斯网络25 3.2.1 BN表示25 3.2.2 BN的特性27 3.2.3 贝叶斯网络的类型29 3.3 BN推理34 3.3.1 精确推理方法35 3.3.2 近似推理方法47 3.3.3 高斯BN的推理55 3.3.4 贝叶斯推理56 3.3.5 不确定证据下的推理57 3.4 完全数据下的BN学习57 3.4.1 参数学习58 3.4.2 结构学习63 3.5 缺失数据下的BN学习69 3.5.1 参数学习69 3.5.2 结构学习75 3.6 人工贝叶斯网络规范76 3.7 动态贝叶斯网络77 3.7.1 简介77 3.7.2 学习和推理79 3.7.3 特殊的DBN81 3.8 分层贝叶斯网络91 3.8.1 分层贝叶斯模型91 3.8.2 分层深层模型95 3.8.3 混合分层模型98 3.9 附录99 3.9.1 式(3.63)证明99 3.9.2 高斯贝叶斯网络证明100 3.9.3 拉普拉斯近似102 参考文献102 第4章 无向概率图模型107 4.1 引言107 4.1.1 定义和性质107 4.2 成对马尔可夫网络110 4.2.1 离散成对马尔可夫网络110 4.2.2 标记观测马尔可夫网络111 4.2.3 高斯马尔可夫网络112 4.2.4 受限玻尔兹曼机113 4.3 条件随机场114 4.4 高阶长程马尔可夫网络116 4.5 马尔可夫网络推理117 4.5.1 精确推理方法117 4.5.2 近似推理方法120 4.5.3 其他MN推理方法122 4.6 马尔可夫网络学习123 4.6.1 参数学习123 4.6.2 结构学习129 4.7 马尔可夫网络与贝叶斯网络131 参考文献132 第5章 计算机视觉应用135 5.1 引言135 5.2 用于低级计算机视觉任务的PGM135 5.2.1 图像分割135 5.2.2 图像去噪136 5.2.3 用MRF标记图像136 5.2.4 用CRF进行图像分割141 5.2.5 用贝叶斯网络进行图像分割145 5.3 用于中级计算机视觉任务的PGM149 5.3.1 目标检测与识别149 5.3.2 场景识别165 5.3.3 目标追踪167 5.3.4 三维重建和立体视觉177 5.4 用于高级计算机视觉任务的PGM184 5.4.1 面部表情识别184 5.4.2 人类活动识别187 5.4.3 为人类活动识别刻画上下文208 参考文献212 索引220 ---------------------------8074503 - 计算机视觉基础--------------------------- 译者序 前言 致老师 第一部分 导论 第1章 计算机视觉的定义及其历史2 1.1 简介2 1.2 定义2 1.3 局部全局问题3 1.4 生物视觉4 1.4.1 生物动因4 1.4.2 视觉感知6 参考文献7 第2章 编写图像处理程序8 2.1 简介8 2.2 图像处理的基本程序结构8 2.3 良好的编程风格9 2.4 计算机视觉的重点9 2.5 图像分析软件工具包10 2.6 makefile10 2.7 作业11 参考文献11 第3章 数学原理回顾12 3.1 简介12 3.2 线性代数简要回顾12 3.2.1 向量12 3.2.2 向量空间14 3.2.3 零空间15 3.2.4 函数空间16 3.2.5 线性变换17 3.2.6 导数和导数算子19 3.2.7 特征值和特征向量20 3.2.8 特征分解21 3.2.9 奇异值分解21 3.3 函数最小化简要回顾23 3.3.1 梯度下降23 3.3.2 局部最小值和全局最小值26 3.3.3 模拟退火27 3.4 概率论简要回顾28 3.5 作业30 参考文献31 第4章 图像:表示和创建32 4.1 简介32 4.2 图像表示32 4.2.1 标志性表示(图像)32 4.2.2 函数表示(方程)34 4.2.3 线性表示(向量)34 4.2.4 概率表示(随机场)35 4.2.5 图形表示(图)35 4.2.6 邻接悖论和六边形像素36 4.3 作为曲面的图像38 4.3.1 梯度38 4.3.2 等值线38 4.3.3 脊39 4.4 作业39 参考文献40 第二部分 预处理 第5章 卷积核算子42 5.1 简介42 5.2 线性算子42 5.3 图像的向量表示44 5.4 导数估计45 5.4.1 使用核估计导数46 5.4.2 通过函数拟合来估计导数46 5.4.3 图像基向量49 5.4.4 核作为采样可微分函数50 5.4.5 其他高阶导数53 5.4.6 尺度简介54 5.5 边缘检测55 5.6 尺度空间58 5.6.1 金字塔58 5.6.2 没有重采样的尺度空间59 5.7 示例61 5.8 数字梯度检测器的性能63 5.8.1 方向导数63 5.8.2 方向估计67 5.8.3 讨论70 5.9 总结71 5.10 作业71 参考文献76 第6章 去噪78 6.1 简介78 6.2 图像平滑78 6.2.1 一维情况79 6.2.2 二维情况79 6.3 使用双边滤波器实现保边平滑82 6.4 使用扩散方程实现保边平滑84 6.4.1 一维空间的扩散方程84 6.4.2 PDE模拟85 6.4.3 二维空间的扩散方程85 6.4.4 可变电导扩散86 6.5 使用优化实现保边平滑87 6.5.1 噪声消除的目标函数87 6.5.2 寻找一个先验项90 6.5.3 MAP算法实现和均场退火92 6.5.4 病态问题和正则化94 6.6 等效算法95 6.7 总结97 6.8 作业97 参考文献99 第7章 数学形态学101 7.1 简介101 7.2 二值形态学101 7.2.1 膨胀101 7.2.2 腐蚀106 7.2.3 膨胀和腐蚀的性质107 7.2.4 开运算和闭运算108 7.2.5 开运算和闭运算的性质109 7.3 灰度形态学109 7.3.1 使用平面结构元素的灰度图像110 7.3.2 使用灰度结构元素的灰度图像113 7.3.3 使用集合运算的灰度形态学114 7.4 距离变换114 7.4.1 使用迭代最近邻计算DT115 7.4.2 使用二值形态运算计算DT115 7.4.3 使用掩码计算DT115 7.4.4 使用维诺图计算DT117 7.5 边缘链接的应用117 7.6 总结120 7.7 作业121 参考文献122 第三部分 图像理解 第8章 分割124 8.1 简介124 8.2 阈值:仅基于亮度的分割125 8.2.1 阈值的局部性质125 8.2.2 通过直方图分析选择阈值126 8.2.3 用高斯和拟合直方图129 8.2.4 高斯混合模型与期望最大化130 8.3 聚类:基于颜色相似度的分割132 8.3.1 k-均值聚类133 8.3.2 均值移位聚类135 8.4 连接组件:使用区域增长的空间分割136 8.4.1 递归方法136 8.4.2 迭代方法138 8.4.3 示例应用139 8.5 使用主动轮廓进行分割140 8.5.1 snake:离散和连续140 8.5.2 水平集:包含边或者不包含边144 8.6 分水岭:基于亮度曲面的分割151 8.7 图割:基于图论的分割156 8.7.1 目标函数157 8.7.2 求解目标函数158 8.8 使用MFA进行分割159 8.9 评估分割的质量160 8.10 总结161 8.11 作业162 参考文献163 第9章 参数变换167 9.1 简介167 9.2 霍夫变换168 9.2.1 垂线问题169 9.2.2 如何找到交点——累加器数组169 9.2.3 使用梯度降低计算复杂度170 9.3 寻找圆171 9.3.1 由任意三个非共线像素表示的圆的位置推导171 9.3.2 当原点未知但半径已知时找圆172 9.3.3 利用梯度信息减少找圆的计算172 9.4 寻找椭圆172 9.5 广义霍夫变换174 9.6 寻找峰值175 9.7 寻找三维形状——高斯图176 9.8 寻找对应体——立体视觉中的参数一致性177 9.9 总结179 9.10 作业179 参考文献180 第10章 表示法和形状匹配181 10.1 简介181 10.2 线性变换182 10.2.1 刚体变换182 10.2.2 仿射变换183 10.2.3 规范和指标184 10.3 协方差矩阵185 10.3.1 K-L扩展的推导186 10.3.2 K-L扩展的特性188 10.3.3 群190 10.4 区域特征191 10.4.1 简单特征191 10.4.2 矩193 10.4.3 链码195 10.4.4 傅里叶描述符195 10.4.5 中轴196 10.5 匹配特征向量197 10.5.1 匹配简单特征197 10.5.2 匹配向量197 10.5.3 将向量与类匹配198 10.6 使用边界描述形状199 10.6.1 形状矩阵200 10.6.2 形状上下文201 10.6.3 曲率尺度空间202 10.6.4 SKS模型204 10.7 形状空间中的测地线208 10.7.1 二维形状208 10.7.2 一个封闭的边界作为向量210 10.7.3 向量空间210 10.7.4 流形211 10.7.5 投影到闭合曲线上的流形212 10.7.6 找到一条测地线215 10.8 总结217 10.9 作业217 参考文献219 第11章 场景表示和匹配221 11.1 简介221 11.2 匹配的标志性表示221 11.2.1 将模板匹配到场景221 11.2.2 点匹配222 11.2.3 特征图像223 11.3 兴趣运算225 11.3.1 Harris-Laplace运算226 11.3.2 SIFT兴趣运算228 11.4 SIFT231 11.4.1 SIFT描述符231 11.4.2 使用SIFT描述符匹配邻域231 11.5 SKS231 11.5.1 SKS描述符232 11.5.2 使用SKS描述符匹配邻域233 11.6 方向梯度直方图234 11.6.1 方向梯度直方图描述符235 11.6.2 匹配方向梯度直方图描述符235 11.7 图匹配236 11.7.1 关联图237 11.7.2 松弛标记239 11.7.3 弹簧与模板240 11.8 再论弹簧和模板241 11.9 可变形模板241 11.10 总结242 11.11 作业243 参考文献246 第四部分 在三维世界中的二维图像 第12章 三维相关250 12.1 简介250 12.2 几何相机——两个已知相机的范围(立体视觉)251 12.2.1 投影251 12.2.2 投影相机252 12.2.3 坐标系254 12.3 从运动中恢复形状——两个未知相机的范围258 12.3.1 立体视觉与对应问题258 12.3.2 8点算法261 12.3.3 寻找相机矩阵262 12.3.4 相机矩阵的立体视觉263 12.3.5 基本歧义264 12.4 图像拼接和单应性264 12.4.1 视差267 12.4.2 匹配几何不变量269 12.5 控制照明——一个摄像头和一个光源的范围271 12.6 从x中恢复形状——单个相机的范围273 12.6.1 从阴影中恢复形状273 12.6.2 使用两个光源的着色形状274 12.6.3 表面法线的形状276 12.6.4 光度立体视觉法276 12.6.5 超过三个光源的光度立体视觉法277 12.6.6 从纹理中恢复形状278 12.6.7 从焦点中恢复形状278 12.7 三维空间的曲面279 12.7.1 二阶曲面279 12.7.2 将二阶曲面拟合到数据280 12.7.3 拟合椭圆和椭球体282 12.8 总结283 12.9 作业284 参考文献286 第13章 开发计算机视觉算法290 参考文献292 附录A 支持向量机293 附录B 如何区分包含核运算符的函数298 附录C 图像文件系统软件300 索引305 |