| 作者 |
| E. R. 戴维斯 普林斯 |
| 丛书名 |
| 智能科学与技术丛书 |
| 出版社 |
| 机械工业出版社 |
| ISBN |
| 9782011121441 |
| 简要 |
| 简介 |
| 内容简介书籍计算机书籍 ---------------------------计算机视觉:原理、算法、应用及学习(原书第5版)--------------------------- 本书系统地展示了计算机视觉的基本方法学,讲解基础理论的同时,强调算法和实际中的设计约束。此次第5版全面修订,涵盖更多计算机视觉的概念和应用,既适合本科生和研究生,也适合该领域的研究人员和工程师。 ---------------------------计算机视觉:模型、学习和推理--------------------------- 本书是一本从机器学习视角讲解计算机视觉的优秀教材,主要讲述计算机视觉中模型、学习和推理三个方面的内容,揭示计算机视觉研究中 “模型”和“算法”之间的区别,并且对每一种新的视觉算法提出新的见解。本书图文并茂,算法描述由浅入深,主要包括概率、机器视觉的机器学习、局部模型的连接、图像预处理、几何模型、视觉模型等方面的内容,适合作为高年级本科生或研究生的计算机视觉和机器学习教材,也可供计算机视觉方面的专业人士参考。 |
| 目录 |
---------------------------计算机视觉:原理、算法、应用及学习(原书第5版)--------------------------- 译者序 推荐序 第5版前言 第1版前言 缩写词汇表 第1章 计算机视觉面临的挑战 1 1.1 导言—人类及其感官 1 1.2 视觉的本质 2 1.2.1 识别过程 2 1.2.2 解决识别问题 3 1.2.3 物体定位 4 1.2.4 场景分析 5 1.2.5 视觉是逆向图形学 6 1.3 从自动视觉检测到监控 6 1.4 本书是关于什么的 7 1.5 机器学习的作用 8 1.6 后续章节内容概述 9 1.7 书目注释 9 第一部分 初级视觉 第2章 图像与图像处理 12 2.1 导言 12 2.2 图像处理操作 15 2.2.1 灰度图像的一些基本操作 15 2.2.2 二值图像的基本操作 19 2.3 卷积和点扩散函数 21 2.4 顺序操作与并行操作 22 2.5 结束语 23 2.6 书目和历史注释 24 2.7 问题 24 第3章 图像滤波和形态学 25 3.1 导言 25 3.2 通过高斯平滑抑制噪声 27 3.3 中值滤波器 28 3.4 模式滤波器 30 3.5 秩排序滤波器 35 3.6 锐化–反锐化掩模 35 3.7 中值滤波器引入的偏移 36 3.7.1 中值偏移的连续体模型 36 3.7.2 推广到灰度图 38 3.7.3 中值偏移的离散模型 40 3.8 秩排序滤波器引入的偏移 41 3.9 滤波器在计算机视觉工业应用中的作用 44 3.10 图像滤波中的色彩 44 3.11 二值图像的膨胀和腐蚀 45 3.11.1 膨胀和腐蚀 45 3.11.2 抵消效应 45 3.11.3 改进的膨胀与腐蚀算子 45 3.12 数学形态学 46 3.12.1 泛化的形态学膨胀 46 3.12.2 泛化的形态学腐蚀 47 3.12.3 膨胀与腐蚀之间的对偶性 47 3.12.4 膨胀与腐蚀算子的特性 48 3.12.5 闭合与开启 50 3.12.6 基本形态学运算概要 51 3.13 形态学分组 53 3.14 灰度图像中的形态学 54 3.15 结束语 55 3.16 书目和历史注释 56 3.17 问题 58 第4章 阈值的作用 61 4.1 导言 61 4.2 区域生长方法 62 4.3 阈值方法 62 4.3.1 寻找合适的阈值 62 4.3.2 解决阈值选取中的偏差问题 63 4.4 自适应阈值 64 4.5 更彻底的阈值选择方法 66 4.5.1 基于方差的阈值 67 4.5.2 基于熵的阈值 67 4.5.3 最大似然阈值 68 4.6 全局波谷阈值方法 69 4.7 应用全局波谷阈值方法的实际结果 71 4.8 直方图凹性分析 75 4.9 结束语 75 4.10 书目和历史注释 76 4.11 问题 77 第5章 边缘检测 78 5.1 导言 78 5.2 边缘检测基本理论 79 5.3 模板匹配方法 80 5.4 3×3模板算子理论 81 5.5 微分梯度算子的设计 82 5.6 圆形算子的概念 83 5.7 圆形算子的详细实现 83 5.8 微分边缘算子的系统设计 85 5.9 上述方法的问题—一些替代方案 86 5.10 滞后阈值 88 5.11 Canny算子 89 5.12 Laplacian算子 92 5.13 结束语 93 5.14 书目和历史注释 93 5.15 问题 94 第6章 角点、兴趣点和不变特征的检测 95 6.1 导言 95 6.2 模板匹配 95 6.3 二阶导数方法 96 6.4 基于中值滤波的角点检测器 98 6.4.1 分析中值检测器的操作 98 6.4.2 实际结果 99 6.5 Harris兴趣点算子 100 6.5.1 各种几何构型的角点信号和位移 102 6.5.2 交叉点和T形交叉点的性能 103 6.5.3 Harris算子的不同形式 105 6.6 角点方向 106 6.7 局部不变特征检测器与描述符 106 6.7.1 几何变换和特征标准化 107 6.7.2 Harris尺度、仿射不变检测器和描述符 108 6.7.3 Hessian尺度、仿射不变检测器和描述符 109 6.7.4 尺度不变特征变换算子 110 6.7.5 加速鲁棒特征算子 110 6.7.6 最大稳定极值区域 111 6.7.7 各种不变特征检测器的比较 112 6.7.8 定向梯度直方图 114 6.8 结束语 115 6.9 书目和历史注释 116 6.10 问题 118 第7章 纹理分析 119 7.1 导言 119 7.2 纹理分析的一些基本方法 121 7.3 灰度共生矩阵 122 7.4 Laws纹理能量法 123 7.5 Ade特征滤波器法 125 7.6 对Laws法和Ade法的评估 126 7.7 结束语 127 7.8 书目和历史注释 127 第二部分 中级视觉 第8章 二值化形状分析 130 8.1 导言 130 8.2 二值图像的连通性 131 8.3 物体标记和计数 131 8.4 尺寸滤波 136 8.5 距离函数及其用途 138 8.6 骨架和细化 140 8.6.1 交叉数 141 8.6.2 细化的并行和顺序实现 143 8.6.3 引导细化 144 8.6.4 如何看待骨架的本质 145 8.6.5 骨架节点分析 146 8.6.6 骨架在形状识别中的应用 146 8.7 形状识别的其他度量 147 8.8 边界跟踪过程 148 8.9 结束语 149 8.10 书目和历史注释 150 8.11 问题 151 第9章 边界模式分析 154 9.1 导言 154 9.2 边界跟踪过程 156 9.3 质心轮廓 156 9.4 质心轮廓方法存在的问题 157 9.5 (s, ψ)图 159 9.6 解决遮挡问题 160 9.7 边界长度度量的准确性 162 9.8 结束语 163 9.9 书目和历史注释 164 9.10 问题 165 第10章 直线、圆和椭圆的检测 166 10.1 导言 166 10.2 霍夫变换在直线检测中的应用 167 10.3 垂足法 169 10.4 使用RANSAC进行直线检测 171 10.5 腹腔镜工具的位置 174 10.6 基于霍夫的圆形物体检测方案 175 10.7 圆半径未知的问题 178 10.8 克服速度问题 179 10.9 椭圆检测 181 10.9.1 直径平分法 182 10.9.2 弦切法 183 10.9.3 寻找剩余椭圆参数 184 10.10 人类虹膜定位 185 10.11 结束语 186 10.12 书目和历史注释 187 10.13 问题 189 第11章 广义霍夫变换 191 11.1 导言 191 11.2 广义霍夫变换 192 11.3 空间匹配滤波的相关性 193 11.4 梯度加权与均匀加权 194 11.4.1 灵敏度和计算负荷的计算 195 11.4.2 总结 196 11.5 使用GHT检测椭圆 196 11.6 各种椭圆检测方法的比较 199 11.7 物体定位的图论方法 200 11.8 节省计算的可能性 204 11.9 使用GHT进行特征排序 205 11.10 推广最大团及其他方法 207 11.11 搜索 208 11.12 结束语 208 11.13 书目和历史注释 209 11.14 问题 212 第12章 物体分割与形状模型 215 12.1 导言 215 12.2 主动轮廓 215 12.3 使用主动轮廓获得的实际结果 217 12.4 用于物体分割的水平集方法 218 12.5 形状模型 219 12.6 结束语 227 12.7 书目和历史注释 227 第三部分 机器学习和深度学习网络 第13章 基本分类概念 230 13.1 导言 230 13.2 最近邻算法 231 13.3 贝叶斯决策理论 232 13.4 最近邻与贝叶斯方法的关系 234 13.4.1 问题的数学陈述 234 13.4.2 最近邻算法的重要性 236 13.5 最佳特征数量 236 13.6 代价函数和错误–拒绝权衡 236 13.7 监督和无监督学习 238 13.8 聚类分析 238 13.9 支持向量机 240 13.10 人工神经网络 241 13.11 反向传播算法 244 13.12 多层感知器架构 246 13.13 训练数据过拟合 247 13.14 结束语 248 13.15 书目和历史注释 249 13.16 问题 250 第14章 机器学习:概率方法 251 14.1 导言 251 14.2 高斯混合和EM算法 253 14.3 更一般的EM算法视图 257 14.4 一些实际例子 259 14.5 主成分分析 264 14.6 多分类器 266 14.7 Boosting方法 268 14.8 AdaBoost建模 270 14.9 Boosting方法的损失函数 272 14.10 LogitBoost算法 275 14.11 Boosting方法的有效性 277 14.12 多类别的Boosting方法 277 14.13 接受者操作特性 281 14.14 结束语 284 14.15 书目和历史注释 284 14.16 问题 286 第15章 深度学习网络 287 15.1 导言 287 15.2 卷积神经网络 289 15.3 用于定义CNN架构的参数 290 15.4 LeCun 等人提出的LeNet 架构 293 15.5 Krizhevsky等人提出的AlexNet架构 296 15.6 Zeiler和Fergus对CNN架构的研究 300 15.7 Zeiler和Fergus的可视化实验 302 15.8 Simonyan和Zisserman的VGGNet架构 303 15.9 Noh等人的DeconvNet架构 305 15.10 Badrinarayanan等人的SegNet架构 307 15.11 循环神经网络 309 15.12 结束语 311 15.13 书目和历史注释 313 第四部分 三维视觉和运动 第16章 三维世界 316 16.1 导言 316 16.2 三维视觉方法 316 16.3 三维视觉投影方案 318 16.3.1 双目图像 319 16.3.2 对应问题 320 16.4 阴影形状 322 16.5 光度立体技术 325 16.6 表面光滑性的假设 326 16.7 纹理形状 327 16.8 结构光的使用 327 16.9 三维物体识别方案 329 16.10 Horaud的汇聚定向技术 329 16.11 一个重要的范例—工业零件的定位 332 16.12 结束语 333 16.13 书目和历史注释 334 16.14 问题 336 第17章 解决n点透视问题 338 17.1 导言 338 17.2 视角倒转现象 338 17.3 弱透视投影下的姿势歧义性 339 17.4 求姿势估计的唯一解 341 17.4.1 三点情况下的解 343 17.4.2 利用对称梯形来预测姿势 344 17.5 结束语 345 17.6 书目和历史注释 345 17.7 问题 346 第18章 不变量与透视 347 18.1 导言 347 18.2 交比:“比率的比率”的概念 348 18.3 非共线点的不变量 351 18.4 圆锥曲线上点的不变量 353 18.5 微分和半微分不变量 355 18.6 对称交比函数 356 18.7 消失点检测 357 18.8 更多关于消失点的内容 358 18.9 圆和椭圆的表观中心 359 18.10 美术和摄影中的透视效果 360 18.11 结束语 365 18.12 书目和历史注释 365 18.13 问题 367 第19章 图像变换和摄像机校准 368 19.1 导言 368 19.2 图像变换 369 19.3 摄像机校准 372 19.4 内部和外部参数 373 19.5 径向畸变纠正 375 19.6 多视图视觉 376 19.7 广义的对极几何 376 19.8 本征矩阵 377 19.9 基础矩阵 378 19.10 本征矩阵和基础矩阵的性质 379 19.11 评估基础矩阵 380 19.12 8点算法的更新 380 19.13 图像校正 380 19.14 三维重建 381 19.15 结束语 382 19.16 书目和历史注释 383 19.17 问题 384 第20章 运动 385 20.1 导言 385 20.2 光流 385 20.3 光流场的理解 387 20.4 利用扩展焦点避免碰撞 389 20.5 时间邻近度分析 390 20.6 基于光流模型的基本问题 391 20.7 运动中的立体视觉 391 20.8 卡尔曼滤波器 393 20.9 宽基线匹配 394 20.10 结束语 395 20.11 书目和历史注释 396 20.12 问题 396 第五部分 计算机视觉的应用 第21章 人脸检测与识别:深度学习带来的影响 398 21.1 导言 398 21.2 一种人脸检测的简单方法 399 21.3 人脸特征检测 401 21.4 用于快速人脸检测的Viola-Jones方法 402 21.5 人脸识别的特征脸方法 404 21.6 人脸识别的其他难点 406 21.7 人脸正面化 408 21.8 Sun等人提出的DeepID人脸表征系统 410 21.9 再议快速人脸检测 413 21.10 三维人脸检测 416 21.11 结束语 417 21.12 书目和历史注释 418 第22章 监控 420 22.1 导言 420 22.2 监控:基本几何 421 22.3 前景–背景分离 424 22.3.1 背景建模 424 22.3.2 背景建模的实例 426 22.3.3 前景的直接检测 430 22.4 粒子滤波 430 22.5 基于颜色直方图的跟踪 434 22.6 粒子滤波的应用 437 22.7 倒角匹配、跟踪和遮挡 439 22.8 多个摄像机的组合视角 440 22.9 交通流量监测的应用 443 22.9.1 Bascle等人的系统 443 22.9.2 Koller等人的系统 445 22.10 车牌定位 446 22.11 跟踪遮挡分类 447 22.12 通过步态区分行人 449 22.13 人体步态分析 451 22.14 基于模型的动物跟踪 452 22.15 结束语 454 22.16 书目和历史注释 455 22.17 问题 456 第23章 车载视觉系统 457 23.1 导言 457 23.2 定位道路 458 23.3 道路交通标线的定位 459 23.4 道路交通标志的定位 461 23.5 车辆的定位 462 23.6 通过查看车牌和其他结构特征获得的信息 464 23.7 定位行人 466 23.8 导航和自我运动 468 23.9 农业车辆导航 471 23.9.1 任务的三维层面 473 23.9.2 实时实现 473 23.10 结束语 474 23.11 高级驾驶辅助系统的更多细节及相关书目 474 23.11.1 车辆检测的发展 476 23.11.2 行人检测的发展 476 23.11.3 道路和车道检测的发展 478 23.11.4 交通标志检测的发展 479 23.11.5 路径规划、导航和自我运动的发展 480 23.12 问题 480 第24章 结语——计算机视觉展望 481 24.1 导言 481 24.2 机器视觉中的重要参数 481 24.3 权衡 483 24.3.1 一些重要的权衡 483 24.3.2 两阶段模板匹配权衡 484 24.4 摩尔定律的作用 484 24.5 硬件、算法和过程 485 24.6 选择表达形式的重要性 485 24.7 过去、现在和未来 486 24.8 深度学习探索 487 24.9 书目和历史注释 487 在线资源 附录A 稳健统计 附录B 采样定理 附录C 颜色的表示 附录D 从分布中采样 参考文献 ---------------------------计算机视觉:模型、学习和推理--------------------------- 译者序 译者简介 序 前言 第1章绪论1 1.1本书结构2 1.2其他书籍4 第一部分概率 第2章概率概述6 2.1随机变量6 2.2联合概率7 2.3边缘化7 2.4条件概率8 2.5贝叶斯公式9 2.6独立性9 2.7期望10 讨论10 备注11 习题11 第3章常用概率分布12 3.1伯努利分布13 3.2贝塔分布13 3.3分类分布14 3.4狄利克雷分布14 3.5一元正态分布15 3.6正态逆伽马分布15 3.7多元正态分布16 3.8正态逆维希特分布16 3.9共轭性17 总结18 备注18 习题18 第4章拟合概率模型21 4.1最大似然法21 4.2最大后验法21 4.3贝叶斯方法22 4.4算例1:一元正态分布22 4.4.1最大似然估计22 4.4.2最大后验估计24 4.4.3贝叶斯方法26 4.5算例2:分类分布28 4.5.1最大似然法28 4.5.2最大后验法29 4.5.3贝叶斯方法30 总结31 备注31 习题32 第5章正态分布34 5.1协方差矩阵的形式34 5.2协方差分解35 5.3变量的线性变换36 5.4边缘分布36 5.5条件分布37 5.6正态分布的乘积38 5.7变量改变38 总结38 备注39 习题39 第二部分机器视觉的机器学习 第6章视觉学习和推理42 6.1计算机视觉问题42 6.2模型的种类42 6.2.1判别模型43 6.2.2生成模型43 6.3示例1:回归43 6.3.1判别模型44 6.3.2生成模型44 6.4示例2:二值分类46 6.4.1判别模型46 6.4.2生成模型46 6.5应该用哪种模型48 6.6应用49 6.6.1皮肤检测49 6.6.2背景差分50 总结51 备注51 习题52 第7章复杂数据密度建模54 7.1正态分类模型54 7.2隐变量56 7.3期望最大化57 7.4混合高斯模型58 7.4.1混合高斯边缘化59 7.4.2基于期望最大化的混合模型拟合59 7.5t分布63 7.5.1学生t分布边缘化64 7.5.2拟合t分布的期望最大化65 7.6因子分析67 7.6.1因子分析的边缘分布68 7.6.2因子分析学习的期望最大化68 7.7组合模型71 7.8期望最大化算法的细节71 7.8.1期望最大化算法的下界73 7.8.2E步74 7.8.3M步74 7.9应用75 7.9.1人脸检测75 7.9.2目标识别76 7.9.3分割77 7.9.4正脸识别78 7.9.5改变人脸姿态(回归)78 7.9.6作为隐变量的变换79 总结80 备注80 习题81 第8章回归模型82 8.1线性回归82 8.1.1学习83 8.1.2线性回归模型的问题83 8.2贝叶斯线性回归84 8.2.1实际考虑85 8.2.2拟合方差86 8.3非线性回归87 8.3.1最大似然法87 8.3.2贝叶斯非线性回归89 8.4核与核技巧89 8.5高斯过程回归90 8.6稀疏线性回归91 8.7二元线性回归93 8.8相关向量回归95 8.9多变量数据回归96 8.10应用96 8.10.1人体姿势估计96 8.10.2位移专家97 讨论98 备注98 习题98 第9章分类模型100 9.1逻辑回归100 9.1.1学习:最大似然估计102 9.1.2逻辑回归模型的问题103 9.2贝叶斯逻辑回归104 9.2.1学习104 9.2.2推理106 9.3非线性逻辑回归107 9.4对偶逻辑回归模型108 9.5核逻辑回归110 9.6相关向量分类111 9.7增量拟合和boosting113 9.8分类树116 9.9多分类逻辑回归117 9.10随机树、随机森林和随机蕨分类器118 9.11与非概率模型的联系119 9.12应用120 9.12.1性别分类120 9.12.2脸部和行人检测121 9.12.3语义分割122 9.12.4恢复表面布局123 9.12.5人体部位识别124 讨论125 备注125 习题127 第三部分连接局部模型 第10章图模型130 10.1条件独立性130 10.2有向图模型131 10.2.1示例1132 10.2.2示例2132 10.2.3示例3133 10.2.4总结134 10.3无向图模型134 10.3.1示例1135 10.3.2示例2136 10.4有向图模型与无向图模型的对比136 10.5计算机视觉中的图模型137 10.6含有多个未知量的模型推理139 10.6.1求最大后验概率的解139 10.6.2求后验概率分布的边缘分布139 10.6.3最大化边缘140 10.6.4后验分布的采样140 10.7样本采样140 10.7.1有向图模型的采样141 10.7.2无向图模型的采样141 10.8学习142 10.8.1有向图模型的学习142 10.8.2无向图模型的学习143 讨论145 备注145 习题145 第11章链式模型和树模型147 11.1链式模型148 11.1.1有向链式模型148 11.1.2无向链式模型148 11.1.3模型的等价性148 11.1.4隐马尔可夫模型在手语中的应用149 11.2链式MAP推理149 11.3树的MAP推理152 11.4链式边缘后验推理155 11.4.1求解边缘分布155 11.4.2前向后向算法156 11.4.3置信传播157 11.4.4链式模型的和积算法158 11.5树的边缘后验推理160 11.6链式模型和树模型的学习161 11.7链式模型和树模型之外的东西161 11.8应用163 11.8.1手势跟踪163 11.8.2立体视觉164 11.8.3形象化结构166 11.8.4分割167 讨论167 备注168 习题169 第12章网格模型172 12.1马尔可夫随机场172 12.1.1网格示例173 12.1.2离散成对MRF图像去噪174 12.2二值成对马尔可夫随机场的MAP推理175 12.2.1最大流/最小割176 12.2.2MAP推理:二值变量177 12.3多标签成对MRF的MAP推理182 12.4非凸势的多标签MRF186 12.5条件随机场189 12.6高阶模型190 12.7网格有向模型190 12.8应用191 12.8.1背景差分191 12.8.2交互式分割192 12.8.3立体视觉193 12.8.4图像重排193 12.8.5超分辨率195 12.8.6纹理合成196 12.8.7合成新面孔197 讨论198 备注198 习题200 第四部分预处理 第13章图像预处理与特征提取204 13.1逐像素变换204 13.1.1白化204 13.1.2直方图均衡化205 13.1.3线性滤波206 13.1.4局部二值模式210 13.1.5纹理基元映射211 13.2边缘、角点和兴趣点212 13.2.1Canny边缘检测器212 13.2.2Harris角点检测器214 13.2.3SIFT检测器215 13.3描述子216 13.3.1直方图216 13.3.2SIFT描述子216 13.3.3方向梯度直方图217 13.3.4词袋描述子218 13.3.5形状内容描述子218 13.4降维219 13.4.1单数值近似220 13.4.2主成分分析221 13.4.3二元主成分分析221 13.4.4K均值算法222 结论223 备注223 习题224 第五部分几何模型 第14章针孔摄像机228 14.1针孔摄像机简介228 14.1.1归一化摄像机229 14.1.2焦距参数230 14.1.3偏移量和偏移参数230 14.1.4摄像机的位置与方向231 14.1.5全针孔摄像机模型232 14.1.6径向畸变232 14.2三个几何问题233 14.2.1问题1:学习外在参数233 14.2.2问题2:学习内在参数234 14.2.3问题3:推理3D世界点235 14.2.4解决问题235 14.3齐次坐标236 14.4学习外在参数237 14.5学习内在参数239 14.6推理3D世界点240 14.7应用241 14.7.1结构光的深度241 14.7.2剪影重构243 讨论245 备注245 习题246 第15章变换模型249 15.1二维变换模型249 15.1.1欧氏变换模型249 15.1.2相似变换模型251 15.1.3仿射变换模型252 15.1.4投影变换模型252 15.1.5增加不确定性254 15.2变换模型中的学习255 15.2.1学习欧氏参数255 15.2.2学习相似参数256 15.2.3学习仿射参数256 15.2.4学习投影参数257 15.3变换模型中的推理258 15.4平面的三个几何问题258 15.4.1问题1:学习外在参数258 15.4.2问题2:学习内在参数260 15.4.3问题3:与摄像机相关的3D位置推理261 15.5图像间的变换261 15.5.1单应性的几何特征262 15.5.2计算图像间的变换263 15.6变换的鲁棒学习264 15.6.1RANSAC264 15.6.2连续RANSAC265 15.6.3PEaRL266 15.7应用268 15.7.1增强现实追踪268 15.7.2视觉全景269 讨论270 备注270 习题271 第16章多摄像机系统273 16.1双视图几何学理论273 16.1.1极线约束274 16.1.2极点274 16.2实矩阵275 16.2.1实矩阵的属性276 16.2.2实矩阵的分解277 16.3基础矩阵279 16.3.1基础矩阵的估计279 16.3.28点算法280 16.4双视图重构的流程281 16.5校正284 16.5.1平面校正284 16.5.2极面校正286 16.5.3校正后处理287 16.6多视图重构287 16.7应用290 16.7.1三维重构290 16.7.2图片浏览291 16.7.3立体图割292 讨论293 备注293 习题294 第六部分视觉模型 第17章形状模型298 17.1形状及其表示298 17.2snake模型299 17.2.1推理301 17.2.2snake模型中存在的问题301 17.3形状模板302 17.3.1推理303 17.3.2用迭代最近点算法进行推理304 17.4统计形状模型304 17.4.1学习305 17.4.2推理306 17.5子空间形状模型306 17.5.1概率主成分分析307 17.5.2学习308 17.5.3推理309 17.6三维形状模型311 17.7形状和外观的统计模型311 17.7.1学习313 17.7.2推理314 17.8非高斯统计形状模型315 17.8.1回归PPCA315 17.8.2高斯过程隐变量模型316 17.9铰接式模型317 17.10应用319 17.10.1三维形变模型319 17.10.2三维人体模型321 讨论322 备注322 习题324 第18章身份与方式模型326 18.1子空间身份模型328 18.1.1学习329 18.1.2推理331 18.1.3在其他识别任务中的推理332 18.1.4身份子空间模型的局限性333 18.2概率线性判别分析334 18.2.1学习335 18.2.2推理335 18.3非线性身份模型336 18.4非对称双线性模型337 18.4.1学习339 18.4.2推理339 18.5对称双线性和多线性模型341 18.5.1学习342 18.5.2推理343 18.5.3多线性模型344 18.6应用344 18.6.1人脸识别344 18.6.2纹理建模345 18.6.3动画合成346 讨论346 备注346 习题348 第19章时序模型349 19.1时序估计框架349 19.1.1推理350 19.1.2学习350 19.2卡尔曼滤波器351 19.2.1推理351 19.2.2改写测量合并阶段352 19.2.3推理总结353 19.2.4示例1353 19.2.5示例2354 19.2.6滤波355 19.2.7时序和测量模型356 19.2.8卡尔曼滤波器的问题358 19.3扩展卡尔曼滤波器358 19.4无损卡尔曼滤波器360 19.4.1状态演化361 19.4.2测量合并过程362 19.5粒子滤波363 19.5.1时间演化364 19.5.2测量合并364 19.5.3扩展366 19.6应用366 19.6.1行人跟踪366 19.6.2单目的即时定位与地图构建366 19.6.3在复杂背景中跟踪轮廓线367 讨论369 备注369 习题370 第20章视觉词模型372 20.1视觉词集合的图像372 20.2词袋373 20.2.1学习374 20.2.2推理374 20.2.3词袋模型的相关问题375 20.3隐狄利克雷分布376 20.3.1学习377 20.3.2非监督物体检测379 20.4单一创作主题模型380 20.4.1学习381 20.4.2推理382 20.5星座模型382 20.5.1学习383 20.5.2推理385 20.6场景模型385 20.7应用386 20.7.1视频搜索386 20.7.2行为识别387 讨论388 备注389 习题389 第七部分附录 附录A符号说明392 附录B最优化394 附录C线性代数402 参考文献413 |