[套装书]计算机视觉实战:基于TensorFlow 2+OpenCV 4计算机视觉项目实战(原书第2版)(2册)

作者
本杰明·普朗什,艾略特·安德烈斯 大卫·米兰·埃斯克里瓦维尼休斯·G.门东萨 普拉蒂克·乔希
丛书名
智能系统与技术丛书
出版社
机械工业出版社
ISBN
9782108191615
简要
简介
内容简介书籍计算机书籍 ---------------------------8083260 - 计算机视觉实战:基于TensorFlow 2--------------------------- 本书探讨了谷歌机器学习开源框架的全新版本TensorFlow 2,从计算机视觉和深度学习基础知识开始,介绍了如何从头开始构建神经网络,并将其用于计算机视觉任务,如图像分类、目标分割、视频分析等。展示了如何使用如Inception和ResNet等现代神经网络分类图像,使用YOLO、Mask R-CNN和U-Net提取特定内容,并辅以具体的代码示例。还介绍了迁移学习、数据增强、域适应等技术,以及如何在移动设备和网络浏览器中进行部署。 ---------------------------8061510 - OpenCV 4计算机视觉项目实战(原书第2版)--------------------------- 本书通过实例和项目讲解OpenCV概念及其算法。首先介绍OpenCV的安装和图像处理的基础知识。然后,覆盖用户界面并深入讲解图像处理,读者将学到复杂的计算机视觉算法,并探索机器学习和人脸检测。之后,本书将介绍如何在复杂场景中创建光流视频分析和背景减除,还将讲解文本分割和识别,以及新的和改进的深度学习模块的基础知识。最后,本书介绍了OpenCV的基础知识,例如矩阵运算、滤波器和直方图,帮读者掌握常用的计算机视觉技术,从头开始构建OpenCV项目。
目录
[套装书具体书目]
8061510 - OpenCV 4计算机视觉项目实战(原书第2版) - 9787111631644 - 机械工业出版社 - 定价 79
8083260 - 计算机视觉实战:基于TensorFlow 2 - 9787111688471 - 机械工业出版社 - 定价 89



---------------------------8083260 - 计算机视觉实战:基于TensorFlow 2---------------------------


译者序
前言
作者简介
审校者简介
第一部分 TensorFlow 2和应用于
计算机视觉的深度学习
第1章 计算机视觉和神经网络2
1.1 技术要求2
1.2 广义计算机视觉3
1.2.1 计算机视觉概述3
1.2.2 主要任务及其应用3
1.3 计算机视觉简史8
1.3.1 迈出成功的第一步9
1.3.2 深度学习的兴起12
1.4 开始学习神经网络14
1.4.1 建立神经网络15
1.4.2 训练神经网络23
1.5 本章小结30
问题30
进一步阅读30
第2章 TensorFlow基础和模型训练31
2.1技术要求31
2.2TensorFlow 2和Keras入门31
2.2.1 TensorFlow32
2.2.2 基于Keras的简单计算机视觉模型33
2.3TensorFlow 2和Keras详述36
2.3.1 核心概念36
2.3.2 高级概念42
2.4TensorFlow生态系统46
2.4.1 TensorBoard46
2.4.2 TensorFlow插件和扩展47
2.4.3 TensorFlow Lite和TensorFlow.js48
2.4.4 在何处运行模型48
2.5本章小结49
问题50
第3章 现代神经网络51
3.1 技术要求51
3.2 卷积神经网络51
3.2.1 用于多维数据的神经网络52
3.2.2 CNN操作53
3.2.3 有效感受野63
3.2.4 在TensorFlow中使用CNN64
3.3 训练过程微调67
3.3.1 现代网络优化器67
3.3.2 正则化方法71
3.4 本章小结76
问题76
进一步阅读77
第二部分 先进的经典识别
问题解决方案
第4章 主流分类工具80
4.1 技术要求80
4.2 了解高级CNN架构81
4.2.1 VGG:CNN的标准架构81
4.2.2 GoogLeNet 和Inception模块85
4.2.3 ResNet:残差网络92
4.3 利用迁移学习96
4.3.1 概述96
4.3.2 基于TensorFlow和Keras的迁移学习100
4.4 本章小结102
问题103
进一步阅读103
第5章 目标检测模型104
5.1 技术要求104
5.2 目标检测介绍104
5.2.1 背景105
5.2.2  模型的性能评价106
5.3 YOLO:快速目标检测算法108
5.3.1 YOLO介绍109
5.3.2 使用YOLO推理110
5.3.3 训练YOLO117
5.4 Faster R-CNN:强大的目标检测模型120
5.4.1 Faster R-CNN通用架构120
5.4.2 训练Faster R-CNN124
5.4.3 TensorFlow目标检测API126
5.5 本章小结127
问题127
进一步阅读127
第6章 图像增强和分割128
6.1 技术要求128
6.2 使用编码器-解码器进行图像变换128
6.2.1 编码器-解码器概述129
6.2.2 基本示例:图像去噪132
6.2.3 卷积编码器-解码器133
6.3 理解语义分割140
6.3.1 使用编码器-解码器进行目标分割140
6.3.2 比较困难的实例分割145
6.4 本章小结148
问题148
进一步阅读148
第三部分 高级概念和计算机
视觉新进展
第7章 在复杂和稀缺数据集上训练150
7.1 技术要求150
7.2 高效数据服务151
7.2.1 TensorFlow 数据API151
7.2.2 设置输入流水线153
7.2.3 优化和监控输入流水线158
7.3 如何处理稀缺数据162
7.3.1 增强数据集162
7.3.2 渲染合成数据集166
7.3.3 利用域适应和生成模型(VAE和GAN) 170
7.4 本章小结179
问题179
进一步阅读179
第8章 视频和循环神经网络181
8.1 技术要求181
8.2 RNN简介181
8.2.1 基本形式182
8.2.2 对RNN的基本理解183
8.2.3 学习RNN权重184
8.2.4 长短期记忆单元185
8.3 视频分类188
8.3.1 计算机视觉应用于视频188
8.3.2 使用LSTM分类视频189
8.4 本章小结194
问题195
进一步阅读195
第9章 优化模型并在移动设备上部署196
9.1 技术要求196
9.2 优化计算和占用的磁盘空间197
9.2.1 测量推理速度197
9.2.2 提高模型推理速度199
9.2.3 当模型依旧很慢时201
9.2.4 减小模型大小202
9.3 基于终端设备的机器学习203
9.3.1 考虑因素203
9.3.2 实践204
9.4 app示例:识别面部表情206
9.4.1 MobileNet简介207
9.4.2 在终端设备上部署模型208
9.5 本章小结216
问题216
附录217
参考文献222
问题答案231



---------------------------8061510 - OpenCV 4计算机视觉项目实战(原书第2版)---------------------------


前言
作者简介
审校者简介
第1章 OpenCV入门 1
1.1 了解人类视觉系统 1
1.2 人类如何理解图像内容 3
1.3 你能用OpenCV做什么 4
1.3.1 内置数据结构和输入/输出 4
1.3.2 图像处理操作 5
1.3.3 GUI 5
1.3.4 视频分析 6
1.3.5 3D重建 6
1.3.6 特征提取 7
1.3.7 对象检测 7
1.3.8 机器学习 8
1.3.9 计算摄影 8
1.3.10 形状分析 9
1.3.11 光流算法 9
1.3.12 人脸和对象识别 9
1.3.13 表面匹配 10
1.3.14 文本检测和识别 10
1.3.15 深度学习 10
1.4 安装OpenCV 10
1.4.1 Windows 11
1.4.2 Mac OS X 11
1.4.3 Linux 13
1.5 总结 14
第2章 OpenCV基础知识导论 15
2.1 技术要求 15
2.2 基本CMake配置文件 16
2.3 创建一个库 16
2.4 管理依赖项 17
2.5 让脚本更复杂 18
2.6 图像和矩阵 20
2.7 读/写图像 22
2.8 读取视频和摄像头 25
2.9 其他基本对象类型 27
2.9.1 Vec对象类型 27
2.9.2 Scalar对象类型 28
2.9.3 Point对象类型 28
2.9.4 Size对象类型 29
2.9.5 Rect对象类型 29
2.9.6 RotatedRect对象类型 29
2.10 基本矩阵运算 30
2.11 基本数据存储 32
2.12 总结 34
第3章 学习图形用户界面 35
3.1 技术要求 35
3.2 OpenCV用户界面介绍 36
3.3 OpenCV的基本图形用户界面 36
3.4 Qt图形用户界面 44
3.5 OpenGL支持 50
3.6 总结 54
第4章 深入研究直方图和滤波器 55
4.1 技术要求 56
4.2 生成CMake脚本文件 56
4.3 创建图形用户界面 57
4.4 绘制直方图 59
4.5 图像颜色均衡 62
4.6 Lomography效果 64
4.7 卡通效果 68
4.8 总结 72
第5章 自动光学检查、对象分割和检测 73
5.1 技术要求 73
5.2 隔离场景中的对象 74
5.3 为AOI创建应用程序 76
5.4 预处理输入图像 78
5.4.1 噪声消除 78
5.4.2 用光模式移除背景进行分割 79
5.4.3 阈值 84
5.5 分割输入图像 85
5.5.1 连通组件算法 85
5.5.2 findContours算法 90
5.6 总结 92
第6章 学习对象分类 94
6.1 技术要求 94
6.2 机器学习概念介绍 95
6.3 计算机视觉和机器学习工作流程 98
6.4 自动对象检查分类示例 100
6.4.1 特征提取 102
6.4.2 训练SVM模型 105
6.4.3 输入图像预测 109
6.5 总结 111
第7章 检测面部部位与覆盖面具 112
7.1 技术要求 112
7.2 了解Haar级联 112
7.3 什么是积分图像 114
7.4 在实时视频中覆盖面具 115
7.5 戴上太阳镜 118
7.6 跟踪鼻子、嘴巴和耳朵 121
7.7 总结 122
第8章 视频监控、背景建模和形态学操作 123
8.1 技术要求 123
8.2 理解背景减除 124
8.3 直接的背景减除 124
8.4 帧差分 128
8.5 高斯混合方法 131
8.6 形态学图像处理 133
8.7 使形状变细 134
8.8 使形状变粗 135
8.9 其他形态运算符 136
8.9.1 形态开口 136
8.9.2 形态闭合 137
8.9.3 绘制边界 138
8.9.4 礼帽变换 139
8.9.5 黑帽变换 140
8.10 总结 140
第9章 学习对象跟踪 141
9.1 技术要求 141
9.2 跟踪特定颜色的对象 141
9.3 构建交互式对象跟踪器 143
9.4 用Harris角点检测器检测点 148
9.5 用于跟踪的好特征 151
9.6 基于特征的跟踪 153
9.6.1 Lucas-Kanade方法 153
9.6.2 Farneback算法 157
9.7 总结 161
第10章 开发用于文本识别的分割算法 162
10.1 技术要求 162
10.2 光学字符识别介绍 162
10.3 预处理阶段 164
10.3.1 对图像进行阈值处理 164
10.3.2 文本分割 165
10.4 在你的操作系统上安装Tesseract OCR 172
10.4.1 在Windows上安装Tesseract 172
10.4.2 在Mac上安装Tesseract 173
10.5 使用Tesseract OCR库 173
10.6 总结 177
第11章 用Tesseract进行文本识别 178
11.1 技术要求 178
11.2 文本API的工作原理 179
11.2.1 场景检测问题 179
11.2.2 极值区域 180
11.2.3 极值区域过滤 181
11.3 使用文本API 182
11.3.1 文本检测 182
11.3.2 文本提取 187
11.3.3 文本识别 189
11.4 总结 193
第12章 使用OpenCV进行深度学习 194
12.1 技术要求 194
12.2 深度学习简介 195
12.2.1 什么是神经网络,我们如何从数据中学习 195
12.2.2 卷积神经网络 197
12.3 OpenCV中的深度学习 198
12.4 YOLO用于实时对象检测 199
12.4.1 YOLO v3深度学习模型架构 200
12.4.2 YOLO数据集、词汇表和模型 200
12.4.3 将YOLO导入OpenCV 201
12.5 用SSD进行人脸检测 204
12.5.1 SSD模型架构 204
12.5.2 将SSD人脸检测导入OpenCV 204
12.6 总结 208

推荐

车牌查询
桂ICP备20004708号-3