作者 |
涂铭 金智勇 |
丛书名 |
智能系统与技术丛书 |
出版社 |
机械工业出版社 |
ISBN |
9787111690344 |
简要 |
从工具、原理、算法3个维度深入浅出讲解深度学习和目标检测的技术与应用,提供大量实战案例 |
简介 |
内容简介书籍计算机书籍 这是一本从工具、原理、算法3个维度指导读者零基础快速掌握目标检测技术及其应用的入门书。 两位作者是资深的AI技术专家和计算机视觉算法专家,在阿里、腾讯、百度、三星等大企业从事计算机视觉相关的工作多年,不仅理论功底扎实、实践经验丰富,而且知道初学者进入计算机视觉领域的痛点和难点。据此,两位作者编写了这本针对目标检测初学者的入门书,希望从知识体系和工程实践的角度帮助读者少走弯路。 第1~2章是目标检测的准备工作,主要介绍了目标检测的常识、深度学习框架的选型、开发环境的搭建以及数据处理工具的使用。 第3~5章是目标检测的技术基础,主要讲解了数据预处理和卷积神经网络等图像分类技术的基础知识。 第6章比较详细地介绍了香港中文大学的开源算法库mmdetection。 第7~10章详细地讲解了目标检测的概念、原理、一阶段算法、二阶段算法以及提升算法性能的常用方法。 第11章简单介绍了目标检测的相关案例(以工业为背景),以帮助读者构建一个更完整的知识体系。 |
目录 |
前言 第1章 目标检测概述 1 1.1 什么是目标检测 1 1.2 典型的应用场景 2 1.2.1 人脸识别 2 1.2.2 智慧交通 2 1.2.3 工业检测 3 1.3 目标检测技术发展简史 3 1.3.1 传统算法 4 1.3.2 深度学习算法 5 1.4 目标检测领域重要的公开评测集 8 1.5 本章小结 11 第2章 目标检测前置技术 12 2.1 深度学习框架 12 2.1.1 Theano 12 2.1.2 TensorFlow 13 2.1.3 MXNet 14 2.1.4 Keras 15 2.1.5 PyTorch 15 2.1.6 Caffe 16 2.2 搭建开发环境 17 2.2.1 Anaconda 17 2.2.2 Conda 19 2.2.3 PyTorch的下载与安装 21 2.3 NumPy使用详解 22 2.3.1 创建数组 22 2.3.2 创建NumPy数组 24 2.3.3 获取NumPy属性 27 2.3.4 NumPy数组索引 28 2.3.5 切片 28 2.3.6 NumPy中的矩阵运算 29 2.3.7 数据类型转换 31 2.3.8 NumPy的统计计算方法 31 2.3.9 NumPy中的arg运算 32 2.3.10 FancyIndexing 33 2.3.11 NumPy数组比较 33 2.4 本章小结 35 第3章 卷积神经网络 36 3.1 卷积神经网络基础 36 3.1.1 全连接层 36 3.1.2 卷积层 37 3.1.3 池化层 42 3.1.4 三维数据的卷积运算 44 3.1.5 批规范化层 45 3.1.6 Dropout层 47 3.2 本章小结 48 第4章 数据预处理 49 4.1 数据增强 49 4.1.1 resize操作 50 4.1.2 crop操作 51 4.1.3 随机的水平和竖直翻转 52 4.1.4 随机角度的旋转 53 4.1.5 亮度、对比度和颜色的随机变化 54 4.1.6 彩色图转灰度图 55 4.2 数据的探索—Kaggle猫狗大战 56 4.3 本章小结 64 第5章 常见卷积神经网络结构 65 5.1 LeNet神经网络 65 5.2 AlexNet神经网络 70 5.3 VGGNet神经网络 77 5.4 GoogLeNet神经网络 81 5.4.1 inception模块 83 5.4.2 GoogLeNet的实现 85 5.4.3 GoogLeNet的演变 88 5.5 ResNet 89 5.5.1 残差模块 90 5.5.2 ResNet模型 92 5.6 DenseNet 92 5.7 其他网络结构 95 5.8 实战案例 96 5.9 计算图像数据集的RGB均值和方差 98 5.10 本章小结 99 第6章 mmdetection工具包介绍 100 6.1 mmdetection概要 100 6.2 mmdetection支持的检测框架和算法实现 101 6.3 搭建mmdetection开发环境 102 6.4 使用入门 103 6.4.1 使用预训练模型进行推理 103 6.4.2 训练模型 105 6.4.3 有用的工具 106 6.4.4 如何使用mmdetection 108 6.5 标注图像 110 6.6 实战案例 112 6.6.1 检测人体 113 6.6.2 检测猫和狗 115 6.7 本章小结 120 第7章 目标检测的基本概念 121 7.1 概念详解 121 7.1.1 IoU计算 122 7.1.2 NMS操作 122 7.1.3 感受野 124 7.1.4 空洞卷积 128 7.1.5 评价指标mAP 129 7.2 本章小结 131 第8章 两阶段检测方法 132 8.1 R-CNN算法 132 8.1.1 生成候选区域 132 8.1.2 类别判定 133 8.1.3 位置修正 136 8.1.4 检测过程 137 8.1.5 R-CNN算法的重要意义 138 8.2 SPP-Net算法 139 8.2.1 空间金字塔采样 139 8.2.2 网络训练 141 8.2.3 测试过程 142 8.3 Fast R-CNN算法及训练过程 143 8.3.1 ROI池化层 144 8.3.2 模型训练 144 8.3.3 测试过程 147 8.4 Faster R-CNN算法及训练过程 147 8.4.1 候选框提取网络 148 8.4.2 RPN和Fast R-CNN共享特征的方法 152 8.5 Faster R-CNN代码解析 153 8.5.1 代码整体结构 153 8.5.2 数据加载 158 8.5.3 构建主干网络 160 8.5.4 候选框提取网络 161 8.5.5 对候选框进行分类和位置校正 163 8.5.6 算法模型架构图 165 8.6 本章小结 165 第9章 检测算法的进一步改进 167 9.1 特征金字塔 167 9.1.1 特征金字塔结构 167 9.1.2 FPN代码解析 170 9.2 焦点损失函数 174 9.3 本章小结 175 第10章 一阶段检测算法 176 10.1 YOLO算法 176 10.1.1 YOLO第一版 176 10.1.2 YOLO第二版 182 10.1.3 YOLO第三版 185 10.2 SSD算法 196 10.2.1 SSD算法原理 197 10.2.2 训练方法 197 10.2.3 SSD代码解析 201 10.3 FCOS算法 208 10.3.1 FCOS算法原理 208 10.3.2 FCOS源码解析 213 10.4 本章小结 217 第11章 工业AI的发展 218 11.1 工业AI的概念和互联网 218 11.2 工业AI落地应用 219 11.2.1 工业AI的典型场景 220 11.2.2 工业AI落地背后的本质 221 11.2.3 展望 221 11.3 工业生产中的缺陷检测问题 221 11.3.1 视觉检测系统 221 11.3.2 光学识别软件 222 11.3.3 视觉质检典型需求场景 222 11.4 目标检测在工业中的案例:面板行业ADC解决方案 223 11.4.1 面板行业生产质检的特点 223 11.4.2 ADC解决方案 223 11.4.3 系统效果与价值总结 225 11.5 本章小结 226 |