第06课:CNN 在机器视觉中的应用——目标检测

本文深入探讨卷积神经网络在目标检测中的应用,对比滑动窗口算法和基于CNN的方法。重点介绍了R-CNN系列和YOLO算法,特别是YOLO在人脸识别中的实践,通过Deeplearning4j实现人脸检测模型的训练和应用。

在上一节课中,我们介绍了卷积神经网络发展的历史以及图像分类的应用。本节课的内容将在上一节课的基础上,为大家介绍机器视觉中另一类经典案例——目标检测。本节课核心内容包括:

  • 卷积神经网络的应用:图像目标检测
  • 滑动窗口算法
  • 基于卷积神经网络的算法

目前基于深度神经网络的目标检测模型有:YOLO 系列、SSD、R-CNN 系列等。本节课我们将为大家介绍这些算法的基本原理并结合目前 Deeplearning4j 中直接支持的 YOLOv2 来构建目标检测的模型。在文章的最后,我们将为大家附上模型在图片和视频文件中的检测效果。

6.1 卷积神经网络的应用:图像目标检测

图像的目标检测问题不同于上面介绍的图像分类。图像分类无需具体定位图像中实物的具体位置,只需要完成对整体内容的识别;而目标检测需要检测出一个或者多个目标区域,通常我们用 Bounding Box(由中心坐标 [x,y]、矩形框宽 width 、矩形框高 height 来确定)来框选目标区域。

首先我们来回顾下目标检测的几种经典算法。

6.1.1 滑动窗口算法

滑动窗口的做法的核心思想是利用不同尺寸的矩阵窗口在图像中左右滑动,提取特征并用分类器进行识别。这里特征的选择和分类器可以有多种组合,例如:

  • HOG+SVM 可用于检测行人或其他常见物体
  • Harr+AdaBoost/SVM 常用于检测人脸

当然我们也可以使用深度学习的方式直接预测,即 HOG+SVM 或 Harr+AdaBoost 的组合,用 VGG-16 或其他网络整体替换。

滑动窗

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

wangongxi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值