第06课：CNN 在机器视觉中的应用——目标检测

最新推荐文章于 2025-11-09 22:06:09 发布

原创最新推荐文章于 2025-11-09 22:06:09 发布 · 920 阅读

·

1

·

标签

#人工智能 #深度学习 #Java #Deeplearning4j #机器学习

Deeplearning4j 快速入门专栏收录该内容

23 篇文章 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文深入探讨卷积神经网络在目标检测中的应用，对比滑动窗口算法和基于CNN的方法。重点介绍了R-CNN系列和YOLO算法，特别是YOLO在人脸识别中的实践，通过Deeplearning4j实现人脸检测模型的训练和应用。

在上一节课中，我们介绍了卷积神经网络发展的历史以及图像分类的应用。本节课的内容将在上一节课的基础上，为大家介绍机器视觉中另一类经典案例——目标检测。本节课核心内容包括：

卷积神经网络的应用：图像目标检测
滑动窗口算法
基于卷积神经网络的算法

目前基于深度神经网络的目标检测模型有：YOLO 系列、SSD、R-CNN 系列等。本节课我们将为大家介绍这些算法的基本原理并结合目前 Deeplearning4j 中直接支持的 YOLOv2 来构建目标检测的模型。在文章的最后，我们将为大家附上模型在图片和视频文件中的检测效果。

6.1 卷积神经网络的应用：图像目标检测

图像的目标检测问题不同于上面介绍的图像分类。图像分类无需具体定位图像中实物的具体位置，只需要完成对整体内容的识别；而目标检测需要检测出一个或者多个目标区域，通常我们用 Bounding Box（由中心坐标 [x,y]、矩形框宽 width 、矩形框高 height 来确定）来框选目标区域。

首先我们来回顾下目标检测的几种经典算法。

6.1.1 滑动窗口算法

滑动窗口的做法的核心思想是利用不同尺寸的矩阵窗口在图像中左右滑动，提取特征并用分类器进行识别。这里特征的选择和分类器可以有多种组合，例如：

HOG+SVM 可用于检测行人或其他常见物体
Harr+AdaBoost/SVM 常用于检测人脸

当然我们也可以使用深度学习的方式直接预测，即 HOG+SVM 或 Harr+AdaBoost 的组合，用 VGG-16 或其他网络整体替换。

滑动窗

了解本专栏

超级会员免费看

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

wangongxi 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。