目标检测综述
目标检测,通俗来讲就是在给定的图片或者视频中,从背景中分离得到不同物体的位置和类别。
因此,目标检测的基本任务有两个:
- 定位(bounding boxes)
- 识别(classification)
很好的一个目标检测概述(很清晰明了)
手工特征 —— 基于人工设计的特征表达
最开始的目标检测是基于手工设计特征的,是一种利用人类先验知识与智慧, 并将这类知识应用于目标检测、识别等任务的很好的方式.这类方法实现相对容易、计算也比较简单, 但其极大地依赖了人类知识、经验的总结, 且不能做到对图像或目标模型最本质的刻画。
此类的代表有通过获取图像关键点附近的梯度信息来描述运动目标的SIFT[1], 将HOG与支持向量机 (Support vector mach-ine, SVM) 相结合, 提出了可变形部件模型 (Deformable part model, DPM)[2],
[1] Lowe D G. Distinctive image features from scale-invariant keypoints[J]. International journal of computer vision, 2004, 60(2): 91-110.
[2] Felzenszwalb, Pedro F., et al. “Object detection with discriminatively trained part-based models.” IEEE transactions on pattern analysis and machine intelligence 32.9 (2009): 1627-1645.
基于人工设计的特征是人们通过手动设计提取得到的特征, 即存在一个对输入信号“显式”的预处理过程.目前, 人工设计的特征按视觉特性与特征计算的不同可以大致分为四类:梯度特征、模式特征、形状特征以及颜色特征.





但它们对于目标的描述存在着一个“显式”的处理过程, 对目标的刻画不够本质.这种方法始终是有瓶颈的,因此直到后来神经网络的应用,目标检测才有了跨越式的前进。
传统目标检测三步走:区域选择、特征提取、分类回归
遇到的问题:
1.区域选择的策略效果差、时间复杂度高
2.手工提取的特征鲁棒性较差
深度特征
one-stage和two-stage
①two-stage: 包括region proposal和CNN提取分类
②one-stage:将对象检测作为回归问题
知乎很好的文献综述 但是写作时间是2018.08.15
R-CNN[3] 是用卷积神经网络(CNN)做目标检测的第一篇,意义影响深远。①
[3] Rich feature hierarchies for accurate object detection and semantic segmentation

2万+

被折叠的 条评论
为什么被折叠?



