Anchor机制小结：Yolov1~Yolov5

最新推荐文章于 2026-05-22 09:06:41 发布

原创最新推荐文章于 2026-05-22 09:06:41 发布 · 3.4k 阅读

27 ·

本内容遵循CC 4.0 BY-SA版权协议

标签

#深度学习 #机器学习 #目标检测 #计算机视觉

目标检测专栏收录该内容

8 篇文章

订阅专栏

本文探讨了Anchor在物体检测中的应用，介绍了YOLO系列中Anchor的设计原理，包括其聚类方法和工作流程。重点剖析了Anchor存在的问题，如参数调整难度、样本不平衡等，并介绍了Anchor-Free机制，如CornerNet通过关键点检测来改进。最后概述了CornerNet的沙漏结构和预测输出。

1. Anchor定义

就是一个多尺度的滑动窗口，在特征图上的每个cell上生成不同尺寸、不同高宽比的Anchor，也叫先验框
为什么要引入多种比例的Anchor？
物体检测：一些候选区域进行分类和回归的问题。检测目标的大小、形状各不相同

在这里插入图片描述

2. Anchor工作过程

以YOLOv5为例，利用k-means根据数据集中目标主要分布的长宽尺度聚类出来的一组Anchor。
anchor4个值： x1,y1,x2,y2表矩形左上和右下角点坐标。
聚类生成3种尺度，每组尺度有3种长宽比为：1:1,1:2,2:1 ，共9个Anchor。
跨Anchor预测：每个GroundTruth中心点所在cell和周围4个cell都可以负责预测GroundTruth和这5个cell里的所有Anchor进行匹配，得到K个Anchor （YOLOv5：基于宽高比，其他：IoU）
K个Anchor负责预测这个GT，计算偏移量，生成K个预测框（正样本）

3. YOLOv1~YOLOv5的Anchor

在这里插入图片描述
参考文献

4.FasterRCNN： RPN网络

在特征图进行anchor生成，anchor：多尺度、大小固定
生成anchors -> softmax分类器提取positvie anchors -> bbox reg回归positive anchors -> Proposal Layer生成proposals
YOLOv2的Anchor基于RPN提出的
缺点：坐标x,y，w,h的预测是基于整张图片的，可能在左上角的cell产生的预测框跑到了右下角，不行