基于 YOLO 系列模型的蔬菜分类数据集训练与对比实验

CLIP-GmP-ViT-L-14编码模型

CLIP-GmP-ViT-L-14编码模型

图像识别
CLIP

CLIP-GmP-ViT-L-14编码模型` 是一个图文双塔编码模型,适合做图文匹配、零样本分类和跨模态检索演示。本镜像已经完成 Web 部署,打开页面即可上传图片并测试图文表征能力

前言

在智慧农业、农产品自动化分拣等实际应用场景中,基于深度学习的蔬菜分类识别技术具备重要的实用价值。而高质量、划分规范的数据集,搭配主流目标检测模型的训练验证,是提升模型泛化能力与识别精度的关键。本文分享一套用于蔬菜分类的公开数据集,并基于该数据集完成多个主流 YOLO 版本模型的训练与效果对比,为相关研究与工程实践提供数据基础和参考依据。

一、数据集信息

本次实验采用自制蔬菜分类数据集,按照深度学习训练标准进行划分,具体构成如下:

  • 训练集:3078 张
  • 验证集:764 张
  • 测试集:186 张

数据集覆盖常见蔬菜类别,样本具备一定的场景多样性,可直接用于模型训练、微调及性能测试,整体规模适合快速迭代实验与 baseline 构建。

二、训练模型信息

基于上述蔬菜分类数据集,分别使用五个版本 YOLO 模型完成完整训练流程,并记录训练过程与指标变化:

  1. YOLO v5
  2. YOLO v8
  3. YOLO v11
  4. YOLO v12
  5. YOLO v26

训练过程中均保留损失曲线、精度曲线、召回率等关键指标结果,可直观对比不同版本模型在该蔬菜数据集上的收敛速度、检测精度与训练稳定性差异。

三、总结

本文提供了一份划分规范、规模适中的蔬菜分类数据集,并基于该数据集完成 YOLO v5、v8、v11、v12、v26 五个版本模型的训练与对比。实验结果可用于分析不同 YOLO 版本在蔬菜识别任务上的表现,为后续模型选型、参数调优以及实际部署提供可靠参考。该数据集与训练成果也可作为相关方向的基础实验资源,助力智慧农业相关视觉任务的快速开展。

您可能感兴趣的与本文相关的镜像

CLIP-GmP-ViT-L-14编码模型

CLIP-GmP-ViT-L-14编码模型

图像识别
CLIP

CLIP-GmP-ViT-L-14编码模型` 是一个图文双塔编码模型,适合做图文匹配、零样本分类和跨模态检索演示。本镜像已经完成 Web 部署,打开页面即可上传图片并测试图文表征能力

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值