学习经验分享【41】YOLOv13:基于超图增强自适应视觉感知的实时目标检测
YOLO算法更新速度很快,已经出到V13版本,后续大家有想发论文或者搞项目可更新自己的baseline了。
摘要:YOLO 系列模型凭借其卓越的精度和计算效率,在实时目标检测领域占据主导地位。然而,YOLOv11 及早期版本的卷积架构,以及 YOLOv12 中引入的基于区域的自注意力机制,均局限于局部信息聚合和成对关联建模,缺乏捕捉全局多对多高阶相关性的能力,这限制了其在复杂场景下的检测性能。本文提出了一种精确且轻量级的目标检测器 ——YOLOv13。为应对上述挑战,我们提出了基于超图的自适应关联增强(Hypergraph-based Adaptive Correlation Enhancement, HyperACE)机制,该机制通过超图计算自适应挖掘潜在高阶相关性,突破了以往方法仅基于成对关联建模的限制,实现了高效的全局跨位置和跨尺度特征融合与增强。随后,我们基于 HyperACE 提出了全流程聚合 - 分发(Full-Pipeline Aggregation-and-Distribution, FullPAD)范式,通过将关联增强后的特征分发至全流程,有效实现了整个网络内的细粒度信息流和表示协同。最后,我们采用深度可分离卷积替代传统大核卷积,并设计了一系列在不牺牲性能的前提下显著减少参数量和计算复杂度的模块。我们在广泛使用的 MS COCO 基准测试上进行了大量实验,结果表明,我们的方法以更少的参数和 FLOPs 达到了当前最优性能。具体而言,与 YOLOv11-N 相比,YOLOv13-N 的平均精度均值(mAP)提升了 3.0%;与 YOLOv12-N 相比,提升了 1.5%。