当前位置: 首页 > news >正文

【Datawhale组队学习202506】YOLO-Master task04 YOLO典型网络模块

系列文章目录


文章目录

  • 系列文章目录
  • 前言
  • 4.1 DFL 模块
    • 4.1.1 DFL的核心思想
  • 4.2 SPP 模块
    • 4.2.1 核心思想
  • 4.3 SPPF 模块
    • 4.3.1 核心思想
  • 总结


前言

  • Datawhale是一个专注于AI与数据科学的开源组织,汇集了众多领域院校和知名企业的优秀学习者,聚合了一群有开源精神和探索精神的团队成员
  • YOLO-Master
  • 本章学习资料

4.1 DFL 模块

Distribution Focal Loss 是YOLO系列在边界框回归中引入的创新模块,源自《Generalized focal loss: learning qualified and distributed bounding boxes for dense object detection》论文的核心思想。

4.1.1 DFL的核心思想

DFL的核心思想是将边界框坐标预测 转化为概率分布估计问题 ,而非传统的直接回归坐标值。

  • 具体而言:
    • 传统方法 :直接回归边界框的坐标(如左上角和右下角的坐标),使用 L 1 / L 2 L1/L2 L1/L2损失。
    • DFL方法
      1. 将每个坐标值建模为一个离散的概率分布 ,假设坐标可能的取值范围被划分为 N N N个区间(如 N = 16 N=16 N=16),模型预测每个区间成为真实坐标值的概率;
      2. 再计算最终坐标值通过加权求和得到:坐标 = Σ(概率 * 区间位置);

4.2 SPP 模块

Spatial Pyramid Poling 模块是YOLO系列中用于多尺度特征融合的核心组件,灵感来源于2014年何凯明团队提出的空间金字塔池化思想论文《Spatial Pyramid Pooling in Deep Convolutional Networks for Visual Recognition》。

  • 它通过并行多尺度池化操作,显著提升模型对不同尺寸目标的感知能力。

4.2.1 核心思想

多尺度特征融合,通过 多尺度池化操作 (Multi-level Pooling)提取不同感受野的特征,并将这些特征进行融合,从而增强模型对目标尺度变化的鲁棒性。

  • 所有池化操作采用stride=1padding=kernel_size//2,而非动态调整,确保输出特征图尺寸与输入一致,便于后续拼接。
  • 通过 1 × 1 1\times1 1×1 卷积压缩通道数(降维),减少计算量,再在池化后扩展通道(升维),平衡效率与性能。

4.3 SPPF 模块

Spatial Pyramid Pooling-Fast,是 YOLOv5 针对传统 SPP 模块的轻量化改进版本,通过串联重复池化实现多尺度特征融合。

4.3.1 核心思想

用更少的计算量,实现等效的多尺度感受野。

  • 串联池化替代并行池化:上面 SPP 使用多个不同尺寸的池化核(如 5 × 5 5\times5 5×5 、 、 9 × 9 9\times9 9×9 、 、 13 × 13 13\times13 13×13并行处理特征图,而 SPPF 通过连续三次串联应用 5 × 5 5 \times 5 5×5 池化,利用叠加效应等效覆盖更大的感受野

总结

  • 拆解介绍一些YOLO中的典型网络模块。
http://www.lqws.cn/news/504631.html

相关文章:

  • 桥头守望者
  • 《前端资源守卫者:SRI安全防护全解析》
  • LangChain4j之会话功能AiServices工具类的使用(系列二)
  • 【WCF】单例模式的线程安全缓存管理器实现,给你的WebApi加入缓存吧
  • 【DeepSeek实战】3、Ollama实战指南:LobeChat+多网关架构打造高可用大模型集群
  • 数据赋能(319)——安全与合规——数据安全可控
  • 吉林大学软件工程期末复习整理
  • 基于大模型预测的化脓性阑尾炎诊疗方案研究报告
  • MSTP技术解析:提升网络负载均衡
  • 解决移动端播放MP4黑屏问题,PC端正常的问题
  • 华为云对象存储OBS 支持安卓/iOS/鸿蒙UTS组件
  • Android15启动icon界面的背景图颜色
  • contOS7安装docker命令及yum源更换为国内源
  • 使用 .NET Core+GcExcel,生成 Excel 文件
  • AWS S3 可观测性最佳实践
  • Sentinel(三):Sentinel熔断降级
  • python的轻院网购商城管理系统
  • 【Bugku】简单取证1
  • 深度洞察丨2025零信任应对挑战,拥抱变革,开启智能安全新时代
  • 技术伦理之争:OpenAI陷抄袭风波,法院强制下架宣传视频
  • 入门k8s-Pod
  • k8s强制删除podpvpvc和nsnamespace
  • 《陈欣与链接器的黄昏》
  • 华为云Flexus+DeepSeek征文|体验华为云ModelArts快速搭建Dify-LLM应用开发平台并创建小红书爆款文案大模型
  • 软件工程:从理论到实践,构建可靠软件的艺术与科学
  • python有哪些常用的GUI(图形用户界面)库及选择指南
  • 通义灵码编程智能体深度评测(Qwen3模型+终端操作+MCP工具调用实战)
  • STM32 环境监测与控制系统的设计与实现
  • 认识Scikit-learn/PyTorch/TensorFlow这几个AI框架
  • 从代码学习深度学习 - 情感分析:使用循环神经网络 PyTorch版