当前位置: 首页 > news >正文

DeepEP开源MoE模型分布式通信库

DeepEP 是由 DeepSeek 团队于 2025 年 1 月 15 日正式开源的。该库以 Apache 2.0 许可证发布,代码完全开放,是全球首个专注于优化 MoE(Mixture-of-Experts)模型分布式通信的高性能库。

🔍 开源详情概览:

项目 详情
开源日期 2025 年 1 月 15 日
开源平台 GitHub
开源模式 完全开放源代码(Apache 2.0 许可)
首次公开版本 DeepEP v0.1.0

🚀 开源后进展:

· 2025 年 3 月:推出 v0.4.0,新增对 FP8 低精度计算支持和 Hopper 架构(H100/NVIDIA H800)优化;

· 2025 年 5 月:发布 v0.8.0,大幅提升 推理端到端效率、RDMA 通信性能,开始支持 多节点大规模集群训练;

· 当前最新版本(2025年6月):DeepEP v0.9.1,提供更多文档、教程及配套工具链。

⭐ 社区反响亮眼:

· 开源首日 Star 数突破 6000

· 被广泛评价为 2025 年全球增长最快的大模型基础设施开源项目之一
👉 已在阿里巴巴、商汤、智谱等多个科技公司部署使用中

💎 为什么值得关注?

DeepEP 在 国产AI框架生态发展 中扮演关键角色,通过突破:

· MoE 通信瓶颈(尤其在分布式场景)

· 打破A100计算卡封锁限制的软件层优化方案

赋能国产算力与大模型训练自主可控 🚀

http://www.lqws.cn/news/463735.html

相关文章:

  • Linux运维新人自用笔记(Ubuntu磁盘命名规则、新磁盘分区、主流文件系统类型、mkfs命令格式化文件系统、临时和永久挂载、挂载报错、dd指令)
  • 2.7 Python方法调用机制解析:从描述符到字节码执行
  • 5.2 Qt Creator 使用FFmpeg库
  • win环境使用openssl创建p12证书
  • 微前端MFE:(React 与 Angular)框架之间的通信方式
  • word-spacing 属性
  • Kubernetes控制平面组件:Kubelet详解(八):容器存储接口 CSI
  • C++链表的虚拟头节点
  • 课程目录:腾讯混元3D × Unity3D全流程开发
  • Python pytesseract【OCR引擎库】 简介
  • 【JVM|内存结构】第一天
  • 【论文笔记】【强化微调】TinyLLaVA-Video-R1:小参数模型也能视频推理
  • Spring-MyBatis基本操作
  • linux weston flutter remote desktop
  • 2025年- H83-Lc191--139.单词拆分(动态规划)--Java版
  • JF - 600MT称重变送器与Modbus TCP转Profibus DP网关通讯案例
  • MCPServer编程与CLINE配置调用MCP
  • 项目练习:Jaspersoft Studio制作PDF报表时,detail和column footer之间存在很大的空白区
  • SkyWalking探针技术监控Spring Boot微服务——部署与应用详解
  • Laravel 项目中图片上传后无法访问的问题
  • 进程间通信——管道
  • 【Qt开发】网络运用
  • “氢键本征型材料 + 柔性电容应变片”方案分析
  • NW849NX721美光固态闪存NX745NX751
  • C++中的指针与引用
  • ProtoBuf:proto3 语法详解
  • 三甲医院AI医疗样本数据集分类与收集全流程节点分析(下)
  • 【appium】2.初始连接脚本配置
  • React扩展知识点
  • 使用Node.js开发服务端接口