当前位置: 首页 > news >正文

最新发布 | “龙跃”(MindLoongGPT)大模型正式发布!龙跃而起,推动中国方案走向全球智能体前沿

在人工智能快速演进的今天,生成式大模型正成为推动技术变革的核心引擎。继语言、图像、视频等领域实现突破之后,下一阶段的技术焦点,正加速向“具身智能”迁移。具身智能强调智能体对物理世界的感知、理解与互动能力,是实现通用人工智能的关键路径。作为其中的重要分支,人形机器人承载着人工智能在现实世界中落地的希望。

在此背景下,2025年5月,复旦大学联合国家地方共建人形机器人创新中心(以下简称“国地中心”),正式发布全球首款生成式人形机器人运动大模型—— “龙跃”(MindLoongGPT)。

MindLoongGPT开发者测试版本已正式在 OpenLoong 开源社区开放,欢迎点击跳转查阅仓库并参与使用与反馈。


“龙跃”MindLoongGPT:

生成式机器人运动大模型的重要突破

■ 从实验室到产业应用,重新定义人机交互 

人形机器人如何像人类一样自然运动?如何通过语言指令让机器人理解并执行复杂动作?这一直是行业亟待突破的技术瓶颈。国地中心联合复旦大学未来信息创新学院研发的“龙跃”MindLoongGPT大模型,以“自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环。  

■ 四大核心技术优势,引领行业标杆

1. 多模态交互,低门槛驱动

MindLoongGPT支持文本、语音、图像等多模态输入,用户只需说出“挥手致意”或上传一段参考视频,模型即可自动解析语义并生成连贯动作。传统方法依赖专业参数调整的桎梏被打破,真正实现“人人可用”。  

2. 拟真度与时序一致性双突破  

通过将人体动作视为“时序语言”,MindLoongGPT对动作序列逐帧建模,精准捕捉动作间的连续性,解决了长序列生成中的僵硬、跳跃问题。生成的跑步、舞蹈等动作不仅流畅自然,更保留真实人体的惯性节奏。

3. 结构生成与细节优化并重  

模型采用分阶段生成策略,从全局姿态到局部关节角度均实现高精准的控制。无论是手指微操还是全身腾跃,细节表现力媲美真人。

4. 轻量化设计,赋能广泛场景  

在保证性能的前提下,MindLoongGPT模型体积压缩至同类型产品的1/3,可在教育机器人、智能穿戴设备等嵌入式平台实时运行,为产业落地铺平道路。  

MindLoongGPT的差异化竞争力:为什么它是“不可替代”的?

■ 技术为骨,应用为翼,打造全链条解决方案

当前市场中的动作生成模型往往存在两大痛点:一是依赖高算力硬件,难以低成本部署;二是生成结果机械呆板,缺乏可控性。

MindLoongGPT通过三大创新设计,构建了独特的市场护城河:  

1. 自然语言驱动,开启交互新范式

用户无需学习专业术语或操作复杂软件,仅需像与人类对话一样发出指令,例如“以优雅的姿势递上一杯咖啡”,MindLoongGPT即可结合语义理解生成对应动作,并支持通过追加指令实时调整细节。

图片

语音到文本的转化

2. 生成+编辑双模式,满足定制化需求  

MindLoongGPT不仅支持一键生成动作,还开放了风格、节奏、速度等参数接口。企业用户可基于生成的初始动作进行二次创作,例如将“步行”调整为“卡通蹦跳”或“机械步态”,极大拓展了模型的适用场景。

图片

图片

动作生成

3. 全链条部署方案,打通最后一公里  

从动作生成到实机部署,MindLoongGPT提供完整的工具链支持——

模型重定向技术:通过优化的retarget算法,实现人体模型与不同机器人URDF结构的快速适配,解决硬件异构难题;

图片

图片

模型重定向

上位控制软件集成:支持主流机器人操作系统(ROS、V-REP等),生成动作可直接导入实机测试,部署效率提升80%。

图片

图片

图片

动作部署

4. 大模型与小模型联合,高效实现各种复杂动作与舞蹈特技:

“龙跃”MindLoongGPT具有7B的模型参数大小,支持text2motion, motion2text, motion2motion多任务,生成更丰富的动作。

通过“龙跃” MindLoongGPT 生成特技动作运动轨迹,作为部署的全身跟踪小模型的输入目标观测,从而可以在青龙上实现丰富的全身动作。

图片

图片

 "龙跃"大模型已经发布:共建开放生态

MindLoongGPT开发者测试版本已正式在OpenLoong开源社区开放,欢迎查阅GitHub仓库并参与使用与反馈。

作为全球首个生成式人形机器人通用大模型,MindLoongGPT的发布不仅是一项技术成果,更是国地中心技术攻坚的里程碑式进展,标志着我国在“生成式AI+具身智能”交叉融合方向实现新的突破。

🔍 此次开源的开发者版本,意味着MindLoongGPT 的能力已具备对外服务基础,为更广泛的技术开发与场景应用创造条件。其核心意义体现在三个方面:

重塑人机协作生态,降低机器人开发门槛:开发者无需具备复杂的运动控制背景,即可通过自然语言指令实现机器人全身动作生成,中小型企业乃至个人开发者都可以基于MindLoongGPT快速构建具身交互应用;

赋能多元场景,推动产业智能化转型:高适配性的动作生成能力使MindLoongGPT可广泛应用于家庭陪护、医疗康复、工业柔性装配等新兴领域,加速人形机器人进入实际应用体系;

抢占国际技术制高点,构建“中国方案”:作为我国在生成式AI与人形机器人深度融合方向的首次系统性技术突破,MindLoongGPT为全球智能体技术发展提供了“中国路径”,展现了我国在AGI演进中的原创力与引领力。

📂 GitHub仓库地址及开发文档请访问OpenLoong 开源社区官网获取,诚邀更多开发者加入生态共建,共同推动具身智能的发展进程。


"OpenLoong" 是全球领先的人形机器人开源社区,秉承技术驱动与开放透明的价值观,致力于汇聚全球开发者推动人形机器人产业发展。由国家地方共建人形机器人创新中心发起的 OpenLoong 项目,是业内首个全栈、全尺寸的开源人形机器人项目,有着人人都可以打造属于自己的机器人的美好愿景,旨在推动人形机器人全场景应用、助力具身智能时代的到来。

欢迎加入 OpenLoong 开源社区,探索人形机器人技术,共享创新成果,在这里一起见证开源的力量!

http://www.lqws.cn/news/494857.html

相关文章:

  • 【达梦数据库】忘记SYSDBA密码处理方法-已适配
  • 电路图识图基础知识-塔式起重机控制电路识图与操作要点(三十五)
  • Flink中的反压与背压:原理、检测与应对
  • WebSocket 进阶全攻略:心跳机制、断线重连、socket.io、鉴权与WSS配置
  • 实现 el-table 中键盘方向键导航功能vue2+vue3(类似 Excel)
  • Flux Reconstruction(FR,通量重构)方法
  • GO 语言学习 之 代码风格
  • Java面试复习指南:并发编程、JVM原理与Spring框架
  • RAG-Anything:打破边界的一体化多模态文档处理引擎
  • Recent Advances in Speech Language Models: A Survey
  • 全局配置Axios后的api使用指南
  • 纯血HarmonyOS5 打造小游戏实践:扫雷(附源文件)
  • 从0开始学习R语言--Day30--函数型分析
  • Unity | AmplifyShaderEditor插件基础(第十集:噪声的种类+火焰制作-中)
  • 如何将进度传给前端呢
  • UI设计 | 审美积累 | 极繁风格(Maximalism / Complex UI)
  • 左神算法之给定一个数组arr,返回其中的数值的差值等于k的子数组有多少个
  • leetcode题解77:组合(回溯算法的门面)
  • STM32 串口通信②:蓝牙模块HC-05控制单片机
  • python常用的正则表达式及作用
  • 编程江湖-正则表达式
  • vue3 el-table row-class-name 行字体颜色失效
  • Spring Cloud微服务
  • MM-AttacKG:一种使用大型语言模型构建攻击图的多模态方法
  • GitLab 17.8 备份秘籍:快速获取纯 Git 仓库与核心配置
  • 兆瓦闪充技术革命:解码新能源汽车补能赛道的技术跃迁与从业机会图谱
  • 60天python训练计划----day56
  • 左神算法之二叉树的个数
  • 数据标注师学习内容
  • Domain 层完全指南(面向 iOS 开发者)