当前位置: 首页 > news >正文

THUNDER:用“听回去”的方式让数字人说话更像真人

 

在虚拟数字人和AI交互日益普及的今天,如何让数字人的面部动作更加自然、真实,尤其是嘴型与语音高度同步,成为提升用户体验的关键。而来自马克斯·普朗克智能系统研究所(MPI-IS)的研究团队提出了一种全新思路 —— THUNDER,它不仅能根据语音生成高质量的3D面部动画,还能通过“听回去”机制不断自我校正,显著提升口型准确性。


一句话理解 THUNDER

传统方法是让数字人“听音频动嘴”,而 THUNDER 是让它“看嘴型反推音频”,再用这个音频来判断嘴型动得对不对,从而反过来提升口型准确度!


为什么这项技术很重要?

✅ 自动生成逼真口型动画

只需输入一段语音,THUNDER 即可自动生成自然流畅、情感丰富的3D面部动画。适用于虚拟主播、AI讲解员、数字替身等各类数字人应用场景。

✅ 提升口型同步精度

不同于以往模型只关注“嘴巴有没有动”,THUNDER 更注重“嘴巴动得对不对”。它通过重建语音并比对原始语音的方式,实时检测并纠正

http://www.lqws.cn/news/123427.html

相关文章:

  • 一个小小的 flask app, 几个小工具,拼凑一下
  • BERT:让AI真正“读懂”语言的革命
  • 【Unity】R3 CSharp 响应式编程 - 使用篇(集合)(三)
  • Vue + Element Plus 实战:大文件切片上传 + 断点续传
  • 华为设备OSPF配置与实战指南
  • 【vue3学习】vue3入门
  • MySQL 事务深度解析:面试核心知识点与实战
  • 运维实施40-MGR高可用
  • Android 颜色百分比对照
  • 国产化Word处理控件Spire.Doc教程:Java实现HTML 转Word自动化
  • 四、函数调用包含单个参数之Double类型-mmword,movsd,mulsd,addsd指令,总结汇编的数据类型
  • 测试面试题总结一
  • Hive终极性能优化指南:从原理到实战
  • linux shell脚本硬件定时检测通过邮箱警告管理人员
  • c++提升
  • 【计算机网络】网络层协议
  • skynet monitor线程的作用
  • 【学习笔记】TCP 与 UDP
  • go语言学习 第4章:流程控制
  • FFmpeg avformat_open_input函数分析
  • 量化Quantization初步之--带量化(QAT)的XOR异或pyTorch版250501
  • Hadoop大数据集群深度实践:源码分析、参数调优与自动化运维平台选型全解
  • 从 CLIP 和 Qwen2.5-VL 入门多模态技术
  • Spine交换机和Leaf交换机
  • 解决idea编译运行项目时间长的问题
  • ideal2022.3.1版本编译项目报java: OutOfMemoryError: insufficient memory
  • spel 多层list嵌套表达式踩坑记
  • 智能进化论:AI必须跨越的四大认知鸿沟
  • 【Python实战】零基础实战教程(三) 变量与数据类型
  • 《IDEA 高效开发:自定义类/方法注释模板详解》