英伟达开源生成式 AI 面部动画模型 Audio2Face-低调大师

英伟达开源生成式 AI 面部动画模型 Audio2Face

2025-09-25 134

英伟达宣布开源生成式AI面部动画模型Audio2Face，此次开源内容不仅包含模型本身，还涵盖软件开发工具包（SDK）及完整训练框架，让所有游戏和3D应用开发者都可以构建并部署带有先进动画的高精度角色。

据介绍，任何人都可以使用Audio2Face的训练框架针对特定用例对现有模型进行微调与定制。

Audio2Face利用AI根据音频输入生成逼真的面部动画。这项技术通过分析音素、语调等声学特征，创建动画数据流，并映射至角色的面部表情。这些动画数据既可用于离线渲染预设的资产，也可实时传输到动态的、由AI驱动的角色，实现准确的嘴形同步与情感表达。

在运行模式方面，Audio2Face展现出高度的灵活性，支持两种核心运行方式。其一为预录制音频的离线渲染模式，适用于对动画精度要求高、无需实时反馈的场景，如影视动画制作；其二是动态AI角色的实时流式处理模式，能够满足游戏、实时互动虚拟客服等对响应速度要求严苛的场景，确保虚拟角色在与用户交互过程中，面部动画始终保持实时、自然的状态。

微信关注我们

原文链接：https://www.oschina.net/news/374423/nvidia-open-sources-audio2face-animation-model

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

京东公布机器人控制方法相关专利

爱企查 App 显示，京东科技信息技术有限公司于近日公布了“机器人控制方法、系统、设备、计算机可读介质和产品”专利。摘要内容指出，本公开的实施例公开了机器人控制方法、系统、设备、计算机可读介质和产品。该方法的一具体实施方式包括：接收通信连接的机器人发送的图像数据流；根据上述图像数据流，生成重编码图像数据流；将上述重编码图像数据流发送至通信连接的头戴显示设备，以供上述头戴显示设备显示；接收上述头戴显示设备发送的位姿数据；根据上述位姿数据，生成对应上述机器人的控制量信息；将上述控制量信息发送至上述机器人，以供上述机器人控制进行运动。该实施方式与智能机器人有关，简化了设备，降低了设备成本和设备维度复杂度，提高了操作灵活性和精度，能够支持复杂操作，且提高了沉浸式体验效果。

2025-09-25

121

月之暗面 Kimi 宣布推出全新 Agent 模式“OK Computer”，并开启灰度测试。 “在过去两年的成长过程中曾经给予 Kimi 打赏鼓励的用户将优先获得体验席位 —— 打开网页版 Kimi（kimi.com）就可以收到试用邀请。” 据官方介绍，“OK Computer”延续“模型即 Agent”理念，基于今年 7 月发布的万亿参数 MoE 架构模型 Kimi K2，通过端到端训练显著增强智能体自主性与工具调用能力。具体来说，启用 OK Computer 后，用户只需下达指令，系统即可在虚拟环境中自主完成多功能网站开发、海量数据分析、图像视频生成及高质量 PPT 制作等任务。

2025-09-25

157

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。