阿里发布开源数字人框架 Mnn3dAvatar
阿里开源了名为「Mnn3dAvatar」的数字人框架,项目可以做到实时面捕然后映射到3D虚拟角色脸上(注意不是Live2D的,是3D的),甚至还能帮助创建一个3D虚拟角色。
https://github.com/alibaba/MNN/blob/master/apps/Android/Mnn3dAvatar/README.md
据介绍,Mnn3dAvatar 是基于自研 3D 高斯溅射技术的 3D 数字人实时面捕方案,通过 AI 驱动实现高精度面部动作捕捉与实时渲染,支持语音、表情、手势等多模态驱动,可在手机、AR 设备等终端以90FPS 帧率流畅运行。
其核心优势在于将影视级数字人效果落地到消费级硬件,仅需普通手机摄像头即可替代传统动捕设备,显著降低直播场景的部署门槛与成本,制作周期缩短至一周内,成本仅为传统 CG 方案的 1/30。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Meta 发布强化学习框架 LlamaRL
Meta 发布了 LlamaRL 强化学习框架,基于 PyTorch 构建全异步分布式架构,通过独立执行器并行处理生成、训练和评分任务,并整合 DDMA 和 NVLink 技术实现高效数据传输。 实测显示,该框架在 4050 亿参数模型中,将强化学习步骤耗时从 635.8 秒缩减至 59.5 秒,效率提升 10.7 倍,80 亿、700 亿参数模型训练时间分别缩短至 8.90 秒、20.67 秒。其突破内存瓶颈与 GPU 利用率难题,同时在 MATH 和 GSM8K 等标准测试中模型表现稳定甚至增强,为未来更大规模模型训练提供可扩展解决方案。 论文地址:https://arxiv.org/abs/2505.24034
- 下一篇
Hugging Face 发布 ScreenSuite:开源 GUI 智能体评测套件
Hugging Face开源了专用于评估 GUI 智能体的综合测试套件ScreenSuite。 什么是 GUI Agent?简单说,就是“能像人一样操作屏幕”的 AI!它能识别界面内容、点击按钮、输入文字、滚动页面……实现真实的“虚拟助手”体验。 现在,Hugging Face 推出了全新的开源工具 ScreenSuite,帮助开发者和研究者评估这类视觉语言模型的实际操作能力! ScreenSuite 能做什么? 它整合了 13 个评测集,覆盖: 屏幕感知与 UI 定位 单步操作指令执行 多步骤任务规划与完成 ScreenSuite 已在多个主流 VLM 上完成评测,包括: Qwen2.5-VL 系列(3B~72B) UI-TARS、Holo1 等优秀开源模型 GPT-4o 等闭源模型 ScreenSuite 支持 Ubuntu、Android、Windows 多平台评测,结合虚拟机环境还原真实交互场景,适用于科研评估与模型迭代。与其他评测不同的是,ScreenSuite 完全基于视觉输入,不依赖 DOM 或辅助树,更贴近人类的使用方式,挑战也更真实。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Hadoop3单机部署,实现最简伪集群
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Windows10,CentOS7,CentOS8安装Nodejs环境
- CentOS7安装Docker,走上虚拟化容器引擎之路