清华团队开源 GUAVA:0.1 秒由照片生成 3D 数字人
清华深研院与国际数字经济研究院的中国团队近日推出了名为 GUAVA 的新技术。通过仅一张照片,GUAVA 能够在0.1秒内生成一个高质量的3D 高斯化身,并实时驱动,画面流畅度超过50帧每秒。
传统上,创建高质量的3D 数字人需要复杂的多视角拍摄,或者耗时耗力的视频数据训练,往往需要几个小时才能完成。与其他方法相比,GUAVA 的重建速度可谓惊人,所需时间仅为0.1秒,而其他算法如 ExAvatar 需要2.4小时,GaussianAvatar 需1.3小时,甚至 GART 也需7分钟。
GUAVA 的优越表现得益于其创新的技术架构,主要包含两个关键组件:EHM 模型和3D 高斯泼溅。EHM 模型通过结合 SMPLX 和 FLAME 技术,确保了人脸表情的高保真度和精准控制,而3D 高斯泼溅则通过将场景拆分为数百万个3D 高斯球体,从而实现快速渲染。这种方法使得 GUAVA 在身份一致性上也表现出色,相关指标超过了竞争对手的水平。
在实际应用方面,GUAVA 能够为自媒体、直播、电子商务和教育等多个领域提供强大的支持。自媒体用户可以通过一张图片迅速创建可定制的角色,极大缩短了制作周期;直播主播可以轻松上传自拍,快速转换为虚拟形象;电商平台则可以实现千人千面的虚拟模特;教育行业也可利用虚拟教师进行沉浸式教学。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Audivis Relay —— 麦克风远程串流工具
Audivis Relay 是一款轻量级的麦克风串流软件,能够将物理麦克风的音频实时传输到虚拟麦克风设备,适用于远程会议、直播、语音聊天等场景。 核心特性 超低延迟音频传输 端到端加密保护隐私 即插即用,无需复杂配置 跨平台麦克风传输,支持 Android/Linux/Mac 到 Windows 即插即用设计,生成连接地址即可快速配置 创建虚拟麦克风设备,兼容所有 Windows 音频应用 基于网页连接,无需在发送端安装额外软件
-
下一篇
Google Veo 3 支持生成竖屏 AI 视频,提升分辨率并降低价格
Google为其AI视频生成器Veo 3带来了1080p高清分辨率和竖屏格式(9:16)支持。这项升级不仅适用于标准版Veo 3,也适用于Veo 3 Fast——后者是一款速度更快、价格更低、但生成质量略逊的AI视频模型。 开发者现可通过在API请求中设置aspectRatio参数为9:16,从而生成更适用于移动设备和社交媒体平台的竖屏短视频。同时,16:9宽屏视频的分辨率上限也从之前的720p提升至1080p(竖屏1080p目前暂不支持)。 Google还宣布Veo 3和Veo 3 Fast已在Gemini API中达到“稳定且可规模化生产”的水平,并大幅下调了视频生成费用:Veo 3价格从每秒0.75美元降至0.40美元,Veo 3 Fast则由每秒0.40美元降低到0.15美元。 值得一提的是,早在今年6月,Google就宣布Veo 3将很快支持YouTube Shorts平台。此次开放竖屏API意味着,未来在TikTok、Instagram Reels等主流竖屏视频平台上,将会涌现更多由Veo 3驱动生成的AI内容。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- MySQL数据库在高并发下的优化方案
- SpringBoot2全家桶,快速入门学习开发网站教程
- CentOS8编译安装MySQL8.0.19
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- MySQL8.0.19开启GTID主从同步CentOS8
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Docker容器配置,解决镜像无法拉取问题