阿里发布肖像视频生成框架 EMO
来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架 EMO(Emote Portrait Alive),相关论文同步发表于 arXiv。
输入一张参考图像和声音音频,该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。
EMO的工作过程分为两个主要阶段:首先,利用参考网络(ReferenceNet)从参考图像和动作帧中提取特征;然后,利用预训练的音频编码器处理声音并嵌入,再结合多帧噪声和面部区域掩码来生成视频。该框架还融合了两种注意机制和时间模块,以确保视频中角色身份的一致性和动作的自然流畅。
这个过程相当于,AI先看一下照片,然后打开声音,再随着声音一张一张地画出视频中每一帧变化的图像。
EMO的技术报告中称:实验结果表明,EMO不仅能够产生令人信服的说话视频,还能生成各种风格的歌唱视频,显著优于现有的先进方法,如DreamTalk、Wav2Lip和SadTalker,无论是在表现力还是真实感方面。
目前,研究团队认为该模型的潜在应用方向将集中在:提高数字媒体和虚拟内容生成技术水平,特别是在需要高度真实感和表现力的场景中。
然而在另一些人看来,EMO模型却很可能成为别有用心的人手中的犯罪工具。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
海光成立 HygonArch SIG ,提供优秀“芯魂”系统和解决方案
近日,经openKylin社区技术委员会审议通过,HygonArch SIG正式成立。 HygonArch SIG由社区理事单位海光信息技术股份有限公司发起成立,致力于构建C86软件生态体系,多层次满足社区开发者以及用户的业务场景。 01SIG目标 HygonArch SIG将围绕海光处理器的指令集优势,海光内嵌异构安全处理器的安全技术,以及海光C86上层软件应用技术,结合openKylin社区已有生态,建设更完善的openKylin OS芯片生态,推进国内芯片先进技术发展。 02SIG职责及规划 1、创建并维护HygonArch SIG 维护社区内核/硬件/架构/驱动的工作建设; 提供关于海光芯片以及DCU芯片的安全、驱动、特性的兼容适配和测试; 2、为基于openKylin OS的X86版本提供硬件适配和支持 携手社区完成关于海光芯片及新品的适配,优化等; 在社区发行版推广过程中提供关于海光芯片的特性支持和技术优化支持等; 3、关于社区芯片生态建设方面 助力社区在内核架构以及芯片上层主流软件应用方面的推广; 助力社区在海光芯片(CPU+DCU)上,进行第三方测试认证以及三方兼容...
- 下一篇
禾赛科技激光雷达因没处理闰年时间戳,导致自动驾驶故障
今日,消息称禾赛科技激光雷达因没处理闰年时间戳,导致固件 Bug,致使凡是用了禾赛激光雷达的车,自动驾驶功能全部歇菜。 对此,新浪科技向禾赛科技方面确认,该公司回应称,“有2个老款L4机械式激光雷达今天出现了软件bug,问题原因已经找到,我们也跟相关客户都做了深入沟通、并提供了相关解决方案。” 据禾赛科技方面表示,“预计该问题会在24小时内彻底解决,此问题不涉及AT128、不影响OEM客户,对路上跑的所有搭载AT128的乘用车都无影响。” 常见的错误认知 1、 一年总是365天 2、2月总是28天 3、闰年是每四年一次 哪里容易出闰年相关的Bug 1、在一个日期值上加或减时间的代码。尤其是加减1年或1个月的代码 2、各种根据数据库查询结果生成的报表和图标,月度和年度统计可能会少算1天 3、证书/密码/密钥/缓存 等的过期时间,可能会比预期的早了一天,或者可能设定了一个非法的过期时间 4、固定长度的数组。例如,一个长度为365的数组遇到闰年可能就不够了,可能会数组越界。 5、UI组件,例如日历、日期选择组件,以及客户端输入校验相关的代码。
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS6,CentOS7官方镜像安装Oracle11G
- Docker安装Oracle12C,快速搭建Oracle学习环境
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8编译安装MySQL8.0.19
- CentOS关闭SELinux安全模块
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题