阿里发布肖像视频生成框架 EMO-低调大师

阿里发布肖像视频生成框架 EMO

2024-02-29 434

来自阿里巴巴的团队发布了音频驱动的肖像视频生成框架 EMO（Emote Portrait Alive），相关论文同步发表于 arXiv。

https://arxiv.org/pdf/2402.17485.pdf

输入一张参考图像和声音音频，该框架能够生成具有丰富面部表情和头部姿势的声音肖像视频。

EMO的工作过程分为两个主要阶段：首先，利用参考网络（ReferenceNet）从参考图像和动作帧中提取特征；然后，利用预训练的音频编码器处理声音并嵌入，再结合多帧噪声和面部区域掩码来生成视频。该框架还融合了两种注意机制和时间模块，以确保视频中角色身份的一致性和动作的自然流畅。

这个过程相当于，AI先看一下照片，然后打开声音，再随着声音一张一张地画出视频中每一帧变化的图像。

EMO的技术报告中称：实验结果表明，EMO不仅能够产生令人信服的说话视频，还能生成各种风格的歌唱视频，显著优于现有的先进方法，如DreamTalk、Wav2Lip和SadTalker，无论是在表现力还是真实感方面。

目前，研究团队认为该模型的潜在应用方向将集中在：提高数字媒体和虚拟内容生成技术水平，特别是在需要高度真实感和表现力的场景中。

然而在另一些人看来，EMO模型却很可能成为别有用心的人手中的犯罪工具。

微信关注我们

原文链接：https://www.oschina.net/news/280842

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

海光成立 HygonArch SIG ，提供优秀“芯魂”系统和解决方案

近日，经openKylin社区技术委员会审议通过，HygonArch SIG正式成立。 HygonArch SIG由社区理事单位海光信息技术股份有限公司发起成立，致力于构建C86软件生态体系，多层次满足社区开发者以及用户的业务场景。 01SIG目标 HygonArch SIG将围绕海光处理器的指令集优势，海光内嵌异构安全处理器的安全技术，以及海光C86上层软件应用技术，结合openKylin社区已有生态，建设更完善的openKylin OS芯片生态，推进国内芯片先进技术发展。 02SIG职责及规划 1、创建并维护HygonArch SIG 维护社区内核/硬件/架构/驱动的工作建设；提供关于海光芯片以及DCU芯片的安全、驱动、特性的兼容适配和测试； 2、为基于openKylin OS的X86版本提供硬件适配和支持携手社区完成关于海光芯片及新品的适配，优化等；在社区发行版推广过程中提供关于海光芯片的特性支持和技术优化支持等； 3、关于社区芯片生态建设方面助力社区在内核架构以及芯片上层主流软件应用方面的推广；助力社区在海光芯片（CPU+DCU）上，进行第三方测试认证以及三方兼容...

2024-02-29

384

今日，消息称禾赛科技激光雷达因没处理闰年时间戳，导致固件 Bug，致使凡是用了禾赛激光雷达的车，自动驾驶功能全部歇菜。对此，新浪科技向禾赛科技方面确认，该公司回应称，“有2个老款L4机械式激光雷达今天出现了软件bug，问题原因已经找到，我们也跟相关客户都做了深入沟通、并提供了相关解决方案。” 据禾赛科技方面表示，“预计该问题会在24小时内彻底解决，此问题不涉及AT128、不影响OEM客户，对路上跑的所有搭载AT128的乘用车都无影响。” 常见的错误认知 1、一年总是365天 2、2月总是28天 3、闰年是每四年一次哪里容易出闰年相关的Bug 1、在一个日期值上加或减时间的代码。尤其是加减1年或1个月的代码 2、各种根据数据库查询结果生成的报表和图标，月度和年度统计可能会少算1天 3、证书/密码/密钥/缓存等的过期时间，可能会比预期的早了一天，或者可能设定了一个非法的过期时间 4、固定长度的数组。例如，一个长度为365的数组遇到闰年可能就不够了，可能会数组越界。 5、UI组件，例如日历、日期选择组件，以及客户端输入校验相关的代码。

2024-02-29

428

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。