蚂蚁集团开源 EchoMimic:支持为人像照片对口型、生成肖像动画视频
蚂蚁集团发布了开源项目 EchoMimic。据介绍,EchoMimic 不仅能根据人像面部特征和音频来帮人物对口型,还可以结合面部标志点和音频内容生成较为稳定、自然的视频。
EchoMimic 具备较高的稳定性和自然度,通过融合音频和面部标志点(面部关键特征和结构,通常位于眼、鼻、嘴等位置)的特征,可生成更符合真实面部运动和表情变化的视频。
其支持单独使用音频或面部标志点生成肖像视频,也支持将音频和人像照片相结合做出“对口型”一般的效果。
下图是 EchoMimic 的工作原理:
EchoMimic 支持多语言(包含中文普通话、英语)及多风格,也可应对唱歌等场景。
访问主页查看更多示例:https://badtobest.github.io/echomimic.html
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Facebook 开源 C++ 框架 Ocean:用于计算机视觉和增强现实
Facebook 开源了其内部用于计算机视觉 (CV) 和 增强现实 (AR)应用程序的框架 Ocean,用于执行各种任务,包括计算机视觉、几何、媒体处理、网络和渲染。 Ocean 主要使用 C++ 编写,且不依赖于特定平台: Ocean 是一个独立于平台的框架,支持所有主要操作系统,包括 iOS、Android、Quest、macOS、Windows 和 Linux。它旨在彻底改变计算机视觉和混合现实应用程序的开发。 项目主页:https://facebookresearch.github.io/ocean/ 仓库地址:https://github.com/facebookresearch/ocean
- 下一篇
中国信通院发布算力互联公共服务平台
2024年7月11日,中国信息通信研究院(简称“中国信通院”)发布算力互联公共服务平台,联合产业界开展算力互联网共识共创行动。 平台现已开放测试,试用:http://stateioc.iqka.com/ 算力互联公共服务平台是推进和管理全国算力互联互通和算力互联网体系的综合服务平台,包括算力标识管理、算力互联网业务查询、算力统一大市场、政策和研究、标准体系、开源项目和运行监测等功能。 公共算力资源标识注册和查询:实现跨主体、跨架构、跨地域资源“可查询、可访问、可调用”,加速各个主体之间算力互联互通,前瞻布局算力互联网,助力全国一体化算力体系建设,促进算力服务普惠发展。 算力资源可信度量:平台可以对接入的算力资源进行真实性、可用性以及利用率度量,能提供全国范围内的算力资源提供商、算力(调度)服务商的可信资源和服务查询,提高供需匹配效率,实现统一算力服务大市场。 推动算力互联网发展进程:促进新业务、新业态的算力服务发展。未来,中国信通院将持续完善平台服务能力,统筹各级算力互联互通平台遵循平台标准规范开展工作,打通各类算力互联网已有实践体系,助力全国一体化算力体系。 同时,中国信通院联合中...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS7设置SWAP分区,小内存服务器的救世主
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS8安装Docker,最新的服务器搭配容器使用
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- Hadoop3单机部署,实现最简伪集群
- Mario游戏-低调大师作品
- SpringBoot2初体验,简单认识spring boot2并且搭建基础工程
- Red5直播服务器,属于Java语言的直播服务器