腾讯混元开源语音数字人模型 HunyuanVideo-Avatar-低调大师

腾讯混元开源语音数字人模型 HunyuanVideo-Avatar

2025-05-28 344

腾讯混元宣布开源语音数字人模型HunyuanVideo-Avatar，由腾讯混元视频大模型（HunyuanVideo）及腾讯音乐天琴实验室MuseV技术联合研发，支持头肩、半身与全身景别，以及多风格、多物种与双人场景，面向视频创作者提供高一致性、高动态性的视频生成能力。

用户可上传人物图像与音频，HunyuanVideo-Avatar模型会自动理解图片与音频，比如人物所在环境、音频所蕴含的情感等，让图中人物自然地说话或唱歌，生成包含自然表情、唇形同步及全身动作的视频。

HunyuanVideo-Avatar适用于短视频创作、电商与广告等多种应用场景，可以生成人物在不同场景下的说话、对话、表演等片段，快速制作产品介绍视频或多人互动广告，降低制作成本。目前，该技术已应用于腾讯音乐听歌陪伴、长音频播客以及唱歌MV等多场景。

除驱动人物图像外，HunyuanVideo-Avatar 还能在此基础上保证视频中主体一致性以及视频的整体动态性。用户可以上传复杂人物图像并上传匹配音频。

公告称，在主体一致性、音画同步方面，HunyuanVideo-Avatar效果超越开闭源方案，处在业内顶尖水平；在画面动态、肢体自然度方面，效果超越开源方案，和其他闭源方案处在同一水平。

相比传统工具仅限于头部驱动，HunyuanVideo-Avatar 还支持半身或全身场景，显著提升视频的真实感和表现力。同时，HunyuanVideo-Avatar 支持多风格、多物种与多人场景，包括赛博朋克、2D动漫、中国水墨画，以及机器人、动物等。例如，创作者可上传卡通角色或虚拟形象，生成风格化的动态视频，满足动漫、游戏等领域的创作需求。

体验入口：https://hunyuan.tencent.com/modelSquare/home/play?modelId=126

微信关注我们

原文链接：https://www.oschina.net/news/352279

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

启用 Java AOT 编译打包 Solon 项目（Solon AOT）

1、Java 的 AOT（Ahead-Of-Time） AOT（Ahead-Of-Time）编译是与 JIT（Just-In-Time）相对的一种编译方式。在 AOT 模式下，Java 字节码（Bytecode）在程序运行之前，就被提前编译为目标平台的本地机器代码。 2、Solon AOT Solon AOT 是 Java AOT 的增强模式。可借助容器在运行时收集相关的类信息，然后在打包时为有 “动态代理需求的类” 生成对应具体类（类名风格，Xxx$$SolonAotProxy.class）。使用条件要求：使用 solon-maven-plugin 打包方式要求 java 17+ （java 17 后才支持 AOT）大概的构建过程（过程为自动）：编译（生成 .class 文件） -> Solon AOT（运行->收集->生成补充的 .class 文件） -> 打包 3、使用 solon-parent <parent> <groupId>org.noear</groupId> <artifact...

2025-05-28

230

谷歌搜索正在其AI模式(AI Mode)和AI概览(AI Overviews)功能中添加广告，谷歌声称这些广告是“有帮助的”。在上周的谷歌营销活动Google Marketing Live上，谷歌确认已经开始在美国推出这些广告，并声称它们为客户提供了新的“机会”。据一些用户反映，这些广告出现在AI概览的下方，紧随其后的是传统的蓝色链接。随后在媒体发现的一份谷歌支持文档中，谷歌将AI搜索结果中的广告描述为一种“在网络上寻找信息的新方式”。谷歌在文件中还提到：“内部数据显示，人们发现AI概览中的广告很有用，因为它们可以快速连接到相关的企业、产品和服务，以便在需要时立即采取下一步行动。” 谷歌并未公开其“内部数据”的具体数字或方法论，只是强调广告在AI搜索结果中是有帮助的，但有人指出，广告在某些情况下可能会误导用户，或者因为出现在实际内容上方而打断用户的搜索流程。

2025-05-28

268

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。