生树科技发布高可控 AI 视频大模型「Vidu Q1」
生树科技旗下的 Vidu AI 发布了业内首个高可控 AI 视频大模型「Q1」。
据介绍,Vidu Q1 在多主体细节可控、音效同步可控、画质增强等方面都取得出色表现。并且 Vidu Q1 在四大核心能力进行了全面升级:
- 极「质」高清:画质细节全面提升,出片更清晰、更具质感;
- 极「质」镜头:首尾帧衔接更顺滑,镜头语言更具电影感;
- 极「质」音效:一句话生成专属音效,支持时段自定义和音效叠加;
- 极「质」风格:动漫风格再度升级,稳定流畅、更具表现力。
目前,Vidu Q1 已上线 Vidu 官网,支持时长 5 秒、1080p 的视频生成。
根据官方介绍,Vidu Q1 作为业内首个高可控 AI 视频大模型,其在多主体细节可控(特别是动作、布局可控)、音效同步可控、画质增强等方面均取得显著成效。
以多主体细节可控为例,在语义指令的基础上,通过融入参考图的视觉指令,Vidu Q1支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控,对所有动作行为(出场、退场、坐立姿态、行动路线)进行精准调整。用户能够明显体验到用更低的抽卡率实现更高质量的可控生成。
音效同步可控功能则确保了随着视频环境与画面转场,Vidu Q1 能够输出生成相应音效,并可精准控制每段音效的长短区间,精准设置每段音频出现的时间点,如 0-2s 风声、3-5s 雨声等,节省时间的同时,也大大增强了视频的沉浸感与感染力。
Vidu Q1 模型通过进一步增强画质,则能够为用户带去更加清晰、细腻、逼真的视觉体验。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
DeepMind 强化学习团队副总裁:AI 的未来在于自主获取经验
近日,Google DeepMind 强化学习团队副总裁 David Silver 近日在一场重要播客中提出了关于 AI 未来发展的关键观点。 作为 DeepMind 创始成员和 AlphaGo 项目的核心人物,Silver 认为 AI 未来的突破将来自于其自主获取经验的能力,而非继续依赖人类数据。 Silver 在访谈中指出,AI 发展正从「人类数据时代」迈向「经验时代」。他解释道: 目前的 AI 方法基于一个共同理念:提取人类拥有的全部知识并’喂’给机器。但真正的突破将来自于机器与世界互动,产生自身经验的能力。 以 AlphaGo 和 AlphaZero 为例,Silver 阐述了 AI 自主学习的威力。AlphaZero 通过完全摒弃人类棋谱数据,仅靠自我对弈获取经验,反而达到了超越人类和早期版本 AlphaGo 的水平。他称这是 AI 领域的「苦涩教训」——人类知识有时反而会限制 AI 的自主学习能力。 Silver 还谈到了当前大语言模型中的强化学习应用。虽然基于人类反馈的强化学习(RLHF)帮助模型更符合人类偏好,但他认为这种方法无法让 AI 超越人类知识的「天花板」。「如...
- 下一篇
谷歌 AI 概览致网站点击率暴跌 34.5%
知名 SEO 工具提供商 Ahrefs 近期发布一项研究,揭示了谷歌 AI 概览功能对搜索结果页面(SERP)点击率的显著负面影响。研究数据显示,当搜索结果中出现 AI 概览时,相关关键词的平均点击率骤降34.5%。 该研究选取了 Ahrefs 关键词资源管理器数据库中的30万个关键词,其中一半触发了 AI 概览,另一半则未触发。通过对比2024年3月(AI 概览推出前)和2025年3月(推出后)的数据,研究人员发现,触发 AI 概览的关键词平均点击率从0.073大幅下降至0.026。 令人担忧的是,即使是未触发 AI 概览的信息类关键词,其点击率也从0.056降至0.031。Ahrefs 的研究结果清晰地表明,谷歌的 AI 概览功能正在显著改变用户的搜索行为,并对网站的自然流量造成了严重冲击。
相关文章
文章评论
共有0条评论来说两句吧...