谷歌 Veo 3.1 正式发布:新增音频功能和精细化编辑能力
谷歌推出了视频生成模型Veo3.1,这是对今年5月发布的Veo3的升级版本。新版本在音频输出、编辑控制粒度和图像转视频质量等方面实现了改进,能够生成更真实的视频片段并更准确地遵循用户提示指令。 在功能层面,Veo3.1允许用户向视频中添加新对象,系统会自动将其融入原有画面风格。谷歌还透露,即将在其视频编辑工具Flow中支持从视频中移除现有对象的功能,进一步增强编辑灵活性。 Veo3此前已经提供了多项编辑特性,包括通过参考图像驱动角色生成、提供首尾帧由AI生成中间内容,以及基于末尾帧扩展现有视频等功能。Veo3.1的核心升级在于为所有这些编辑功能增加了音频生成能力,使输出的视频片段具备声音元素,提升了内容的完整性和沉浸感。 从部署渠道来看,Veo3.1将通过多个平台向用户开放。谷歌正在将该模型集成到视频编辑器Flow、Gemini应用程序,以及面向开发者的Vertex AI和Gemini API接口中。据谷歌披露的数据,自Flow在5月上线以来,用户已在该平台上创作了超过2.75亿个视频。 这次更新体现了AI视频生成技术在两个方向上的演进。一方面是生成质量的持续提升——更真实的画面、更准...
