可灵 3.0 模型上线:视频与图片能力全面升级
可灵 AI 官宣正式迈入3.0 时代,围绕视频与图片两大核心能力进行全面升级,重点提升叙事能力、可控性、一致性与画质表现,并首次引入多模态一体化的原生创作流程。 可灵 AI 表示,本次更新覆盖从生成到编辑的完整链路,旨在让创作者以更低门槛获得电影级叙事体验。更新内容包括视频 3.0、视频 3.0 Omni、图片 3.0、图片 3.0 Omni 四大模块。 可灵视频 3.0: 智能分镜功能可自动理解剧本并调度景别与机位,减少单镜头堆叠带来的叙事限制; 图生视频能力新增主体参考,可通过多图或视频锚定角色、道具与场景特征,降低生成偏移; 全能音画功能支持多语种与多方言口型同步,提升角色演绎自然度; 文字生成部分强化字形保真,适用于广告、字幕等高精度场景; 视频生成时长扩展至 3-15 秒,使复杂叙事得以一镜完成。 视频 3.0 Omni: 全能参考 3.0 在主体相似度与复杂文本执行上均有明显提升; 全能主体 3.0 支持上传 3-8 秒角色视频提取人物特征与原声音色,并可为多图主体绑定专属声线; 分镜叙事 3.0...
