快手正式上线首个音画同出模型:可灵视频 2.6
快手可灵 AI 团队宣布,可灵视频正式升级至 2.6 版本,带来了里程碑式的「音画同出」能力,标志着可灵 AI 正式迈入“有声”时代。
据介绍,该模型彻底改变了传统 AI 视频“先生成无声画面,后人工配音剪辑”的割裂流程。通过对物理世界声音与动态画面的深度语义对齐,视频 2.6 能够在单次生成中,端到端地输出包含自然语音、动作音效及环境氛围音的完整视频,实现“所见即所闻”的沉浸式体验。
可灵 2.6 提供两条创作路径:
-
文生音画:从一句话到一条完整音视频;
-
图生音画:让静态画面开口说话、动起来。
该模型号称“音画由您全盘掌控”,适用于单人独白(商品展示 / 生活 Vlog / 新闻播报 / 演讲表达)、旁白解说(商品讲解 / 赛事解说 / 纪录片 / 故事叙述)、多人对白(访谈节目 / 短剧等)、音乐表演(唱歌 / 说唱表演 / 多人合唱 / 乐器演奏)等场景。
详情查看使用手册:https://docs.qingque.cn/d/home/eZQBMUXCmLjb57bpfsVk2jNvx?identityId=2MimOrbHfKF

