快手旗下可灵 AI 数字人上线公测
快手旗下可灵AI数字人已于近日上线公测。该功能通过多模态技术,实现了从“对口型”到“会表演”的突破,支持用户上传图片或音频,生成1080p/48fps、最长1分钟的数字人视频,具备精准口型同步、情绪动作控制、多角色同屏等功能,且支持中、英、日、韩等多语种。
用户可通过可灵AI官网(https://app.klingai.com/cn/)体验,目前处于逐步放量阶段。
据了解,可灵 AI 数字人基于多模态理解与视频生成模型的深度结合,实现了口型精准同步以及情绪动作的精细控制。其采用的基于 Transformer 的 DiT 架构,在处理时序信息和细粒度控制方面具有独特优势,能够精准解析面部特征、理解音频语义,并根据语音内容推断合适的面部表情和微动作,从而确保生成的数字人在视频全程保持角色一致性。
在角色和语言支持方面,可灵 AI 数字人功能表现出色。其支持多种角色类型,包括真人、动画角色甚至动物形象,同时涵盖中、英、日、韩等多语种,能够满足不同用户的多样化需求。在价格策略上,结合会员优惠,可灵 AI 数字人的使用成本最低为 0.12 元 / 秒。
