昆仑万维正式开源自研视频生成模型 SkyReels-V3
昆仑万维Skywork AI正式开源自研视频生成模型SkyReels-V3。 官方介绍称,作为一系列多模态视频生成模型,该系列支持参考图像转视频(Reference Images-to-Video)、视频延长(Video Extension)和音频驱动虚拟形象(Talking Avatar)三大核心能力,在单一建模架构中实现高保真多模态视频生成。 参考图像转视频: 根据1-4张参考图片和文本提示,生成高质量、连贯的视频,能精准保留原始图像的身份特征和构图。 视频延长: 将现有视频片段进行时间延长和叙事扩展,支持单镜头平滑延长和五种专业电影转场效果的镜头切换。 音频驱动虚拟形象: 根据单张肖像图和音频,生成声画同步的“数字人”视频,支持长视频和多角色交互。 此外,三大核心能力作为独立模块,每个模块深度优化且支持灵活组合。Skywork AI团队通过企业级数据处理、极速推理能力和高效的训练架构等技术实现,让生成的视频达到专业级效果,多项指标达到或超越行业领先水平。 GitHub:https://git...