腾讯开源音乐大模型 SongGeneration 2 发布
腾讯和清华大学人机语音交互实验室联合研发的音乐基础模型 SongGeneration 2 已正式推出。公告称,其核心优越性在于对底层架构和训练策略的全面升级,赋予了 SongGeneration 2 突破性的三大优势: 高音乐性:不仅旋律优美连贯,更能处理复杂的多轨编曲与空间层次。 高歌词准确性:大幅降低幻觉,实现清晰、准确的多语种咬字跟唱。 优秀的可控能力:精准遵循文本描述、音频提示等多种指令,深度控制音乐风格。 评估结果表明,在整体质量(Overall Quality)、旋律(Melody)、编曲 (Arrangement)、乐器音质(Sound Quality-Instrument)、人声音质(Sound Quality-Vocal) 以及结构(Structure) 这6 个评价维度中,SongGeneration 2 均呈现出断崖式领先,显著超越了包括 ACE-Step 1.5、HeartMula、YUE、LeVo以及DiffRhythm 2在内的所有主流开源模型。 实验数据显示,SongGeneration 2 的整体生成质量已成功对齐商业级能力。在整体质量、旋律、编曲等多个...




