微软发布两款全新自研模型:MAI-Voice-1 与MAI-1-preview
微软发布了两款完全自研的模型:语音生成模型 MAI-Voice-1 与基础大模型 MAI-1-preview。
MAI-Voice-1 可在单 GPU 上一秒内生成一分钟高保真语音,该模型已被应用于多项功能,包括由 AI 主持人播报当日要闻的 Copilot Daily,以及生成播客式讨论内容以阐释主题。
用户可在 Copilot Labs 亲自体验 MAI-Voice-1:输入文本内容后,可自由调整 AI 模型的语音风格与表达方式。
除该模型外,微软还推出了采用混合专家架构的 MAI-1-preview,据称其预训练与后训练共动用约 15,000 张 NVIDIA H100 GPU,该模型专为需要遵循指令并 “对日常查询提供实用回应” 的用户设计。
MAI-1-preview 已上线 LMArena 社区测试,排名第 13,并同步向受邀开发者提供 API 试用申请。未来几周将先面向部分 Copilot 文本场景灰度上线,以收集反馈并持续迭代。
微软 AI 首席执行官 Mustafa Suleyman 表示,这只是开始,后续将围绕模型升级、计算路线规划以及与微软全线产品深度集成,目标触达数十亿用户,实现 “为所有人构建 AI”。
https://microsoft.ai/news/two-new-in-house-models/
https://copilot.microsoft.com/labs/audio-expression

