微软将自研图像生成模型 MAI-Image-1 整合至 Bing、Copilot
MAI-Image-1 是微软完全自主开发的首个文本生成图像 (text-to-image) 模型。近日,官方宣布它已被集成到微软部分产品中,包括 Bing Image Creator 和 Copilot Audio Expressions(为故事模式的音频生成自定义封面)。 https://www.bing.com/images/create https://copilot.microsoft.com/labs/audio-expression 微软 AI 部门负责人 Mustafa Suleyman 介绍称,MAI-Image-1 在生成食物、自然风景、艺术化光效及写实细节等图像方面“表现尤为出色”。 据介绍,MAI-Image-1 模型针对创意场景进行了优化,微软在训练模型过程中刻意避免“重复或风格化过度”的输出,并征询了创意专业人员(艺术家、设计师)的反馈,可生成多种类型的图像,尤其擅长食物、自然场景以及“艺术化光线+摄影真实感细节”的图像。
