抖音自研文生图评估体系 EvalMuse 入选 AAAI 2026
抖音多媒体质量实验室宣布,其自主研发的图像生成评估体系 EvalMuse 已成功入选 AAAI 2026。这一成果标志着中国团队在国际顶级人工智能学术会议上对文本生成图像(T2I)评估方法的突破性贡献。
EvalMuse 旨在解决当前 T2I 模型评估中存在的主观性与一致性不足问题。该体系通过引入多维度指标与自动化评估框架,提升了对生成图像的质量判定能力。
整体的工作架构图如下所示:
实验室方面指出,EvalMuse 能够更准确地反映模型在语义一致性、图像清晰度及创意表达上的表现,还为未来大规模模型的标准化评估提供了参考路径。
论文:https://arxiv.org/abs/2412.18150
开源地址:https://shh-han.github.io/EvalMuse-project/
