阿里通义最新生图模型 Z-Image 发布首日下载量达 50 万
阿里通义大模型团队最新发布的生图模型 Z-Image 在上线后迅速登顶 Hugging Face 趋势榜双榜第一,其首日下载量达 50 万。
据介绍,Z-Image 是一款开源、免费的高效图像生成基础模型,参数量为 6B,1秒出图。无需依赖顶级算力和参数堆砌,即可在 16GB 显存的消费级显卡上,生成品质可与顶级商业模型相媲美的超真实图像,尤其在中英双语文本渲染方面效果突出。
Z-Image 仅以 6B 的参数量就能实现媲美百亿级模型的生成效果,关键在于其系统性的效率优化设计,覆盖数据、架构、训练与推理四大支柱。
Z-Image 亮点如下:
- 极致高效的照片级真实感
Z-Image 以 6B 参数的规模,实现了与参数量大一个数量级模型相媲美的照片级真实感。无论是皮肤质感、发丝细节,还是自然光影与材质纹理,都能精细还原,构图与氛围兼具美学表现。
- 中英双语文本渲染能力突出
Z-Image-Turbo 能精准渲染中英文混合文本,即使在小字号、复杂排版或海报设计等高难度场景下,也能保持文字清晰、版式自然,同时不牺牲人脸真实感与整体画面美感,效果媲美当前领先的闭源模型。
- 广博的知识与文化理解
Z-Image 具备对现实世界的广泛认知,能准确生成著名地标(如埃菲尔铁塔、故宫)、知名人物及特定文化元素(如春节窗花、英式电话亭),确保画面在细节、比例与语境上符合真实常识。
- 引入先验知识的深度语义理解
通过提示词增强器(Prompt Enhancer),Z-Image 能处理“鸡兔同笼”逻辑题、古诗“小桥流水人家”可视化等复杂任务,让 AI 不只是“画图”,而是“理解后创作”。
- 强大的指令遵循与创意编辑能力
Z-Image-Edit 可精准执行复合编辑指令,例如“让人物微笑 + 转头 + 背景换成樱花 + 添加中文标语”,并在大幅修改中保持身份、光照、风格的高度一致性,避免常见编辑模型的错位、失真问题。
GitHub:https://github.com/Tongyi-MAI/Z-Image
Hugging Face:https://huggingface.co/Tongyi-MAI/Z-Image-Turbo
ModelScope:https://www.modelscope.cn/models/Tongyi-MAI/Z-Image-Turbo



