新一代开源 AI 图像生成/编辑模型 FLUX.2 发布
近日,德国 AI 公司 Black Forest Labs(BFL)正式发布 “FLUX.2”——他们迄今为止最强大的文本-图像生成/编辑模型,目标不仅是“炫技展示”,而是真正服务于专业创作与产业级视觉工作流。
据介绍,FLUX.2支持多参考图生成(最多10张),提升角色、风格一致性;优化光照、纹理细节,适用于产品摄影、UI设计等场景。此外新增结构化JSON提示词控制,支持十六进制颜色代码精准配色,强化复杂排版、多语言(含中文)文本渲染能力。
FLUX.2 版本划分:
- FLUX.2 [pro]:闭源商用版本,图像质量对标顶级闭源模型,生成速度更快、成本更低。
- FLUX.2 [flex]:允许调整步数、引导规模等参数,平衡质量与速度,擅长文本与细节渲染。
- FLUX.2 [dev]:32B参数开源版本(需授权商用),集成文生图、多图编辑功能,支持本地部署(需RTX 4090及以上显卡),Hugging Face已开源权重。
- FLUX.2 [klein](待发布):Apache 2.0协议的开源轻量版,通过蒸馏保留核心能力。
FLUX.2 亮点如下:
-
专业级画质 + 高分辨率:FLUX.2 支持生成和编辑高达 4 百万像素(4 MP)图像,画面细节、材质、光照、空间感都接近摄影级真实感。
-
多图参考 (Multi-reference) + 风格/角色/产品一致性:用户可以输入多张参考图像(最多 6–10 张),FLUX.2 能保持风格、角色、产品外观的一致性,这对广告图、系列海报、产品展示等应用尤为关键。
-
优异的文本与排版渲染能力:相比此前很多生成模型容易“字母混乱”或“假文本”,FLUX.2 能生成清晰、可读的文字,适合海报、UI mock-up、信息图 (infographics)、跨语言内容等场景。
-
物理世界感 + 语义理解 + 布局/构图控制:模型对于光照、阴影、反射、透视、材质表现有更好的理解,也能按照结构化提示 (structured prompts) 生成复杂构图 —— 几乎可以 “把脑中的设计图变成照片”。
-
开放-核心 (open-core) 策略 + 多种版本选择:FLUX.2 提供从开源/开权重 (open-weight) 的 “Dev” 版本,到针对商业用户优化的 “Pro”/“Flex” 版本。对于研究者、设计师、创意团队、公司都具有灵活选择空间。
实测显示,与Google Nano Banana Pro相比,FLUX.2在CCD相机风格还原、结构化场景生成上表现更优,但世界知识理解(如动漫角色)仍存在差距。开源版本FLUX.2 [dev]生成单图成本约0.03美元,在多图编辑任务中优于同类开源模型。
FLUX.2 开源地址:https://github.com/black-forest-labs/flux2


