阿里通义实验室开源 Qwen-Image-i2L
阿里通义实验室推出 Qwen-Image-i2L,能将任意单张图片瞬间转化为可微调的LoRA(Low-Rank Adaptation)模型。
无需海量数据集或昂贵计算资源,用户只需上传一张图片,即可生成轻量级LoRA模块,并无缝集成到其他生成模型中,实现高效的“单图风格迁移”。
Qwen-Image-i2L的核心在于其独特的图像分解机制。它采用SigLIP2、DINOv3和Qwen-VL等多模态特征提取体系,将输入图片智能拆解为“风格、内容、构图、色调”等核心视觉元素。这些可学习特征随后被高效压缩,形成一个体积小巧的LoRA模块——平均仅需数GB空间,却能捕捉图片的精髓。
为满足不同需求,Qwen-Image-i2L提供了四种专属“模型风格”,每个变体针对特定用途优化:
- 风格模式(2.4B参数):专注纯美学提取,理想用于艺术画风迁移,如将水彩风格注入新图像。
- 粗粒度模式(7.9B参数):综合捕捉内容与风格,适合整体场景重构,例如建筑或景观的快速变体生成。
- 精细模式(7.6B参数):支持1024x1024高分辨率细节增强,常与粗粒度模式搭配,提升纹理和边缘精度。
- 偏见模式(30M参数):确保输出与Qwen-Image原生风格一致,避免偏差,适用于需要品牌统一性的企业级应用。
这些变体均基于Apache2.0许可开源,测试显示,在复杂文本渲染和语义编辑基准上,Qwen-Image-i2L超越多数开源竞品,与闭源模型不相上下。

