您现在的位置是:首页 > 文章详情

智象未来提出全新自回归图像编辑框架 VAREdit

日期:2025-09-03点击:16

智象未来团队将视觉自回归(VAR)架构引入图像编辑,提出了全新的指令引导编辑框架 VAREdit,它精准地解决了扩散模型的固有顽疾。

VAREdit 将新颖的下一尺度预测范式引入指令引导的图像编辑框架,基于文本指令和量化的源图像特征预测目标图像的多尺度视觉残差,通过分析不同条件组织形式的有效性并提出新颖的 SAR 模块,实现了图像编辑在精准性和高效性的双重提升。

智象未来团队表示,VAREdit 能够做到“指哪打哪”,在严格遵循指令、提升编辑质量的同时,将生成效率推向了新的高度,实现了精准度与速度的双重突破。

模型与代码均已开源:

GitHub:https://github.com/HiDream-ai/VAREdit
在线使用:https://huggingface.co/spaces/HiDream-ai/VAREdit-8B-1024
论文链接:  https://arxiv.org/pdf/2508.15772 

原文链接:https://www.oschina.net/news/370098
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章