字节跳动开源 USO，支持统一风格与主体定制的图像生成模型-低调大师

字节跳动开源 USO，支持统一风格与主体定制的图像生成模型

2025-09-01 181

字节跳动团队近日发布并开源USO（Unified Style-Subject Optimized）模型，这是一个“统一风格-主体”定制生成框架，首次把“风格驱动”与“主体驱动”两类原本对立的图像生成任务合并到单一模型里，并在这两个维度上都达到了开源领域的最佳水平（SOTA）。

USO通过解耦内容与风格特征并引入奖励学习机制，首次实现了风格驱动与主体驱动生成任务的统一框架。

现有方法通常将风格相似性与主体一致性视为对立目标，而USO通过构建包含20万组三元组数据（风格参考图、去风格化主体图、风格化结果图）的训练集，提出跨任务协同解耦范式：利用主体生成模型生成高质量风格化数据，再通过风格奖励引导的解耦训练优化主体模型。

技术上采用SigLIP多尺度特征投影实现风格对齐训练，并通过内容-风格解耦编码器分离条件特征，最终结合风格奖励学习（SRL）进一步提升解耦效果。

USO代码与权重已在Hugging Face与GitHub公开，并配套在线Demo与一键安装脚本。

https://huggingface.co/bytedance-research/USO
https://huggingface.co/spaces/bytedance-research/USO
https://github.com/bytedance/USO
https://huggingface.co/papers/2508.18966

微信关注我们

原文链接：https://www.oschina.net/news/369639

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

中国企业调用大模型日均超 10 万亿 Tokens

9月1日，国际市场调研机构沙利文（Frost&Sullivan）发布了最新的《中国GenAI市场洞察：企业级大模型调用全景研究，2025》，报告显示，2025年上半年，中国企业级市场大模型的日均总消耗量为10.2万亿Tokens，其中，阿里通义占比17.7%位列第一，成为目前中国企业选择最多的大模型。《中国GenAI市场洞察：企业级大模型调用全景研究，2025》发布沙利文调研国内700家企业，领域横跨金融、制造、互联网、消费电子、汽车等多个重点行业，覆盖不同营收层级和AI投入规模的企业，以全面反映中国企业大模型真实使用现状。报告显示，中国大模型企业级市场呈爆发式增长：较2024年下半年，2025年上半年日均调用量暴增363%，已逾10万亿tokens；其中，阿里通义占比17.7%，字节豆包占比14.1%，DeepSeek占比10.3%，前三名合计占比超40%。公有云上使用大模型成为主流。沙利文报告显示，七成企业选择公有云部署或调用大模型，71%企业还表示未来将增加公有云形态的生成式AI服务。报告进一步指出，中国企业正从“追求单⼀最强模型”，转向“为特定业务场景寻求最优...

2025-09-01

228

据环球网援引韩联社报道，韩国政府8月29日召开国务会议审议并通过2026财年预算案。预算总支出规模达728万亿韩元（1000韩元约合人民币5.1元），较今年增长8.1%，远超今年2.5%的增幅，总额创历年新高。这是李在明政府编制的首份预算，标志着韩国财政政策正式从前政府时期的“紧缩”转向“扩张”。报道称，面对该国经济结构性动力不足的危机，韩国政府将预算重点投向拉动增长的人工智能（AI）和研发领域：研发预算由29.6万亿韩元提高至35.3万亿韩元，增幅19.3%，为历年最大，以加速AI、生物、文创内容、军工、能源、制造六大关键领域的创新。其中，AI预算由3.3万亿韩元增至10.1万亿韩元，增幅逾两倍。韩媒称，为应对美国政府对国防军费增额的压力，韩国防预算由61.25万亿韩元增至66.3万亿韩元，重点用于改善部队官兵福利，以及新一代隐形战机、AI、无人机、机器人等尖端武器研发。据《韩国日报》报道，这是韩国国防预算单年首次增逾5万亿韩元，增长率（8.2%）高于总支出，达到2008年以来的最高水平。若获国会通过，国防开支占国内生产总值（GDP）比重将增至2.42%。此外，产业政策支出扩大...

2025-09-01

167

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。