🚀 Xinference v1.9.1 强势来袭！Qwen-Image 系列重大升级！！！速览！！！-低调大师

🚀 Xinference v1.9.1 强势来袭！Qwen-Image 系列重大升级！！！速览！！！

2025-09-01 166

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。

无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：

🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
⚡️ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
⚙️ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

🚀 Xinference v1.9.1 更新日志

✅ 本次亮点

🖼️ Qwen-Image 系列重大升级
Qwen-Image：新增文生图 / 图生图 / 局部重绘（inpainting）
Qwen-Image-Edit：增强图片编辑体验
Lightning LoRA 加速支持（https://inference.readthedocs.io/zh-cn/latest/models/model_abilities/image.html#lightning-lora-support）
支持 4 步或 8 步生图
在 H20 上生图速度从 35 秒降到 3 秒
模型性能基本保持不变
🧠 新增前沿模型支持
Wan 2.2
Seed-OSS-36B
DeepSeek-V3.1 量化与工具调用

🌐 社区版更新

📦 安装方式

pip 安装：pip install 'xinference==1.9.1'
Docker 使用：拉取最新版镜像，或在容器中使用 pip 更新

🆕 新模型支持

Qwen-Image-Edit
Wan 2.2
Qwen-Image-Lightning
Seed-OSS-36B
DeepSeek-V3.1 Quantized

✨ 新特性

Qwen-Image：支持文生图 / 图生图 / inpainting
Qwen-Image 与 Qwen-Image-Edit：支持 Lightning LoRA 加速
UI：图像模型支持 gpu_count 配置

🛠 功能增强

音频模型新增零样本 & 声音克隆能力
Qwen3 Reranker 支持 vLLM 模板
llama.cpp 支持 chat_template_kwargs
cosyvoice2 依赖升级
兼容 xllamacpp 0.2.0
清理 Docker 构建遗留缓存

🐞 Bug 修复

当 GPU 计算能力 < 8.0 时禁用 flash_attention
修复 rerank 模型创建问题

📚 文档更新

更新自定义模型说明
新增多模态文档中图片数量限制说明
更新模型列表与 README

🏢 企业版更新

本次版本企业版日常稳定性与 Bug 修复优化。

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/369751/xinference-1-9-1-released

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

vuemap/vue-amap 2.1.17 发布，基于 vue-amap 升级的地图组件

vuemap/vue-amap 2.1.17 已经发布，基于 vue-amap 升级的地图组件。此版本更新内容包括： el-amap 组件增加showOversea 、 languageCode属性 el-amap-search-box 增加 v-model:name，支持在选择poi结果后回显name 详情查看：https://gitee.com/guyangyang/vue-amap/releases/2.1.17

2025-09-01

157

领先的开源AI低代码引擎VTJ.PRO正式发布v0.13.15版本。该版本重点推出了对vue-i18n国际化的深度集成支持，标志着VTJ.PRO已完成对企业级应用核心能力的全面构建。继先前版本支持应用全局配置、Swagger API一键导入等功能后，VTJ.PRO现已具备让开发者快速构建现代化、标准化、国际化企业应用的所有关键要素。完善企业级开发“最后一公里” 在企业数字化转型浪潮中，应用开发不仅要求高效快速，更需要符合规范、易于维护并支持全球业务。VTJ.PRO自诞生之初便致力于为开发者提供高性能、高自由度的低代码开发体验。本次更新可视为其迈向成熟企业级解决方案的关键一步。最新支持的vue-i18n国际化功能，允许开发者在可视化设计器中轻松管理多语言词条，绑定动态文本，并实现一键切换语言环境，极大地简化了多语言应用的开发流程。本次版本核心更新亮点 🌍 内置国际化（i18n）支持可视化词条管理：无需手动编写语言文件，在设计器中即可轻松完成词条的添加、翻译和维护。无缝组件集成：所有VTJ.PRO组件均支持国际化属性绑定，UI与逻辑彻底分离。实时预览切换：在设计阶段即可实时预...

2025-09-02

125

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。