🚀 Xinference v2.5.0 更新来了，有新模型支持，Web UI 配置管理能力增强，速览！-低调大师

🚀 Xinference v2.5.0 更新来了，有新模型支持，Web UI 配置管理能力增强，速览！

2026-04-14 57

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：

- 🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
- ⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
- 🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
- ⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
- 🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
- 🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

———————————————————————— ————————————————————————

🚀 Xinference v2.5.0 更新日志

✅ 本次亮点

🧠 新模型支持
Qwen3-TTS 系列（0.6B / 1.7B，Base / CustomVoice / VoiceDesign）
Gemma-4
🖥 Web UI 配置管理能力增强
支持在浏览器本地保存多个模型部署配置（localStorage）
更方便在不同模型 / 参数组合之间切换与复用
🔁 模型副本恢复能力增强
Supervisor 重启后支持自动重连并恢复模型副本状态，提升系统可靠性与容错能力。

🌐 社区版更新

📦 安装方式

pip 安装：pip install ‘xinference==2.5.0’
Docker：拉取最新版镜像，或在容器中使用 pip 更新

🆕 新模型支持

Qwen3-TTS-12Hz-0.6B / 1.7B（Base / CustomVoice / VoiceDesign）
Gemma-4 ✨ 新特性
sglang 支持 Qwen3.5
新增 Qwen3-TTS 音频模型支持
WebUI 支持本地保存模型部署配置
Supervisor 重启后支持模型副本自动恢复 🛠 功能增强
自动检测 PyTorch CUDA 版本，用于虚拟环境配置
新增轻量级 worker 心跳机制（liveness detection）
优化模型部署进度与 worker 状态展示
持续更新模型 JSON 配置 🐞 Bug 修复
修复认证凭证比较的安全问题（CWE-208）
修复 Qwen3 reranker 在 vLLM 下精度问题
修复 Qwen3.5 streaming API tag 错误
修复 Jinja 模板中 {% break %} 解析问题（如 Kimi K2.5）
修复 qwen3-vl embedding 在 vLLM 下的问题 📚 文档更新
新增 v2.4.0 发布说明

🏢 企业版更新

🔧 1.0.2 版本发布
大量稳定性修复与优化

🎉 其他

👏 恭喜 @ZhikaiGuo960110 晋升为 Xinference Maintainer 🎉

参考

https://xinference.cn/release_notes/v2.5.0.html

———————————————————————— ———————————————————————— 我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/420692

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

HeidiSQL 12.17 发布

HeidiSQL 12.17 现已发布，一些更新亮点包括：支持在用户管理器中创建 MariaDB 角色支持 PostgreSQL 表设计器和数据网格中的 ENUM 列类型。支持 MySQL 和 MariaDB 上的不可见索引和忽略索引支持深色主题的 HTML 导出 PostgreSQL 上的连接数据库默认为空（之前是“postgres”）。数据表中的生成列只读提供适用于 Linux 的 RPM 软件包。安装方法如下：sudo yum install Downloads/heidisql...rpm 更多信息可访问：https://github.com/Hei...

2026-04-14

79

ng-zorro-antd 是 Ant Design 的 Angular 实现，主要用于研发企业级中后台产品。全部代码开源并遵循 MIT 协议，任何企业、组织及个人均可免费使用。 ng-zorro-antd 21.2.2 正式发布，更新内容如下： Bug Fixes input: 使用 ng control 值初始化 value (#9748) (c650b8a) input: 修复使用 ngModel 时值不正确的问题 (#9745) (69f4efd) select: 快速滚动导致 scrollToBottom 输出未被触发 (#8771) (9c302a6) select: 修复懒加载路...

2026-04-14

59

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。