🚀 Xinference v2.1.0 更新了！新增内容多多，速览！！-低调大师

🚀 Xinference v2.1.0 更新了！新增内容多多，速览！！

2026-02-16 127

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：
* * 🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
* * ⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
* * 🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
* * ⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
* * 🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
* * 🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

———————————————————————— ————————————————————————

🚀 Xinference v2.1.0 更新日志

✅ 本次亮点

* 🧠 GLM-4.7 / GLM-4.7-Flash 支持
* 新增对 GLM-4.7 及 GLM-4.7-Flash 的完整支持，进一步扩展 GLM 系列模型生态。
* 🎤 Qwen3-ASR 系列上线
新增：
* Qwen3-ASR-0.6B
* Qwen3-ASR-1.7B
完整支持 Qwen3-ASR 语音识别模型，覆盖轻量与高性能两类场景。
* 🖼️ FLUX.2-Klein 系列支持
新增：
* FLUX.2-Klein-4B
* FLUX.2-Klein-9B
强化图像生成与编辑能力，持续完善 FLUX 生态支持。
* 🔁 MinerU2.5-2509-1.2B 调整
对 MinerU2.5-2509-1.2B 模型进行更新与调整，优化模型配置与适配流程。

🌐 社区版更新

📦 安装方式
* pip 安装：pip install ‘xinference==2.1.0’
* Docker：拉取最新版镜像，或在容器中使用 pip 更新

🆕 新模型支持
* GLM-4.7
* GLM-4.7-Flash
* Qwen3-ASR-0.6B / 1.7B
* FLUX.2-Klein-4B / 9B

🛠 功能增强
* 更新 DeepSeek-V3.2 / DeepSeek-V3.2-Exp 模型配置
* 优化镜像构建依赖（约束 setuptools < 82）
* 重构 API 层结构：
* 提取 Pydantic 请求 Schema
* 路由注册模块化拆分，代码结构更清晰

🐞 Bug 修复
* 修复 vLLM embedding 模型报错问题
* 修复 vLLM reranker 评分异常
* 修复 vLLM reranker GPU 释放异常
* 兼容 vLLM async tokenizer 处理逻辑
* 修复 CI 中 setuptools 相关问题

🏢 企业版更新

* 🔧 稳定性增强
包含多项底层优化与问题修复，提升整体运行稳定性与企业级部署可靠性。

参考
* 中文：https://xinference.cn/release_notes/v2.1.0.html
* 英文：https://xinference.io/release_notes/v2.1.0.html

———————————————————————— ————————————————————————
我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/404313

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

bbs-go v4.3.0 已经发布，基于 Go 开发的论坛系统

bbs-go v4.3.0 已经发布，基于 Go 开发的论坛系统此版本更新内容包括：本次版本聚焦于「任务系统 + 成长体系 + 投票能力 + 安装/构建流程 + 多语言与体验优化」，并包含多项稳定性修复与工程重构。新增功能新增任务系统（任务中心、任务配置、任务分组、任务进度、任务菜单与路由、相关 API 与迁移初始化）。新增成长体系能力（等级配置、经验值、等级称号展示、升级事件与任务联动）。新增用户徽章系统（徽章展示、勋章模板与图标、用户中心/侧边栏展示、缓存支持）。新增前台投票能力（投票数据结构、服务端实现、前端投票卡与编辑器、到期时间选择器）。新增 Google 登录集成（前后端接入、绑定流程、重定向与参数校验优化）。新增 AWS S3 上传支持，并完善阿里云/腾讯云上传配置校验。新增 SQLite 支持与安装流程相关配置能力。重要优化重构 ID 体系：引入 Snowflake ID；增加 ID 编解码（Feistel + Base62）、随机密钥、配置与测试；多处接口 ID 统一字符串化并兼容明文/加密 ID。任务事件与积分发放流程优化：强化事务原子性、...

2026-02-16

98

更新说明新增 CJK / Unicode 字符支持 - 修复了 CJK（中文、日语、韩语）及其他全角字符的光标定位问题。插入符、选定内容高亮、搜索高亮及所有其他视觉元素现在能正确对齐双宽度字符。新增 GB2312 编码支持，并在打开文件时自动检测 GB2312 编码。新增通过标签页右键上下文菜单比较已打开标签页文本的功能。新增保存大文件时的每标签页进度条，允许用户在文件保存时继续在其他标签页工作。新增系统主题检测功能。新增中文界面本地化。新增塞尔维亚语（西里尔字母）界面本地化。修复了使用箭头键导航时，代理对（surrogate pairs）需按两次键才能移动的问题，现可作为一个整体单位跳过。修复了框选/列选模式下，以 Delete 或 Backspace 开始时丢失列模式的问题，现可保持列模式以便继续编辑。修复了编辑大文件并在文件开头和结尾之间跳转及修改时的性能问题。扩展了“关于”窗口，包含贡献者和更新说明。依赖框架版（下载体积小 - 需要 .NET 10 运行时）单个便携式 EXE 文件（约 2 MB）。如果系统已安装 .NET 10，请使用此版本。 SHA...

2026-02-16

112

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。