🚀 Xinference v2.3.0 更新，更多精彩亮点，速览！-低调大师

🚀 Xinference v2.3.0 更新，更多精彩亮点，速览！

2026-03-17 68

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：

🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

———————————————————————— ————————————————————————

🚀 Xinference v2.3.0 更新日志

✅ 本次亮点

🧠 主流模型多格式支持完善本次版本进一步完善了以下模型在不同推理引擎与模型格式下的支持，包括 vLLM、Transformers、量化模型以及 GGUF 模型：
GLM-5
Kimi-K2.5
MiniMax-M2.5
Qwen3.5 其中 Qwen3.5 重点修复并完善了在多个推理引擎下的兼容性问题，使其在不同运行环境中的部署更加稳定。

🌐 社区版更新

📦 安装方式

pip 安装：pip install ‘xinference==2.3.0’
Docker：拉取最新版镜像，或在容器中使用 pip 更新

🆕 模型更新

完善以下模型的多引擎与多格式支持：
GLM-5
Kimi-K2.5
MiniMax-M2.5
Qwen3.5

✨ 新特性

vLLM 引擎支持 Qwen3.5
新增 seed 与 repetition_penalty 参数，用于精度测试与推理控制

🛠 功能增强

Transformers 引擎支持 Qwen3.5
持续更新模型 JSON 配置，提升模型兼容性

🐞 Bug 修复

修复 WorkerWrapperBase.init() 参数冲突问题 (rpc_rank)
修复 qwen3-vl-embedding 在 vLLM 下的检查问题
修复多 GPU 聊天推理问题
修复 Qwen3.5 在 vLLM 下因缺少 generation_config.json 导致的启动问题
修复 UI 表单默认值初始化问题

📚 文档更新

新增 v2.2.0 发布说明
若干文档细节修正

🏢 企业版

🎉 Xinference 企业版 1.0 正式发布

企业版 1.0 首次正式发布，标志着 Xinference 企业级能力进入稳定阶段。

参考

https://xinference.cn/release_notes/v2.3.0.html

———————————————————————— ————————————————————————

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/411474

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

使用 LVGL 实现跨平台的 WinForms API 兼容层 LVGLSharp.Forms 9.3.0.5 发布

LVGLSharp.Forms是一个跨平台的 WinForms API 兼容层，以LVGL作为底层渲染引擎。目标是实现所见即所得——在 Visual Studio Windows Forms 设计器中设计的界面，可以在 Linux（arm / arm64 / x64）等嵌入式平台上以高度一致的效果运行。 ⚠️项目目前处于试验阶段，尚不可用于生产环境。 ✨ 特性 🖥️WinForms API 兼容：使用与System.Windows.Forms高度相似的 API，轻松迁移现有代码。 🔤LVGL 全 API 互操作：基于 ClangSharpPInvokeGenerator 自动生成的 P/Invoke 绑定，覆盖 LVGL 全部 C API。 🚀NativeAOT 支持：支持发布为无依赖的原生可执行文件（已验证 win-x64 / linux-arm）。 🌍跨平台：支持 Windows（x86 / x64 / arm64）、Linux（x64 / arm / arm64）。 🧩内置常用控件：Button、Label、TextBox、CheckBox、RadioButton、Co...

2026-03-17

50

BadouCMS 2.2.0 已经发布，基于 ThinkPHP8+Layui 的开源网站管理系统此版本更新内容包括：更新内容修复与优化发送邮件问题由 @阿辉贡献 https://gitee.com/lande_admin/badoucms/pulls/11 更新：更新thinkphp版本为8.1，兼容php8.4(8.5未测试) 新增：增加cms路由前置事件，防止某些路由被cms路由覆盖新增：增加前端基类的跨域检查函数修复：content 标签的id属性不能使用的问题修复：链接内容链接替换不显示的问题修复：小数点不能搜索的问题修复：自定义字段筛选时携带分页的问题修复：用户积分、余额不能记录的问题修复：邮箱发送失败仍然返回成功问题修复：修复后台内容列表选中分类后排序失效的问题修复：修复前台模版放在public下的路径问题优化：分类与内容列表的调用速度优化：内容复制时增加统一编号优化：sitetplpath的地址优化：解析字符串为数组增加传入分割字符优化：上传类，支持传入根路径优化：优化后台js库，移除冗余的js，缩减程序包尺寸优化：优化后台登录时...

2026-03-18

50

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。