🚀 Xinference v2.2.0 最新更新：✨支持新一代大模型-低调大师

🚀 Xinference v2.2.0 最新更新：✨支持新一代大模型

2026-03-03 95

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：

🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

———————————————————————— ————————————————————————

🚀 Xinference v2.2.0 更新日志

✅ 本次亮点

🧠 新一代大模型支持
GLM-5
Kimi-K2.5
MiniMax-M2.5
Qwen3.5

🌐 社区版更新

📦 安装方式

pip 安装：pip install ‘xinference==2.2.0’
Docker：拉取最新版镜像，或在容器中使用 pip 更新

🆕 新模型支持

GLM-5
Kimi-K2.5
MiniMax-M2.5
Qwen3.5

✨ 新特性

支持 GLM-5 与 Kimi-K2.5 在 vLLM 引擎下运行
更新相关模型配置 🐞 Bug 修复
修复 create_image_edits 多文件处理问题
替换 55 处裸 except，提升异常处理规范性 📚 文档更新
更新 v2.1.0 文档
README 新增 Docker 拉取说明

🏢 企业版更新

🔧 PPU 支持增强优化在 PPU 环境下的运行与调度能力，提升企业级部署稳定性与性能表现。

🤖 XAgent v0.1.2

新增 PPT 生成能力，并优化前端体验与整体稳定性。

参考

https://xinference.cn/release_notes/v2.2.0.html

———————————————————————— ———————————————————————— 我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/407183

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

🔥 SolonCode v0.0.16 发布 - 终端智能助手（或编码智能体）

SolonCode SolonCode 是基于 Java 8 + Solon AI 和“沙盒”概念开发的“Claude Code” 开源实现版本。它不仅是一个AI 终端智能助手（帮你查资料，生成图片、视频，陪你聊天等...），更是一个深度集成开发环境、支持多种 AI 协议（ACP/MCP）的全栈 AI 编程智能体。核心理念：强大技能：完全兼容 Claude Code Agent Skills 规范，可无缝接入现有的技能集。环境感知：自动索引项目结构，支持文件读写、Grep 搜索及 Bash 命令执行。安全受控：关键操作（如删除文件、执行写入）支持人工审批（Human-in-the-loop）。网络能力：自带 Webfetch、Websearch 工具，方便感知网络（基于mcp.exa.ai/mcp封装）生态兼容：支持 Java 8 到 Java 25 环境运行，完美适配国产大模型与主流 IDE 插件协议。开源开放：（MIT 开源协议）方便企业基于 Java 生态去定制自己的 Agent 维度核心能力场景描述交互层 CLI 命令行 / Web API / ACP 协...

2026-03-03

98

SQLAlchemy 2.0.48 现已发布。 SQLAlchemy 是一个 Python 的 SQL 工具包以及数据库对象映射 (ORM) 框架。它包含整套企业级持久化模式，专门用于高效和高性能的数据库访问。版本 2.0.48 修复了一个潜在的并发问题，该问题可能会影响自定义的“on connect”例程，特别是 SQL Server 方言使用的例程。更多2.0.48 的详细变更可查看变更日志。 SQLAlchemy 2.0.48 可在下载页面获取。

2026-03-03

90

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。