🚀 Xinference v2.4.0 🔭 引入 OTEL支持, 可观测能力增强！-低调大师

🚀 Xinference v2.4.0 🔭 引入 OTEL支持, 可观测能力增强！

2026-03-31 50

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：
* * 🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
* * ⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
* * 🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
* * ⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
* * 🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
* * 🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

———————————————————————— ————————————————————————

🚀 Xinference v2.4.0 更新日志

✅ 本次亮点

* 🔭 引入 OpenTelemetry（OTEL）可观测能力
支持接入 OpenTelemetry，可对推理请求、系统运行状态等进行统一观测与追踪，提升生产环境下的可观测性与调试能力。

* 🖥 支持 aarch64 镜像（ARM 架构）
新增 aarch64 架构镜像支持，可运行在 ARM CPU 环境（如 NVIDIA DGX Spark 等），进一步拓展部署场景。

🌐 社区版更新

📦 安装方式
* pip 安装：pip install ‘xinference==2.4.0’
* Docker：拉取最新版镜像，或在容器中使用 pip 更新

✨ 新特性
* 引入 OpenTelemetry（OTEL）支持
* 支持 vLLM v0.18.0
* 新增 GPU 使用率指标（gpu load metrics）
* 支持 aarch64 架构镜像构建与运行

🛠 功能增强
* 持续更新模型配置（Qwen3.5 等）
* 优化 vLLM embedding 参数兼容（适配 vLLM > 0.16）
* Supervisor 模型注册与列表查询并行化

🐞 Bug 修复
* 修复 async client FormData 与响应生命周期问题
* 修复 MLX 后端输出累积问题
* 修复虚拟环境依赖注入问题（site-packages）
* 修复 Qwen3.5 多 GPU 启动问题
* 完善 Qwen3.5 tool call 支持（含 XML-like 格式与 reasoning 解析）
* 修复 GPU utilization 为空导致的 WebUI 崩溃问题

📚 文档更新
* 新增 v2.3.0 发布说明
* README 增加 Xagent 相关内容

🏢 企业版更新

* 🔧 1.0 版本持续优化
围绕企业版 1.0，进行多项性能优化与使用体验提升。

🎉 其他

* 👏 恭喜 @leslie2046 晋升为 Xinference Maintainer 🎉

参考

* https://xinference.cn/release_notes/v2.4.0.html
———————————————————————— ————————————————————————
我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/416040/xinference-2-4-0-released

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Ant Design 6.3.5 发布，企业级 UI 设计语言和 React 实现

Ant Design 是阿里巴巴开源的一套企业级 UI 设计语言和 React 组件库。Ant Design 6.3.5 现已发布，主要更新内容如下：修复 Image 预览底部操作按钮没有重置原生按钮样式的问题。#57491 修复 TimePicker 在移动端触摸设备无法直接滚动时间列的问题。#57468 杂项：修复 Icon 在特定场景没有居中对齐的问题。#57460 更新说明：https://github.com/ant-design/ant-design/releases/tag/6.3.5

2026-03-30

38

CloudCanal免费社区版是ClouGence公司推出的一款全自研、可视化、自动化数据迁移同步工具，具备结构迁移、数据迁移、数据同步、数据校验、数据订正等功能，支持60+ 款流行关系型数据库、实时数仓、消息中间件、缓存数据库和搜索引擎之间数据互通，其中包含国产数据库OceanBase、PolarDB、TiDB、StarRocks、Doris、RocketMQ、达梦等。结合开源项目CloudCanalProcess，可方便实现如下功能： wide-table: 打宽表数据处理插件，主要包括事实表和单维表组合处理 data-transform: 数据通用转换插件，比如做操作变幻、额外加字段、清洗回填数据 data-gather: 数据汇聚插件，将分库分表、垂直拆分、异地数据进行实时汇聚 data-compare: 数据对比插件，根据源端数据变化进行业务对账 business-alert: 业务告警插件，根据数据变化趋势做出相应告警 CloudCanal产品功能对标阿里云 DTS、亚马逊 DMS、StreamSets、AirByte，助力开发、DBA 或运维同学快速构建在线数据应用。 ...

2026-03-31

70

资源下载

更多资源

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。