🚀 Xinference v1.10.0 重磅更新！！🤖 Anthropic API 格式支持等-低调大师

🚀 Xinference v1.10.0 重磅更新！！🤖 Anthropic API 格式支持等

2025-09-16 92 89

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。 Xinference 的功能和亮点有：

🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

🚀 Xinference v1.10.0 更新日志

✅ 本次亮点

🤖 Anthropic API 格式支持 * 现在可以直接用 Claude Code 等 Anthropic 客户端连接 Xinference，生态兼容性更强。
🔐 新增 IP 白名单限制通过环境变量 * XINFERENCE_ALLOWED_IPS 配置，限制可访问的来源 IP，安全性大幅提升。
📑 OpenAI API 接口增强 * vLLM 引擎现已支持 json_object 和 json_schema 输出格式，后续版本会覆盖更多引擎。

🌐 社区版更新

📦 安装方式

pip 安装：pip install 'xinference==1.10.0'
Docker 使用：拉取最新版镜像，或在容器中使用 pip 更新

🆕 新模型支持

Kokoro-82M-v1.1-zh

✨ 新特性

Anthropic API 格式支持
OpenAI API：vLLM 支持 json_schema 输出
新增 IP 白名单环境变量 XINFERENCE_ALLOWED_IPS

🛠 功能增强

更新 GOT-OCR2 的依赖
MLX 引擎 LLM 模型运行时清理内存
funasr 升级至 1.2.7
修复 CUDA 12.8 Dockerfile 构建问题

🐞 Bug 修复

修复 Kokoro-82M 无法在 GPU 上运行的问题
修复 vLLM 引擎 hf_overrides 解析问题
修复 jina-embedding-v4 响应缺失 usage 字段
修复分布式注册时的异常

📚 文档更新

新增 CUDA 12.8 Docker 文档说明
更新 xllamacpp 文档

🏢 企业版更新（v0.2.3 发布）

Langfuse 升级至 v3 版本，监控与可观测能力更强
企业私有模型库新增若干 OCR 模型，增强文档与图像识别场景支持
大量可用性优化，进一步提升整体稳定性与用户体验

参考：https://xinference.cn/release_notes/v1.10.0.html

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/372497/xinference-1-10-0-released

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Ruby 3.4.6 发布

Ruby 3.4.6 已经发布。本次更新为例行更新，包含一些错误修复。 Bug #21514：Rust 弃用警告：构建 ruby-3.4.5/yjit/src/codegen.rs 时 Bug #21259：Prism 编译器错误地创建了零行号 Bug #21188：PRISM 无法通过两次 ^D 结束从 tty 的读取 Bug #21546：--enable-load-relative在 ruby.pc prefix中出现错误 Bug #21402：ruby2_keywords 影响带有后置参数的方法/过程 Bug #19417：正则表达式 \p{Word} 和 [[:word:]] 与 Unicode Other_Number 字符不匹配 Bug #21535：使用...委托和方法调用 indirection时NoMethodError变为NameError YJIT：向断言消息添加更多信息 · 拉取请求 #14481 Bug #21567：在 require 期间修改 $LOADED_FEATURES 时崩溃 Bug #21561：Windows 上 File.dirname...

113

go-carbon v2.6.12 正式版发布，轻量级、语义化的 golang 时间处理库

carbon 是一个轻量级、语义化、对开发者友好的golang时间处理库，不依赖于任何第三方库，100%单元测试覆盖率，已被awesome-go收录，并获得gitee2024 年最有价值项目（GVP）和gitcode2024 年度开源摘星计划 (G-Star) 项目 document:carbon.go-pkg.com github:github.com/dromara/carbon gitee:gitee.com/dromara/carbon gitcode:gitcode.com/dromara/carbon 更新日志将golang环境依赖从1.21降低到1.18 将testify测试框架从v1.10.0升级到v1.11.1 在type_carbon.go文件UnmarshalJSON方法中设置isEmpty标志以表示空值使用sync.Map实现高性能并发缓存修复潜在的竞态条件和空指针解引用问题，提高并发安全性

116

资源下载

更多资源

优质分享Android(本站安卓app)

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

Oracle Database，又名Oracle RDBMS

Oracle Database，又名Oracle RDBMS，或简称Oracle。是甲骨文公司的一款关系数据库管理系统。它是在数据库领域一直处于领先地位的产品。可以说Oracle数据库系统是目前世界上流行的关系数据库管理系统，系统可移植性好、使用方便、功能强，适用于各类大、中、小、微机环境。它是一种高效率、可靠性好的、适应高吞吐量的数据库方案。

Apache Tomcat7、8、9（Java Web服务器）

Tomcat是Apache 软件基金会（Apache Software Foundation）的Jakarta 项目中的一个核心项目，由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定，而且免费，因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可，成为目前比较流行的Web 应用服务器。

Eclipse（集成开发环境）

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言，它只是一个框架和一组服务，用于通过插件组件构建开发环境。幸运的是，Eclipse 附带了一个标准的插件集，包括Java开发工具（Java Development Kit，JDK）。