🚀 Xinference v1.13.0 更新了⚡，两大新增亮点⚡速览🚀-低调大师

🚀 Xinference v1.13.0 更新了⚡，两大新增亮点⚡速览🚀

2025-11-19 121

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。

无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：

🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

Xinference v1.13.0 更新日志

✅ 本次亮点

🏪 Xinference Model Hub 正式上线现在可以通过 model.xinference.io 获取最新模型，无需等待 Xinference 发版即可更新模型。 👉 参考文档： https://inference.readthedocs.io/en/latest/models/model_update.html
⚡ Embedding 自动 Batch（auto-batch）支持多个并发 embedding 请求会被自动合批处理，大幅提升吞吐量：
并行请求自动聚合为高效 batch
对业务透明，无需修改调用代码
平均响应时间可降低 10 倍

🌐 社区版更新

📦 安装方式

pip 安装：pip install 'xinference==1.13.0'
Docker：拉取最新镜像或在容器内使用 pip 更新

🆕 新模型支持

Qwen3-VL-MLX（MLX 框架多模态支持）

✨ 新特性

自动 batch embedding
从 Xinference Model Hub 更新模型
支持更新模型 JSON 元数据

🛠 功能增强

IndexTTS2 支持流式输出
IndexTTS2 支持离线部署
增加 embedding benchmark
修复 peft 版本导致的 CI 构建问题

🐞 Bug 修复

修复 DeepSeek-OCR 在 Docker 中运行异常
工具调用（tool call）ID 使用 UUID，避免重复
修复音频 / 视频 / 图像模型缓存列表显示问题

📚 文档更新

新模型文档更新
1.12.0 版本在 uv 下的安装说明
模型在线更新机制文档更新

🏢 企业版更新

新增 MinerU 2.5 支持：更强大的 PDF / 文档解析能力
新增 paddleocr-vl 支持：OCR + 视觉理解一体化模型，适配更多业务场景
系统稳定性增强：持续修复多项问题，提升大规模集群运行可靠性

参考

中文：https://xinference.cn/release_notes/v1.13.0.html

英文：https://xinference.io/release_notes/v1.13.0.html

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/384455

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

开源软件 ShowDoc 新版发布，支持 AI 知识库助手

关于 ShowDoc ShowDoc 是一个在线文档管理系统，用于管理和分享项目文档，支持 API 文档、技术规范、产品说明、团队知识库等场景。 ShowDoc 新增了 AI 知识库助手功能，支持基于项目文档的智能问答。功能说明在项目文档较多的情况下，查找信息可能比较耗时。AI 知识库助手可以帮助你：快速定位文档中的具体信息理解文档中的复杂概念整合分散在多个文档中的信息辅助新人快速了解项目工作原理 AI 知识库助手会将项目文档构建成知识库，基于文档内容回答你的问题。与关键词搜索不同，它能理解问题的语义，从知识库中找到相关内容并给出答案。主要特性：自动索引：文档保存后自动更新到知识库语义理解：基于文档语义匹配，不只是关键词搜索来源标注：答案会标注来源文档，可查看原文示例：传统搜索：输入"用户登录"，返回包含该关键词的页面列表，需要逐个查看 AI 知识库助手：提问"用户登录的接口地址是什么？"，直接返回答案和文档链接使用场景 1. 查找信息可以提问： "这个项目的部署流程是什么？" "用户权限有哪几种？" "支付接口的参数格式是什么？" 2. 新人了解项目新...

2025-11-19

121

Akka 是一个用 Scala 编写的库，能够简化 JVM 上并发和分布式应用的构建。Akka 支持多种并发的编程模型，其灵感来自于 Erlang。Akka 的首个版本于 2009 年发布，距今已有 13 年积极维护的历史。 Akka 2.10.12 现已发布，具体更新内容包括： build：尝试加速bin comp CI job#32833 build：MiMa 最新版本为 2.10.11 #32835 bump：DERPrivateKeyLoader 中的一些拼写错误修复#32834 更新：Aeron 1.45.2#32836 build：减少 nightly builds频率#32832 docs：查看其他模块页面#32839 build：可复制粘贴的命令，用于检查已发布的工件 #32837 chore：新增内部功能以拦截并触发额外事件#32823 chore：更新 2.10.12 版本的变更日期#32848 更新说明：https://github.com/akka/akka-core/releases/tag/v2.10.12

2025-11-19

219

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。