🚀 Xinference v1.15.0 重磅更新！多模型能力持续扩展，速览！-低调大师

🚀 Xinference v1.15.0 重磅更新！多模型能力持续扩展，速览！

2025-12-16 108

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：
* * 🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
* * ⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
* * 🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
* * ⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
* * 🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
* * 🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

🚀 Xinference v1.15.0 更新日志

✅ 本次亮点

* 🧠 多模型能力持续扩展
* DeepSeek-V3.2 模型支持，推理与工具调用能力进一步增强
* Z-Image-Turbo 图像模型上线，带来更快的生成体验
* PaddleOCR-VL 正式支持，覆盖 OCR + 视觉理解场景

* ⚙️ 多副本能力增强
* 支持单张 GPU 上运行多个模型副本，显著提升资源利用率

🌐 社区版更新

📦 安装方式
* pip 安装：pip install 'xinference==1.15.0'
* Docker：拉取最新版镜像或在容器内使用 pip 更新

🆕 新模型支持
* Z-Image-Turbo
* DeepSeek-V3.2
* PaddleOCR-VL

✨ 新特性
* llama.cpp 支持 json schema structured output
* 支持单 GPU 多副本运行
* 支持使用 --device cpu 启动模型

🛠 功能增强
* 引擎不可用时提供更详细的原因说明
* GLM-4.5 增强 tool calls 支持
* vLLM structured output 参数能力增强
* 模型元数据（JSON）持续更新

🐞 Bug 修复
* 修复缓存模型管理页面缺失的问题
* 修复软链接无法完全删除的问题
* 修复虚拟环境中同名包冲突错误
* 修复多模态视频参数不生效的问题
* 修复自定义 embedding 模型注册失败的问题
* 修复 UI 复制功能与下拉框宽度异常
* 修复 Dockerfile.cu128 拼写错误

📚 文档更新
* 新增模型文档
* 补充 v1.14.0 发布说明

🏢 企业版更新

* 支持从 Xinference Model Hub 更新企业版模型列表，无需等待版本发布即可同步最新模型
* 修复昇腾（Ascend）平台相关使用问题，提升企业环境下的稳定性与可用性

参考
* 中文：https://xinference.cn/release_notes/v1.15.0.html
* 英文：https://xinference.io/release_notes/v1.15.0.html

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/390077

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

Gfast 快速开发框架 V3.3.10 版发布

平台简介基于全新 Go Frame 2.x+Vue3+Element Plus 开发的全栈前后端分离的管理系统前端采用 vue-next-admin 、Vue、Element UI。特征高生产率：几分钟即可搭建一个后台管理系统模块化：单应用多系统的模式，将一个完整的应用拆分为多个系统，后续扩展更加便捷，增加代码复用性。插件化：可通过插件的方式扩展系统功能，目前插件有：工作流引擎、自定义表单、CMS、微信公众号、在线客服、商城系统、在线考试、资产管理、活动报名、在线点餐等认证机制：采用 gftoken 的用户状态认证及 casbin 的权限认证自主研发：全部自主研发，功能完整可控面向接口开发本次更新内容：一、多租户版本已更新 1.代码生成配置页面下一步窄屏样式优化 2.优化树形雪花id 父级pid的精度 3.修复左侧菜单经典布局分割不显示子菜单 4.增加日志切割配置 5.定时任务重启失败重试,修改编辑若改了状态直接按照状态运行 6.更新casbin 缓存 redis 分布式部署登录状态同步 7.安全性更新二、MCP代码生成助手插件更新，兼容最新GFastv3....

2025-12-16

102

工具：知识库伴侣（基于Markitdown+PyMuPDF+Tesseract+多个PyTorch模型） 2.3.0 已经发布。新特性：新增embedding接口，支持文本嵌入（维度向量：384）新增rerank接口，支持文本语义重排序镜像： docker pull crpi-4auaoyyj6r36p6lb.cn-hangzhou.personal.cr.aliyuncs.com/huozige_lab/markitdown-api-lite:2.3.0 详情查看：https://gitee.com/low-code-dev-lab/markitdown-api/releases/2.3.0

2025-12-16

76

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。