🚀 Xinference v1.11.0.post1 更新来了！ 🧠新增模型支持...，速览！-低调大师

🚀 Xinference v1.11.0.post1 更新来了！ 🧠新增模型支持...，速览！

2025-10-22 127

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。 Xinference 的功能和亮点有：

🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
⚡ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
⚙ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

🚀 Xinference v1.11.0.post1 更新日志

✅ 本次亮点

🧠 新增模型支持 * Qwen3-4B Instruct / Thinking * MiniCPM-V 4.5
⚙️ VLLM 引擎增强 * 支持多模型加载（multi-model） —— 包括 Omni、图像、视频、音频等多模态模型类型 * 支持 AWQ 8bit 量化 * CUDA 12.8 镜像中 VLLM 升级至 0.10.2
🖼️ OpenAI Image Edit API 支持 * 可直接兼容 images/edits 接口，提升图像编辑与生成类模型的兼容性。

🌐 社区版更新

📦 安装方式

pip 安装：pip install 'xinference==1.11.0.post1’
Docker 使用：拉取最新版镜像或在容器中使用 pip 更新

🆕 新模型支持

Qwen3-4B Instruct / Thinking
MiniCPM-V 4.5

✨ 新特性

OpenAI image edit API 支持
VLLM 支持多模型加载（含 Omni、图像、视频、音频模型）
VLLM 支持 AWQ 8bit 量化
CUDA 12.8 镜像升级 VLLM 至 0.10.2

🛠 功能增强与修复

修复 UI 中 n_gpu_layers=-1 时按钮失效的问题
修复 CI 构建及 CUDA 12.8 Dockerfile 问题
同步多模态模型 JSON（音频、图像、视频、LLM）

🏢 企业版更新

新增 Kubernetes Operator 初步支持：支持模型副本自动调度与生命周期管理，为集群化推理提供统一接口
稳定性增强：修复了一些已知问题，整体运行更加稳定可靠

参考中文：https://xinference.cn/release_notes/v1.11.0.post1.html 英文：https://xinference.io/release_notes/v1.11.0.post1.html

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/378760/xinference-1-11-0-post1

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

deepin 多款宝藏应用推荐！免费好用，创意十足，效率 UP！

deeipn 应用商店里藏着不少宝藏软件，帮你轻松搞定日常使用的方方面面。今天就来推荐几款功能强大的办公效率工具，让你拥有流畅高效的工作体验。无需东奔西找，打开 deepin 应用商店，搜索安装，立刻提升工作效率！ uyouToDo · deepin 极致简约的待办清单软件 ◉应用简介你是否也曾被琐碎的任务淹没，尝试过多种待办工具，却总被广告或臃肿的功能劝退？uyouToDo 是一款由deepin(深度)社区用户 @Anthony Lu打造的完全免费、无广告的待办事项管理工具，致力于为你还原一个清爽高效的任务管理体验。适配CPU 架构：AMD64、ARM64 ◉特性与优势极简视觉设计：界面采用清新的毛玻璃模糊效果，致敬经典的锤子便签风格。提供「标准模式」和沉浸感十足的「便签纸模式」，并可一键开启更轻量的「简易模式」。强大的任务管理：支持自由创建任务、自定义分类（工作、学习、生活），可为任务设置优先级、截止日期提醒和重复规则，并实时跟踪任务进度。数据同步与备份：登录同一账号，即可在电脑、手机等多设备间实时同步任务数据。支持手动本地备份与一键清理已完成任务，保障数据安全，保持界...

2025-10-22

134

点击关注，了解更多实时数仓领域前沿资讯与技术实践！亲爱的社区小伙伴们，我们很高兴地向大家宣布，近期我们迎来了 Apache Doris 4.0 版本的正式发布，欢迎大家下载使用体验。本次发布围绕 “AI 驱动、搜索增强、离线提效” 三大核心方向，新增向量索引、AI 函数等关键特性，完善搜索功能矩阵，优化离线计算稳定性与资源利用率，并通过多项底层改进提升查询性能与数据质量，为用户构建更高效、更灵活的企业级数据分析平台。在 4.0 版本的研发过程中，有超过 200 名贡献者为 Apache Doris 提交了 9000+ 个优化与修复。在此向所有参与版本研发、测试和需求反馈的贡献者们表示最衷心的感谢。 GitHub 下载：https://github.com/apache/doris/releases 官网下载：https://doris.apache.org/download 一、AI 能力深度集成，开启智能分析新范式随着大模型与向量检索技术在企业级场景的加速落地与深度渗透，本次 Doris 版本迭代将重点强化 AI 原生支持能力。通过向量索引技术，高效融合企业的结构化与非结构化...

2025-10-22

170

资源下载

更多资源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。

WebStorm

WebStorm 是jetbrains公司旗下一款JavaScript 开发工具。目前已经被广大中国JS开发者誉为“Web前端开发神器”、“最强大的HTML5编辑器”、“最智能的JavaScript IDE”等。与IntelliJ IDEA同源，继承了IntelliJ IDEA强大的JS部分的功能。