Xinference v0.15.0 版本飞跃:自定义模型能力再升级,重塑 AI 交互体验
Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
Xinference 的功能和亮点有:
- * 🌟 模型推理,轻而易举:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
- * ⚡️ 前沿模型,应有尽有:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中!
- * 🖥 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐!
- * ⚙️ 接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。
- * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。
- * 🔌 开放生态,无缝对接:与流行的三方库无缝对接,包括 LangChain, LlamaIndex, Dify,以及 Chatbox。
- pip:pip install 'xinference==0.15.0' 💻
- Docker:拉取最新版本即可,也可以直接在镜像内用 pip 更新 🚢
- 新增内置支持模型 🤝
- 多模态 qwen2-vl-instruct 📸
- 新功能 🎉
- 重构的register逻辑:现在可以完全自助地注册一个不在内置列表中的LLM模型,register接口仅为此场景工作。注册内置的模型系列使用launch接口的model_path参数。 📝
- v0.15.0 xinference内置客户端chat接口已废弃prompt, system_prompt 和 chat_history参数,这三个参数将被messages参数替代,与openai形式保持一致。 💬
- v0.15.0 Qwen系列的react形式的tool call功能已经移除,由OpenAI API形式的tool call代替。移除qwen-chat 1代的tool call能力(不影响qwen1.5-chat和qwen2)。 🚫
- v0.15.0 已移除chatglm3。因其官方已基本不更新同时各规格接口不一致,glm系列模型推荐直接使用glm4-chat 🚫
- MiniCPM-V-2.6 支持transformers引擎的continuous batching 📈
- image2image/inpainting 支持unpad 🎨
- 兼容openai 库版本 >=1.40 📚
- BUG修复 🐜
- 修复自定义模型文件导致的无法启动问题 💻
- 修复镜像由于entrypoint无法启动的问题 🚢
- 修复rerank模型 max_length设置的问题 📊
- 修复rerank模型的输出中rerank token的统计问题 📊
- 修复embedding模型中embedding token的统计问题,同时优化显存占用 💻
- 修复日志异常的一些问题 📝
- 修复vllm性能回退的问题 📊
- UI 🎨
- 新的注册模型界面和逻辑 📝
- 即将废弃: 🕰️
- v0.16.0 transformers引擎的continuous batching将代替现有的推理逻辑成为默认推理行为。 🔜
我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持,也欢迎更多使用者和开发者参与体验和使用 Xinference。
欢迎您在 https://github.com/xorbitsai/inference 给我们一个 星标,这样你就可以在 GitHub 上及时收到每个新版本的通知。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Rust 日志库 tklog v0.2.0 :支持设置日志级别独立日志文件
tklog是rust高性能结构化日志库,支持同步日志,异步日志,支持自定义日志的输出格式,支持按时间,按文件大小分割日志文件,支持日志文件压缩备份,支持官方日志库标准API,支持mod独立参数设置,支持日志level独立参数设置 简介 Github地址 仓库地址 《tklog与log4rs 的基准测试》 v0.2.0 版本更新 tklog 支持日志级别所有独立参数设置 tklog 通过 set_level_option() 设置日志级别的独立日志参数 set_level_option() 接收任意实现 OptionTrait特征的对象 示例1 :参数LevelOption对象,可以设置日志格式化输出 #[test] fn testlog() { //将Info级别的日志格式设置为 Format::LevelFlag //将Fatal级别的日志格式设置为 Format::LevelFlag | Format::Date LOG.set_level_option(LEVEL::Info, LevelOption { format: Some(Format::LevelFlag...
- 下一篇
首期!deepin 技术双周报上线,最新进展和未来双周计划
查看原文 deepin 技术双周报首期上线,我们会简单列出 deepin 各个小组在过去两周的相关工作进展,也会阐述未来两周的大致规划,以便关注 deepin 的朋友们了解相关详情并参与进来。 DDE DDE 相关项目已针对 deepin 23 切出对应的维护分支,接下来的一段时间内,23 版本将仅推送缺陷修复而不涵盖新的特性,而特性的研发则会在 Master 分支进行。 进展: dde-shell 初步进行应用程序数据整合,尚在进行中 迁移 dde-shell 提供的 launcher 图标组件至 dde-launchpad,尚在进行中 通知中心与横幅通知显示 QML 化,尚在进行中 控制中心准备着手进行 QML 化改造 计划: 对上述“进展”部分的内容进行持续开发 系统研发 更新部分系统软件包、解决一些软件包构建失败问题。 进展: 更新 egl-wayland 至1.1.15版本 解决 x11-apps 崩溃问题 解决交叉编译工具链编译问题,尚在进行中 集成cpu微码包amd64-microcode 3.20240820.1版本intel-microcode 3.20240813...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- CentOS8编译安装MySQL8.0.19
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- CentOS关闭SELinux安全模块
- Linux系统CentOS6、CentOS7手动修改IP地址
- MySQL8.0.19开启GTID主从同步CentOS8
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS6,7,8上安装Nginx,支持https2.0的开启
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池