Xinference v0.14.2:多模态新突破,预告接口升级
Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
Xinference 的功能和亮点有:
- * 🌟 模型推理,轻而易举:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
- * ⚡️ 前沿模型,应有尽有:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中!
- * 🖥 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐!
- * ⚙️ 接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。
- * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。
- * 🔌 开放生态,无缝对接:与流行的三方库无缝对接,包括 LangChain, LlamaIndex, Dify,以及 Chatbox。
Xinference v0.14.2 发布 🎉
- 🎉 新增内置支持模型
- 🤖 gemma-2-it 2b
- 🤖 internlm2.5-chat 1.8b / 20b
- 📸 多模态模型:internvl2,vllm支持internvl2,支持了 InternVL 和 InternVL2 的流式请求,以及用量统计
-
- 🎊 新功能
- 🔍 vllm和sglang支持FP8格式
- 📹 MiniCPM v2.6 支持视频理解功能
- 👋 移除Chatglm3 tool call
- 👋 移除一些过时的模型
- 👋 移除对ggmlv3格式的支持
-
- 🐜 BUG修复
- 🛠️ 修复glm4自定义注册问题
-
- 📱 UI相关
- 🚫 修复某些情况下UI界面无限卡在登录页面的问题
-
- ⚠️ 即将废弃:
- 📣 v0.15.0 xinference内置客户端chat接口即将废弃prompt, system_prompt 和 chat_history参数,这三个参数将被messages参数替代,与openai形式保持一致。
-
我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持,也欢迎更多使用者和开发者参与体验和使用 Xinference。
欢迎您在 https://github.com/xorbitsai/inference 给我们一个 星标,这样你就可以在 GitHub 上及时收到每个新版本的通知。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
RustDesk 1.3.0 发布,远程桌面
RustDesk 1.3.0 版本发布,https://github.com/rustdesk/rustdesk/releases/tag/1.3.0 新加 剪贴板多格式支持, html/rtf (#8733) 发送剪贴板字符 (#5451) 活动标签边框(#8832) MSI 创建桌面和开始菜单快捷方式的选项 (#8829) 通过命令行将客户端添加到地址簿/标签(#7866) 通用apk, ARM64 / ARM32 / X86_64 (#8941) PIN 解锁 (#7656) 信任当前设备2FA 选项 (#8513) 在文件传输窗口中重命名文件和文件夹(#7758) 修改 新连接后保持窗口位置(#8834) Vcpkg ffmpeg (#8764) 在 Linux 上删除 --tray 的自动启动条目(#4863) 在 Android 上使用 JNI MediaCodec 支持的硬件编解码器,这可能会解决一些等待图像的问题(#8985) 断开连接时删除虚拟显示器(#8044) 修复 左右滚轮反转(#1169) 存占用巨大(#8883) 音频延迟累积(#534) Sciter 与 ...
- 下一篇
🎉 Solon v2.9.0-RC 发布
Solon v2.9.0-RC 发布,具体更新内容包括: 新增 solon.cloud.gateway 插件 添加 solon.data 配置节solon.dataSources(用于自动构建数据源) 添加 solon.docs 配置节solon.docs(用于自动构建文档摘要) 添加 solon.view.prefix 配置项支持 "file:" 前缀(支持体外目录) 添加 solon.scheduling.simple SimpleScheduler::isStarted 方法 添加 solon@Condition(onBean, onBeanName)条件属性 添加 solon.validation ValidUtils 工具类 添加 solon LifecycleBean:postStart 方法 添加 solon MethodInterceptor 接口,替代 Interceptor(旧接口保留) 添加 solon.net.httputils 扩展机制,并与 solon.cloud 自动整合 添加 solon.net.httputils HttpResponse::heade...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS7设置SWAP分区,小内存服务器的救世主
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS7安装Docker,走上虚拟化容器引擎之路
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Hadoop3单机部署,实现最简伪集群