Xinference v0.14.2：多模态新突破，预告接口升级-低调大师

Xinference v0.14.2：多模态新突破，预告接口升级

2024-08-20 291

Xorbits Inference（Xinference）是一个性能强大且功能全面的分布式推理框架。可用于大语言模型（LLM），语音识别模型，多模态模型等各种模型的推理。通过 Xorbits Inference，你可以轻松地一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者，开发者，或是数据科学家，都可以通过 Xorbits Inference 与最前沿的 AI 模型，发掘更多可能。

Xinference 的功能和亮点有：

* 🌟 模型推理，轻而易举：大语言模型，语音识别模型，多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
* ⚡️ 前沿模型，应有尽有：框架内置众多中英文的前沿大语言模型，包括 baichuan，chatglm2 等，一键即可体验！内置模型列表还在快速更新中！
* 🖥 异构硬件，快如闪电：通过 ggml，同时使用你的 GPU 与 CPU 进行推理，降低延迟，提高吞吐！
* ⚙️ 接口调用，灵活多样：提供多种使用模型的接口，包括 OpenAI 兼容的 RESTful API（包括 Function Calling），RPC，命令行，web UI 等等。方便模型的管理与交互。
* 🌐 集群计算，分布协同：支持分布式部署，通过内置的资源调度器，让不同大小的模型按需调度到不同机器，充分使用集群资源。
* 🔌 开放生态，无缝对接：与流行的三方库无缝对接，包括 LangChain， LlamaIndex， Dify，以及 Chatbox。

Xinference v0.14.2 发布 🎉

🎉 新增内置支持模型
- 🤖 gemma-2-it 2b
- 🤖 internlm2.5-chat 1.8b / 20b
- 📸 多模态模型：internvl2，vllm支持internvl2，支持了 InternVL 和 InternVL2 的流式请求，以及用量统计
🎊 新功能
- 🔍 vllm和sglang支持FP8格式
- 📹 MiniCPM v2.6 支持视频理解功能
- 👋 移除Chatglm3 tool call
- 👋 移除一些过时的模型
- 👋 移除对ggmlv3格式的支持
🐜 BUG修复
- 🛠️ 修复glm4自定义注册问题
📱 UI相关
- 🚫 修复某些情况下UI界面无限卡在登录页面的问题
⚠️ 即将废弃：
- 📣 v0.15.0 xinference内置客户端chat接口即将废弃prompt, system_prompt 和 chat_history参数，这三个参数将被messages参数替代，与openai形式保持一致。

我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持，也欢迎更多使用者和开发者参与体验和使用 Xinference。

欢迎您在 https://github.com/xorbitsai/inference 给我们一个星标，这样你就可以在 GitHub 上及时收到每个新版本的通知。

微信关注我们

原文链接：https://www.oschina.net/news/307894/xinference-0-14-2-released

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

RustDesk 1.3.0 发布，远程桌面

RustDesk 1.3.0 版本发布，https://github.com/rustdesk/rustdesk/releases/tag/1.3.0 新加剪贴板多格式支持, html/rtf (#8733) 发送剪贴板字符 (#5451) 活动标签边框(#8832) MSI 创建桌面和开始菜单快捷方式的选项 (#8829) 通过命令行将客户端添加到地址簿/标签(#7866) 通用apk, ARM64 / ARM32 / X86_64 (#8941) PIN 解锁 (#7656) 信任当前设备2FA 选项 (#8513) 在文件传输窗口中重命名文件和文件夹(#7758) 修改新连接后保持窗口位置(#8834) Vcpkg ffmpeg (#8764) 在 Linux 上删除 --tray 的自动启动条目(#4863) 在 Android 上使用 JNI MediaCodec 支持的硬件编解码器，这可能会解决一些等待图像的问题(#8985) 断开连接时删除虚拟显示器(#8044) 修复左右滚轮反转(#1169) 存占用巨大(#8883) 音频延迟累积(#534) Sciter 与 ...

2024-08-20

341

Solon v2.9.0-RC 发布，具体更新内容包括：新增 solon.cloud.gateway 插件添加 solon.data 配置节solon.dataSources（用于自动构建数据源）添加 solon.docs 配置节solon.docs（用于自动构建文档摘要）添加 solon.view.prefix 配置项支持 "file:" 前缀（支持体外目录）添加 solon.scheduling.simple SimpleScheduler::isStarted 方法添加 solon@Condition(onBean, onBeanName)条件属性添加 solon.validation ValidUtils 工具类添加 solon LifecycleBean:postStart 方法添加 solon MethodInterceptor 接口，替代 Interceptor（旧接口保留）添加 solon.net.httputils 扩展机制，并与 solon.cloud 自动整合添加 solon.net.httputils HttpResponse::heade...

2024-08-20

341

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。