让模型推理变得轻而易举 —— Xinference v 0.13.0 新版本@了你!
- 🌟 模型推理,轻而易举:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
- ⚡️ 前沿模型,应有尽有:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中!
- 🖥 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐!
- ⚙️ 接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。
- 🌐 集群计算,分布协同: 支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。
- 🔌 开放生态,无缝对接: 与流行的三方库无缝对接,包括 LangChain,LlamaIndex,Dify,以及 Chatbox。
- 新增内置支持模型 📦
- qwen2 gguf格式 📝
- gemma-2-it 💻
- transformers推理后端支持开启continuous batching(连续批处理),优化LLM同时服务多请求的吞吐。支持generate / chat / vision任务,欢迎试用。详见:https://inference.readthedocs.io/zh-cn/latest/user_guide/continuous_batching.html 📊
- 支持mac arm芯片平台下的高速推理引擎MLX 🍏
- 官方GPU镜像以vllm镜像为基础进行重构。大幅减少镜像体积,要求宿主机cuda版本12.4+和nvidia驱动版本550+。详见:https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html 🎥
- 官方镜像支持从阿里云服务中拉取。详见:https://inference.readthedocs.io/zh-cn/latest/getting_started/using_docker_image.html ☁️
- 新增更多日志模块。现在与请求相关的详细的uvicorn日志将被记录在日志文件中,同时transformers和vllm在命令行和文件中也会有更详细的日志 📑
- 修复glm4 tool call的问题 🔧
- 修复rerank接口curl和python客户端返回documents行为不一致的问题 📜
- 更新glm4v模型的版本号,修复多GPU使用等若干问题。已下载的用户删除后重新下载即可 🔄
- 修复LLM为基础的rerank计算报错的问题 💡
- 修复deepseek-vl-chat模型缺少依赖的问题 🔗
- 优化鉴权模式下的使用体验 🔐

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
vxe-table 4.7.48 已经发布,vue 表格解决方案
vxe-table 4.7.48 已经发布,vue 表格解决方案 此版本更新内容包括: 更新 ts 类型 table 渲染器支持 VxeTreeSelect 修复单元格样式问题 详情查看:https://gitee.com/xuliangzhan_admin/vxe-table/releases/4.7.48
- 下一篇
🎉 降低 DDD 实践成本 | Wow 3.10.0 发布
领域驱动|事件驱动|测试驱动|声明式设计|响应式编程|命令查询职责分离|事件溯源 官方文档:https://wow.ahoo.me/ 更新内容 特性(core): 添加RecoverAggregateAPI 以支持恢复已删除的聚合根。 特性(core): 添加generateGlobalId便捷的生成全局ID。 特性(core):SimpleServiceProvider支持Copy。 特性(test): 在测试编排fork后使用复制的ServiceProvider作为上下文,以防止不同的测试编排上下文依赖注入混乱。 特性(test):fork支持自定义新上下文ServiceProvider和CommandAggregateFactory。 特性(test): 添加functionFilter以支持单个Saga中的多个函数订阅同一事件。 简介 Wow是一个基于领域驱动设计和事件溯源的现代响应式CQRS微服务开发框架,历经多年生产环境验证。 旨在帮助开发者构建现代化的、高性能且易于维护的微服务应用程序,充分发挥领域驱动设计和事件溯源等模式优势的同时降低应用的复杂性以及实践成本。 值得一提...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启