Xinference 0.14.1发布:文生视频 CogVideoX 等新功能齐上阵!
Xorbits Inference(Xinference)是一个 性能强大且功能全面的 分布式 推理框架。可用于大语言模型(LLM),语音识别模型,多模态模型等各种模型的推理。通过 Xorbits Inference,你可以轻松地 一键部署你自己的模型或内置的前沿开源模型 - https://github.com/xorbitsai/inference。无论你是研究者,开发者,或是数据科学家,都可以通过 Xorbits Inference 与最前沿的 AI 模型,发掘更多可能。
Xinference 的功能和亮点有:
- * 🌟 模型推理,轻而易举:大语言模型,语音识别模型,多模态模型的部署流程被大大简化。一个命令即可完成模型的部署工作。
- * ⚡️ 前沿模型,应有尽有:框架内置众多中英文的前沿大语言模型,包括 baichuan,chatglm2 等,一键即可体验!内置模型列表还在快速更新中!
- * 🖥 异构硬件,快如闪电:通过 ggml,同时使用你的 GPU 与 CPU 进行推理,降低延迟,提高吞吐!
- * ⚙️ 接口调用,灵活多样:提供多种使用模型的接口,包括 OpenAI 兼容的 RESTful API(包括 Function Calling),RPC,命令行,web UI 等等。方便模型的管理与交互。
- * 🌐 集群计算,分布协同:支持分布式部署,通过内置的资源调度器,让不同大小的模型按需调度到不同机器,充分使用集群资源。
- * 🔌 开放生态,无缝对接:与流行的三方库无缝对接,包括 LangChain, LlamaIndex, Dify,以及 Chatbox。
Xinference 0.14.1
🎉 Xinference 0.14.1 发布,全新的文生视频 CogVideoX 支持登场!本周爆火的文生图模型 FLUX.1 系列,支持中文提示词的快手生图,还有 SenseVoice 语音识别,都在本版本得到支持。
图一、图二:由FLUX.1-dev生成
- 新增内置支持模型 📦
- flux.1-schnell 和 flux.1-dev 🌟
- llama-3.1-instruct 405B 🦙
- kolors 图像模型 🎨
- 新增视频模型类别和视频模型 CogVideoX 🎥
- 多模态模型:MiniCPM-v-2_6 🌐
- SenseVoice 语音模型 🎤
- 新功能 🚀
- 大幅提升 sglang 引擎的性能和吞吐 ⚡
- 分布式下允许先启动 worker 再启动 supervisor 🖥️🔄
- BUG 修复 🐛
- 优化 vllm stop 逻辑,解决某些情况下 vllm 引擎停止后资源不释放的问题 🛠️
- 修复自定义 embedding 的 launch 问题 🔧
- 优化 500 内部错误的错误信息展示 📝
- UI 相关 💻
- 修复 launch 页面 model_path 选项带来的问题 🛠️
- 即将废弃 ⏳
- v0.15.0 中,Xinference 内置客户端 chat 接口即将废弃 prompt, system_prompt 和 chat_history 参数,改为使用 messages 参数,与 OpenAI 形式保持一致 💬
我们感谢每一位参与的社区伙伴对 Xinference 的帮助和支持,也欢迎更多使用者和开发者参与体验和使用 Xinference。
欢迎您在 https://github.com/xorbitsai/inference 给我们一个 星标,这样你就可以在 GitHub 上及时收到每个新版本的通知。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
🍋 分布式运维监控平台 WGCLOUD v3.5.3 英文版本正式发布
WGCLOUD是一款集成度较高的分布式运维监控平台,具有集群监控,易部署、易上手使用、轻量、高效、自动化等特点,server 端基于springboot 开发,agent 端使用 go 编写。核心模块包括:主机系统信息监控,CPU 监控,CPU 温度监控,内存监控,网络流量监控,磁盘 IO 监控,磁盘空间监测,系统负载监控,硬盘 smart 健康检测,应用进程监控,端口监控,docker 监控,日志文件监控,文件防篡改保护,数据可视化监控,自动生成拓扑图、大屏可视化,数通设备监测,服务接口监测,K8S 监测,计划任务, 设备账号管理,web ssh ,指令下发,告警信息(邮件、钉钉、微信等)推送 码云仓库:https://gitee.com/wanghouhou/wgcloud GITHUB 仓库:https://github.com/tianshiyeben/wgcloud WGCLOUD 唯一官网:http://www.wgstart.com WGCLOUD 支持监测的操作系统平台 支持监测 Linux:Debian,RedHat,CentOS,Ubuntu,Fedora,SUSE...
- 下一篇
国产数据库管理工具 CloudDM v2.8.1 发布,后台任务功能优化和问题修复
CloudDM 个人版是ClouGence公司推出的一款一站式多数据源开发管理工具,使用它可以方便地访问和管理MySQL、Oracle、PostgreSQL、阿里云 RDS、Greenplum、TiDB、Redis、StarRocks、Doris、SelectDB、SQL SERVER、ClickHouse、OceanBase 、PolarDB-X 、IBM Db2 等多种不同类型的数据库。通过 CloudDM 丰富的数据源支持可以避免在多个专业工具之间切换,从而提高工作效率。 它是本地化的应用程序,没有后台进程。和DataGrip、Navicat一样在安装完成后,只需要双击应用程序图标,便可以方便的管理位于本地计算机或远程计算机上的数据库。已支持Windows和MacOS、Linux三个操作系统。 本期亮点 后台任务功能 更新内容 [新增] 新增 添加数据源后,自动开启查询功能,无需手动再开启 新增 右下角后台任务列表增加刷新按钮,可随时更新列表信息 [优化] 优化 删除数据源提示 优化 MySQL 数据生成和压力测试功能性能,使用更稳定 优化 压力测试功能进度显示,目前进度与运行时...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器
- CentOS6,7,8上安装Nginx,支持https2.0的开启