Omni-Infer v0.1.0 已经发布,超大规模 MoE 模型推理加速技术
Omni-Infer v0.1.0 已经发布,超大规模 MoE 模型推理加速技术
此版本更新内容包括:
v0.1.0
这是我们的第一个正式开源版本
核心特性
- PD分离
- MTP
- 入图
- 图缓存
- omni-attention
- omni-placement(静态)
其他优化
- Tokenizer进程池化
- Schuduer异步调度
- PD分离多API Server架构
- 昇腾亲和通信优化
支持模型列表
模型 | 部署形态 |
---|---|
DeepSeek-R1 | PD分离 |
Qwen2.5系列 | 混布(TP>=1 DP=1) |

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
仓颉编程语言正式发布首个长期支持版本 (LTS):Cangjie 1.0.0
仓颉编程语言的首个长期支持(Long-Term Support, LTS)版本已正式发布,版本号为Cangjie 1.0.0。版本包含了仓颉应用开发必须的能力,包括编译器,运行时,标准库,和工具链。 仓颉编程语言是一种面向全场景应用开发的通用编程语言,可以兼顾开发效率和运行性能,并提供良好的编程体验,主要具有如下特点: 多后端支持:仓颉编程语言支持 CJNative 和 CJVM 两种后端。其中 CJNative 后端将代码编译为原生二进制代码,直接在操作系统层面上运行;CJVM 后端将代码编译为字节码,基于 VM(虚拟机)进行运行。本次发布仅提供 CJNative 后端 SDK,CJVM 后端 SDK 敬请期待。 语法简明高效:仓颉编程语言提供了一系列简明高效的语法,旨在减少冗余书写、提升开发效率,例如插值字符串、主构造函数、Flow 表达式、match和重导出等语法,让开发者可以用较少编码表达相关逻辑。 多范式编程:仓颉编程语言支持函数式、命令式和面向对象等多范式编程,融合了高阶函数、代数数据类型、模式匹配、泛型等函数式语言的先进特性,还有封装、接口、继承、子类型多态等支持模块化开...
- 下一篇
k8m v0.0.141 已经发布,轻量级的 Kubernetes 仪表板
k8m v0.0.141 已经发布,轻量级的 Kubernetes 仪表板 此版本更新内容包括: 更新内容 refactor(dynamic): 优化YAML解析逻辑,直接使用map接收解析结果 fix(I18n): 修复翻译通道设置为client.edge refactor(I18nTranslateProvider): 移除硬编码翻译改用导入的英文翻译配置 feat(i18n): 重新组织翻译提供者组件,提升代码结构和可维护性 refactor(i18n): 将翻译逻辑提取为独立组件以提升可维护性 refactor(i18n): 优化翻译初始化逻辑,移除冗余代码 fix(ui): 修复语言切换功能并设置默认语言 feat(工具栏): 添加语言切换功能并调整浮动工具栏位置 feat(工具栏): 添加退出按钮图标并支持多语言切换功能 feat(i18n): 添加i18n-jsautotranslate依赖并实现自动翻译功能 style(WebSocketChatGPT): 新增AI对话yaml使用指引 ci: 统一 GitHub Actions 工作流中的数组格式和版本变量 style...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS8安装Docker,最新的服务器搭配容器使用
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- CentOS8编译安装MySQL8.0.19
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Hadoop3单机部署,实现最简伪集群
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7,8上快速安装Gitea,搭建Git服务器