APUS 联合新旦智能开源国内首个千亿级 MoE 架构大模型
4月2日,APUS发布官方公告,称其与战略合作伙伴新旦智能联合训练、研发的千亿MoE(Mixture of Experts)架构大模型——APUS-xDAN-4.0(MoE)在GitHub上正式开源。
开源地址:https://github.com/shootime2021/APUS-xDAN-4.0-moe
据介绍,APUS-xDAN-4.0(MoE)是国内首个千亿以上参数MoE架构的开源大模型,参数规模为1360亿,这也是目前国内参数规模最大的开源模型。此前国内开源的大模型中,参数规模最大的是阿里720亿参数的千问72B,参数规模为720亿。
此外,APUS-xDAN-4.0(MoE)还是国内首个支持在4090低端算力上训练的千亿参数开源大模型,通过MoE架构和算法优化实现了对低端算力芯片的适配。模型架构如下:
APUS-xDAN-4.0(MoE)与其他模型的性能对比:

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
阿里云:以后公司 20% 代码由通义灵码编写
阿里云正在内部全面推行 AI 编程,使用通义灵码辅助程序员写代码、读代码、查 BUG、优化代码等。阿里云还专门给通义灵码分配了一个正式的员工工号 ——AI001。 阿里云表示:“以后公司20%的代码都由通义灵码编写,程序员将更加专注于系统设计和核心业务开发。” 据介绍,传统开发模式下,程序员每天需要耗费大量精力编写重复性代码、调试优化、编写代码注释等基础工作,大幅挤压了核心业务代码编写的时间。 在阿里云内部,通义灵码已在各个开发环节担任代码助理角色。以 API 开发测试工作为例,通义灵码可将数十分钟的人工编写测试耗时缩短到秒级,节省程序员 70% 以上的测试代码工作量。接下来,阿里云将在内部 JetBrains IDEs、Visual Studio Code 等开发工具中全面配置通义灵码插件,供所有员工使用。 目前,通义灵码已熟练掌握 Java、Python、Go、JavaScript、TypeScript、C / C++、C# 等 200 多种编程语言。通义灵码由阿里云和通义实验室联合开发,目前下载量超 200 万。
- 下一篇
「天工 SkyMusic」音乐大模型今日启动邀测
4月2日,昆仑万维AI音乐生成大模型「天工SkyMusic」即日起面向社会开启免费邀测。 本轮邀测将开放1000个免费名额,面向行业媒体、专家、以及感兴趣的音乐从业者开放,用户可扫描文后二维码或通过网页填写申请。「天工SkyMusic」正式版也将在4月17日随「天工3.0」面向全社会免费开放。 申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md 公告指出,「天工SkyMusic」基于昆仑万维「天工3.0」超级大模型打造,是目前国内唯一公开可用的AI音乐生成大模型。 采用音乐音频领域类Sora模型架构,Large-scale Transformer 负责谱曲,来学习 Music Patches 的上下文依赖关系,同时完成音乐可控性;Diffusion Transformer 负责演唱,通过LDM让Music Patches被还原成高质量音频,使得「天工SkyMusic」能够支持生成80秒44100Hz 采样率双声道立体声歌曲。 这套模型架构在处理视频、音频和音乐领域效果极佳。昆仑万维团...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7设置SWAP分区,小内存服务器的救世主
- Mario游戏-低调大师作品
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- 2048小游戏-低调大师作品
- MySQL8.0.19开启GTID主从同步CentOS8