阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型
阿里巴巴宣布开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B,该模型在基础能力评估中与 Meta-Llama3-70B 相媲美,在 Chat 评估中表现出色,包括 MT-Bench 和 AlpacaEval 2.0。
据介绍,Qwen1.5-110B 与其他 Qwen1.5 模型相似,采用了相同的 Transformer 解码器架构。它包含了分组查询注意力(GQA),在模型推理时更加高效。该模型支持 32K tokens 的上下文长度,同时它仍然是多语言的,支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。
阿里 Qwen1.5-110B 模型与最近的 SOTA 语言模型 Meta-Llama3-70B 以及 Mixtral-8x22B 进行了比较,结果如下:
上述结果显示,新的 110B 模型在基础能力方面至少与 Llama-3-70B 模型相媲美。在这个模型中,阿里巴巴没有对预训练的方法进行大幅改变,因此他们认为与 72B 相比的性能提升主要来自于增加模型规模。
阿里巴巴表示,与之前发布的 72B 模型相比,在两个 Chat 模型的基准评估中,110B 表现显著更好。评估结果的持续改善表明,即使在没有大幅改变后训练方法的情况下,更强大、更大规模的基础语言模型也可以带来更好的 Chat 模型。
最后,阿里方面表示,Qwen1.5-110B 是 Qwen1.5 系列中规模最大的模型,也是该系列中首个拥有超过 1000 亿参数的模型。它在与最近发布的 SOTA 模型 Llama-3-70B 的性能上表现出色,并且明显优于 72B 模型。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
中国移动建成全球运营商最大单体智算中心
4月28日,中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心(呼和浩特),目前已投产使用。 该智算中心填补了我国人工智能广泛应用所需算力的巨大缺口,快速赋能交通、医疗、教育、能源、金融等行业大模型训练,为人工智能创新发展提供坚实基座与强劲引擎,带动我国人工智能产业发展壮大。 据了解,该智算中心项目入选“2023年度央企十大超级工程”,部署约2万张AI加速卡,AI芯片国产化率超85%,智能算力规模高达6.7EFLOPS(每秒670亿亿次浮点运算)。 近年来,中国移动始终致力于推进算力网络发展,将智算建设融入算力网络“4+N+31+X”体系,积极布局智算能力,按照“集中训练、分布推理,统一管控、弹性调度,自主可控、绿色低碳”的原则,统筹规划技术领先、绿色节能、服务全局的“N+X”智算中心布局,加快建设智算信息基础设施和构建全栈智算产品体系。 中国移动智算中心(呼和浩特)聚焦“连接+算力+能力”的新型信息服务体系,采用业界先进的计算、存储和网络架构,规模引入GPU扣卡模组、高速无损网络、冷板液冷等多项新技术,支持万张AI加速卡互联并行训练。中国移动从多样化算力生态、全栈智算...
- 下一篇
Zadig 通过鲲鹏技术认证,加速国产行业数智跃迁
近日,KodeRover 公司自主研发的云原生 DevOps 平台 Zadig V2.2.0 与华为技术有限公司 Kunpeng 920 Taishan 200 完成并通过相互兼容性测试认证。此次双方强强联合,为国产化替代自主可控补足了中立云原生 DevOps 平台这重要一环。 生态开放,合作共赢,未来可期 当今时代,新一轮科技革命和产业变革席卷全球,数字经济已经成为全球最重要的产业基础和经济形态。数字经济的蓬勃发展,加速了经济社会各领域深刻变革,成为全球经济社会发展的新动能。 鲲鹏是华为技术有限公司推出的基于 ARM 架构的服务器处理器,通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计,具有 高性能、高吞吐、高集成、高效能等特点。 Zadig 是 KodeRover 公司推出的面向开发者的自助式云原生 DevOps 平台,旨在协助产研团队实现云原生持续交付,帮助企业以 更先进、更经济、更安全、更轻便的方式实现数字化研发转型。 先进理念,多云异构,数智跃迁 Zadig 自开源以来,已在国内获得广泛认可,安装量达 3 万,日活跃用户 15 万,全球部...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS关闭SELinux安全模块
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16
- Linux系统CentOS6、CentOS7手动修改IP地址
- CentOS7编译安装Gcc9.2.0,解决mysql等软件编译问题
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- SpringBoot2整合Redis,开启缓存,提高访问速度
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8
- Mario游戏-低调大师作品