阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型-低调大师

阿里巴巴开源 1100 亿参数 Qwen1.5-110B 模型

2024-04-28 308

阿里巴巴宣布开源 Qwen1.5 系列首个千亿参数模型 Qwen1.5-110B，该模型在基础能力评估中与 Meta-Llama3-70B 相媲美，在 Chat 评估中表现出色，包括 MT-Bench 和 AlpacaEval 2.0。

据介绍，Qwen1.5-110B 与其他 Qwen1.5 模型相似，采用了相同的 Transformer 解码器架构。它包含了分组查询注意力（GQA），在模型推理时更加高效。该模型支持 32K tokens 的上下文长度，同时它仍然是多语言的，支持英、中、法、西、德、俄、日、韩、越、阿等多种语言。

阿里 Qwen1.5-110B 模型与最近的 SOTA 语言模型 Meta-Llama3-70B 以及 Mixtral-8x22B 进行了比较，结果如下：

上述结果显示，新的 110B 模型在基础能力方面至少与 Llama-3-70B 模型相媲美。在这个模型中，阿里巴巴没有对预训练的方法进行大幅改变，因此他们认为与 72B 相比的性能提升主要来自于增加模型规模。

阿里巴巴表示，与之前发布的 72B 模型相比，在两个 Chat 模型的基准评估中，110B 表现显著更好。评估结果的持续改善表明，即使在没有大幅改变后训练方法的情况下，更强大、更大规模的基础语言模型也可以带来更好的 Chat 模型。

最后，阿里方面表示，Qwen1.5-110B 是 Qwen1.5 系列中规模最大的模型，也是该系列中首个拥有超过 1000 亿参数的模型。它在与最近发布的 SOTA 模型 Llama-3-70B 的性能上表现出色，并且明显优于 72B 模型。

微信关注我们

原文链接：https://www.oschina.net/news/289942/qwen-1-5-110b

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

中国移动建成全球运营商最大单体智算中心

4月28日，中国移动正式对外发布全球运营商最大单体智算中心——中国移动智算中心（呼和浩特），目前已投产使用。该智算中心填补了我国人工智能广泛应用所需算力的巨大缺口，快速赋能交通、医疗、教育、能源、金融等行业大模型训练，为人工智能创新发展提供坚实基座与强劲引擎，带动我国人工智能产业发展壮大。据了解，该智算中心项目入选“2023年度央企十大超级工程”，部署约2万张AI加速卡，AI芯片国产化率超85%，智能算力规模高达6.7EFLOPS（每秒670亿亿次浮点运算）。近年来，中国移动始终致力于推进算力网络发展，将智算建设融入算力网络“4+N+31+X”体系，积极布局智算能力，按照“集中训练、分布推理，统一管控、弹性调度，自主可控、绿色低碳”的原则，统筹规划技术领先、绿色节能、服务全局的“N+X”智算中心布局，加快建设智算信息基础设施和构建全栈智算产品体系。中国移动智算中心（呼和浩特）聚焦“连接+算力+能力”的新型信息服务体系，采用业界先进的计算、存储和网络架构，规模引入GPU扣卡模组、高速无损网络、冷板液冷等多项新技术，支持万张AI加速卡互联并行训练。中国移动从多样化算力生态、全栈智算...

2024-04-28

262

近日，KodeRover 公司自主研发的云原生 DevOps 平台 Zadig V2.2.0 与华为技术有限公司 Kunpeng 920 Taishan 200 完成并通过相互兼容性测试认证。此次双方强强联合，为国产化替代自主可控补足了中立云原生 DevOps 平台这重要一环。生态开放，合作共赢，未来可期当今时代，新一轮科技革命和产业变革席卷全球，数字经济已经成为全球最重要的产业基础和经济形态。数字经济的蓬勃发展，加速了经济社会各领域深刻变革，成为全球经济社会发展的新动能。鲲鹏是华为技术有限公司推出的基于 ARM 架构的服务器处理器，通过优化分支预测算法、提升运算单元数量、改进内存子系统架构等一系列微架构设计，具有高性能、高吞吐、高集成、高效能等特点。 Zadig 是 KodeRover 公司推出的面向开发者的自助式云原生 DevOps 平台，旨在协助产研团队实现云原生持续交付，帮助企业以更先进、更经济、更安全、更轻便的方式实现数字化研发转型。先进理念，多云异构，数智跃迁 Zadig 自开源以来，已在国内获得广泛认可，安装量达 3 万，日活跃用户 15 万，全球部...

2024-04-24

273

资源下载

更多资源

优质分享App

近一个月的开发和优化，本站点的第一个app全新上线。该app采用极致压缩，本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。