通义旗舰模型 Qwen-Max 升级,性能接近 GPT-4o
阿里云CTO周靖人在2024云栖大会上宣布,通义旗舰模型Qwen-Max已经进行了全方位的升级,性能接近GPT-4。
通义官网和通义APP的后台模型均已切换为Qwen-Max,继续免费为所有用户提供服务。用户也可通过阿里云百炼平台调用Qwen-Max的API。
相比上一代模型,Qwen-Max在训练中使用了更多的训练数据、更大的模型规模、更强的人类对齐,最终达到了更高的智能水平。在MMLU-Pro、MATH、GSM8K、MBPP、MultiPL-E、LiveCodeBench等十多个权威基准上,Qwen-Max表现接近GPT-4o;特别是在数学能力和代码能力方面,Qwen-Max甚至超越了GPT-4。
相比2023年4月的初代通义千问大模型,Qwen-Max的理解能力提升46%、数学能力提升75%、代码能力提升102%、幻觉抵御能力提升35%、指令遵循能力提升105%,模型与人类偏好的对齐水平提升了700%以上。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
“革命性”「Safe C++」扩展提案:引入内存安全、有望成为 C++ 标准
C++ 社区上周公布了堪称“革命性”的「Safe C++」扩展提案,目标是为C++ 添加内存安全特性。 该项提案将由名为"C++ Alliance"的机构与工程师Sean Baxter 合作开发,C++ Alliance 计划将「Safe C++」扩展提案提交给 ISO,以纳入 C++ 标准。 C++ Alliance(C++联盟)是一个旨在使 C++ 编程语言易于访问和有用的公益机构,使命是让所有希望学习和应用 C++ 编程语言的人都能掌握和使用这种语言。 采用「Safe C++」扩展编写的代码示例: #feature on safety #include <std2.h> int main() safe { std2::vector<int> vec { 11, 15, 20 }; for(int x : vec) { // Ill-formed. mutate of vec invalidates iterator in ranged-for. if(x % 2) mut vec.push_back(x); std2::pr...
- 下一篇
阿里发布 Qwen2.5 “全家桶” —— 历史上最大的开源发布
阿里今天发布了 Qwen 家族的最新成员:Qwen2.5,包括语言模型Qwen2.5,以及专门针对编程的Qwen2.5-Coder和数学的Qwen2.5-Math模型。 所有开放权重的模型都是稠密的、decoder-only 的语言模型,提供多种不同规模的版本,包括: Qwen2.5: 0.5B, 1.5B, 3B, 7B, 14B, 32B, 以及72B; Qwen2.5-Coder: 1.5B, 7B, 以及即将推出的32B; Qwen2.5-Math: 1.5B, 7B, 以及72B。 除了 3B 和 72B 的版本外,所有的开源模型都采用了 Apache 2.0 License。 Qwen2.5 主要升级内容 Qwen2.5 获得了显著更多的知识,在编程能力和数学能力有大幅提升。 在指令执行、生成长文本、理解结构化数据以及生成结构化输出方面有显著改进。 对各种 system prompt 更具适应性,增强了角色扮演实现和聊天机器人的条件设置功能。 Qwen2.5-Coder 使即使较小的编程专用模型也能在编程评估基准测试中表现出媲美大型语言模型的竞争力。 Qwen2.5-Mat...
相关文章
文章评论
共有0条评论来说两句吧...