阿联酋推出低成本 AI 推理模型,宣称“性价比”超同行 20 倍
阿联酋穆罕默德·本·扎耶德人工智能大学(MBZUAI)在官网宣布,其与G42共同推出了一款低成本的推理模型“K2 Think”。
新闻稿声称,K2 Think仅需320亿个参数,却能超越其他公司的、规模大20倍的推理模型。该模型基于阿里巴巴开源Qwen 2.5模型构建,并在Cerebras提供的硬件上运行和测试。
MBZUAI基础模型研究所所长Hector Liu告诉媒体,团队通过多种方法实现了高性能表现,包括:长链式思维监督微调(CoT) —— 一种逐步推理的方法;推理阶段扩展(test-time scaling) —— 在推理阶段分配更多计算资源来提升表现。
Liu表示:“特别之处在于,我们把它当作一个系统来对待,而不仅仅是一个模型。和普通的开源模型仅仅‘发布’不同,我们会实际部署该模型,并观察如何随着时间的推移改进模型。”“如果问哪一步最关键,很难单独指出。这更像是一整套方法的组合,才得出了最终结果。”
新闻稿写道,“K2 Think不仅仅是一项技术成就,更是阿联酋人工智能领域的一个决定性时刻。”
近年来,阿联酋也试图将自己定位为AI全球领导者,以提升地缘政治影响力,并减少对原油的依赖。阿联酋的AI企业G42就是其突围的例子。但其竞争对手包括邻国沙特,后者今年5月通过主权基金成立Humain,致力于打造全栈AI能力。
更宏观来看,阿联酋AI产业要追赶中美仍有很长路要走。美国的OpenAI和科技巨头已占据先机,中国也早已把AI列为战略重点。
尽管K2 Think的表现可与OpenAI相媲美,开发者强调,他们的目标并不是打造另一个ChatGPT。MBZUAI基础模型研究所总经理Richard Morton解释说,这个模型是为数学、科学等特定应用领域而设计。
他说:“人类大脑的基本推理能力是所有思维过程的基石。这个应用能把原本需要1000到2000人耗费五年时间才能完成的问题思考或临床实验,大大缩短周期。”
此外,它还能让缺乏美国那样资本与基础设施的地区,也能使用先进AI技术。Morton总结道:“我们正在发现,用更少的资源,其实可以做到更多。”

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
-
上一篇
Arm 发布 Lumex CSS 移动端计算子系统
Arm 正式发布 Lumex CSS (Compute Subsystem, CSS) 移动端计算子系统,这是专为旗舰级智能手机及下一代个人电脑设计的先进计算平台,旨在加速端侧 AI 体验并提升整体性能。 Lumex CSS 平台集成了搭载第二代可伸缩矩阵扩展 (SME2) 技术的最高性能 Arm CPU、GPU 及系统 IP,支持桌面级移动游戏、实时翻译、智能助手及个性化应用等多样的丰富体验。 全新 Arm Lumex 平台包含以下核心组件: 新一代搭载 SME2 技术的 Armv9.3 CPU 集群:包括 Arm C1-Ultra 和 Arm C1-Pro,为旗舰设备提供支持; Arm C1-Premium:专为次旗舰市场打造,可提供一流的面积效率; Arm Mali G1-Ultra GPU:配备新一代光线追踪技术,在实现先进的图形和游戏体验同时,还可提升整体 AI 性能; Arm C1-DSU:Arm 迄今为止最灵活、高能效且具多种电源模式的 DynamIQ Shared Unit (DSU); 针对 3 纳米工艺节点优化的物理实现;跨软件栈的深度集成,为使用 Arm Klei...
-
下一篇
为什么实时更新场景下 Doris 查询性能是 ClickHouse 的 34 倍
在当今数据驱动的商业环境中,企业越来越依赖数据分析来驱动决策。无论是用户行为分析、业务报表还是运营监控,企业都需要具备快速、高效的数据处理能力。企业在数据分析能力上的演进,往往始于 TP(事务处理)系统,随着业务发展不断探索 TP 系统的扩展方案,最终走向构建独立的 AP(分析处理)系统。 企业实时分析典型演进过程 第一阶段:使用 TP 系统支撑事务处理和数据分析 在企业信息系统建设的早期,主要存储在 OLTP(在线事务处理)系统中,比如 PostgreSQL、MySQL、SQL Server 等。因为数据"就在那儿",最自然的方式就是直接从 TP 系统中执行 SQL 查询来获取所需分析数据: 查询订单、用户、库存、交易等业务数据; 生成运营报表,支撑内部管理; 快速开发查询接口,满足临时的 BI 需求。 在业务初期,数据规模有限,分析需求也相对简单,系统架构轻量,能够高效支撑当下业务,避免了多系统部署和复杂数据流带来的额外成本与运维压力。然而,随着业务快速发展,数据量迅速增长,分析场景愈发复杂,查询延迟上升,事务与分析负载相互影响,原有系统逐渐难以支撑持续扩展的业务需求。 第二阶段:...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- CentOS7,8上快速安装Gitea,搭建Git服务器
- CentOS8编译安装MySQL8.0.19
- Dcoker安装(在线仓库),最新的服务器搭配容器使用
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- SpringBoot2全家桶,快速入门学习开发网站教程
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- Docker使用Oracle官方镜像安装(12C,18C,19C)
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2整合Redis,开启缓存,提高访问速度