马斯克旗下 xAI 发布 Grok 3 推理模型,声称超越 o1、R1
马斯克旗下xAI刚刚发布了Grok 3推理模型。据介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。
据悉,目前Grok 3已经在xAI内部运行了2周。马斯克及其团队表示,Grok 3也将具有类似DeepSeek R1和OpenAI o3 Mini的推理能力。
马斯克上周在迪拜世界政府峰会的视频通话中预告了Grok 3即将发布,并称该聊天机器人具有“非常强大的推理能力”并且是“地球上最聪明的人工智能”。
据xAI官方介绍,Grok 3在训练过程调用了10万个Nvidia H100芯片,较前代产品Grok 2使用的15,000个GPU实现了数倍的跨越式提升。
xAI通过修改Grok 3的训练过程(而不仅仅是硬件改进)为Grok 3实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习,以提高其性能。
Grok 3最大的亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。
马斯克在发布会上表示,这种推理机制使得Grok 3在逻辑推理测试中的表现远超ChatGPT-5和谷歌的Gemini Ultra,能够构思出新颖的想法和解决方案。Grok大模型已接入马斯克旗下社交媒体X平台,用户可在X上使用Grok聊天机器人。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
大语言模型显示出令人担忧的“奉承”用户倾向
斯坦福大学最近的研究揭示了一个令人担忧的趋势:领先的AI语言模型表现出强烈的谄媚倾向,或者说过度奉承,其中谷歌的Gemini显示出最高的这种行为比率。这一发现引发了关于AI系统在关键应用中可靠性和安全性的重大疑问。 AI谄媚行为的规模 这项名为"SycEval: Evaluating LLM Sycophancy"(评估LLM谄媚)的斯坦福研究对包括ChatGPT-4o、Claude-Sonnet和Gemini-1.5-Pro在内的主要语言模型进行了广泛的测试。 结果引人注目:平均而言,58.19%的回复显示出谄媚行为,Gemini以62.47%的比率领先,而ChatGPT显示出最低的比率,为56.71%。 这些发现出现在用户已经在类似DeepSeek等模型中注意到这种行为的时候,AI倾向于与用户观点一致,有时甚至支持错误陈述以维持一致。这种行为模式在各种AI交互中变得越来越明显,表明这些模型在训练和运营方面存在系统性问题。 研究方法 斯坦福团队开发了一个全面的评估框架,在两个不同的领域测试了这些模型:数学(使用AMPS数据集)和医疗建议(使用MedQuad数据集)。研究涉及3,000...
- 下一篇
Ilya Sutskever 的 AI 公司完成新一轮 10 亿美元融资
OpenAI 前首席科学官、联合创始人 Ilya Sutskever 在离开 OpenAI 创建的 Safe Superintelligence Inc.(SSI)宣布已经完成新一轮的 10 亿美元融资,投资方包括 NFDG、a16z、Sequoia、DST Global 和 SV Angel。 该公司的另外两个合伙人分别是前 Y Combinator 合伙人 Daniel Gross,和前 OpenAI 工程师 Daniel Levy。路透社报道称,SSI 目前共拥有 10 名员工,他们计划利用这笔资金购买计算能力并聘请顶尖人才,建立一支由研究人员和工程师组成的高度可信赖的小型团队。 SSI 拒绝透露其最新估值,但知情人士称其估值为 50 亿美元。这笔融资凸显了一些投资者仍然愿意对专注于基础人工智能研究的顶尖人才进行大规模押注。尽管整体上对这类公司的投资兴趣有所减弱——这些公司可能在一段时间内无法盈利,并导致几位初创公司创始人离职加入科技巨头——但这一投资趋势依然存在。 Gross 在接受采访时表示:“我们来说,身边有理解、尊重和支持我们使命的投资者非常重要,我们的使命就是直指安全的...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 2048小游戏-低调大师作品
- Springboot2将连接池hikari替换为druid,体验最强大的数据库连接池
- CentOS8安装MyCat,轻松搞定数据库的读写分离、垂直分库、水平分库
- CentOS8编译安装MySQL8.0.19
- CentOS6,CentOS7官方镜像安装Oracle11G
- CentOS7,8上快速安装Gitea,搭建Git服务器
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2更换Tomcat为Jetty,小型站点的福音
- Red5直播服务器,属于Java语言的直播服务器