马斯克旗下 xAI 发布 Grok 3 推理模型,声称超越 o1、R1
马斯克旗下xAI刚刚发布了Grok 3推理模型。据介绍,在数学推理、科学逻辑推理和代码写作等能力表现方面,Grok-3在多项benchmark测试中均取得了比DeepSeek-v3、GPT-4o、Gemini-2 pro更优的效果。
据悉,目前Grok 3已经在xAI内部运行了2周。马斯克及其团队表示,Grok 3也将具有类似DeepSeek R1和OpenAI o3 Mini的推理能力。
马斯克上周在迪拜世界政府峰会的视频通话中预告了Grok 3即将发布,并称该聊天机器人具有“非常强大的推理能力”并且是“地球上最聪明的人工智能”。
据xAI官方介绍,Grok 3在训练过程调用了10万个Nvidia H100芯片,较前代产品Grok 2使用的15,000个GPU实现了数倍的跨越式提升。
xAI通过修改Grok 3的训练过程(而不仅仅是硬件改进)为Grok 3实现了更好的功能。更新后的模型实现了合成数据集、自我校正和强化学习,以提高其性能。
Grok 3最大的亮点在于其引入了“思维链”(Chain Of Thought)推理机制。这一机制允许Grok 3像人类一样分步骤解决复杂问题,显著提高了模型处理复杂查询和提供更连贯、更有逻辑响应的能力。
马斯克在发布会上表示,这种推理机制使得Grok 3在逻辑推理测试中的表现远超ChatGPT-5和谷歌的Gemini Ultra,能够构思出新颖的想法和解决方案。Grok大模型已接入马斯克旗下社交媒体X平台,用户可在X上使用Grok聊天机器人。




