xAI 发布最新模型 Grok 4.1:更少幻觉、更准事实、更强风格控制

马斯克旗下 AI 公司 xAI 宣布推出 Grok 4.1,称这是一款前沿模型,为对话智能、情感理解和现实世界的实用性树立了新标准。目前 Grok 4.1 已在 grok.com、iOS 和 Android 应用上线,用户可通过模型选择器手动选择 “Grok 4.1”。

据介绍,Grok 4.1 在创造性、情感互动、协作能力上大幅提升,同时保留此前的“敏锐智能与可靠性”。为了实现上述提升,xAI 在 Grok 4 的大规模强化学习基础上,进一步优化了“风格、人格、帮助性、与对齐”(alignment)等方面。其中特别使用了新的方法:以“先进的代理(agentic)推理模型”为奖励模型,自主评估并大规模迭代响应。 

Grok 4.1 技术与基准表现

  • 在 LMArena 的 “Text Leaderboard” 中,Grok 4.1 的 “thinking 模式”(代号 quasarflux)达到 1483 Elo 分,领先所有非-xAI 模型。其 “non-reasoning 模式”(代号 tensor,即没有思考 tokens 的即时响应模式)也达1465 Elo,超越所有其他模型的完全推理配置。 

  • 在“情感智能”评测(EQ-Bench3)中,Grok 4.1 表现出了更好的共情、理解、洞察与人际交互能力。

  • 在“创意写作”评测(Creative Writing v3 benchmark)中也展现提升,其语言更具“角色感”、更具情感和叙事张力。

  • 在减少“幻觉”方面(即对事实性问题的错误回答)也有进展。4.1 在“非推理”模型配合搜索工具时,幻觉率有显著下降。尤其使用了 FActScore(生物传记问题基准)衡量。

详情查看:https://x.ai/news/grok-4-1

优秀的个人博客,低调大师

微信关注我们

原文链接:https://www.oschina.net/news/384175/x-ai-grok-4-1

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

相关文章

发表评论

资源下载

更多资源
Apache Tomcat7、8、9(Java Web服务器)

Apache Tomcat7、8、9(Java Web服务器)

Tomcat是Apache 软件基金会(Apache Software Foundation)的Jakarta 项目中的一个核心项目,由Apache、Sun 和其他一些公司及个人共同开发而成。因为Tomcat 技术先进、性能稳定,而且免费,因而深受Java 爱好者的喜爱并得到了部分软件开发商的认可,成为目前比较流行的Web 应用服务器。

Eclipse(集成开发环境)

Eclipse(集成开发环境)

Eclipse 是一个开放源代码的、基于Java的可扩展开发平台。就其本身而言,它只是一个框架和一组服务,用于通过插件组件构建开发环境。幸运的是,Eclipse 附带了一个标准的插件集,包括Java开发工具(Java Development Kit,JDK)。

Java Development Kit(Java开发工具)

Java Development Kit(Java开发工具)

JDK是 Java 语言的软件开发工具包,主要用于移动设备、嵌入式设备上的java应用程序。JDK是整个java开发的核心,它包含了JAVA的运行环境(JVM+Java系统类库)和JAVA工具。

Sublime Text 一个代码编辑器

Sublime Text 一个代码编辑器

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。