xAI 发布最新模型 Grok 4.1：更少幻觉、更准事实、更强风格控制-低调大师

xAI 发布最新模型 Grok 4.1：更少幻觉、更准事实、更强风格控制

2025-11-18 155

马斯克旗下 AI 公司 xAI 宣布推出 Grok 4.1，称这是一款前沿模型，为对话智能、情感理解和现实世界的实用性树立了新标准。目前 Grok 4.1 已在 grok.com、iOS 和 Android 应用上线，用户可通过模型选择器手动选择 “Grok 4.1”。

据介绍，Grok 4.1 在创造性、情感互动、协作能力上大幅提升，同时保留此前的“敏锐智能与可靠性”。为了实现上述提升，xAI 在 Grok 4 的大规模强化学习基础上，进一步优化了“风格、人格、帮助性、与对齐”（alignment）等方面。其中特别使用了新的方法：以“先进的代理（agentic）推理模型”为奖励模型，自主评估并大规模迭代响应。

Grok 4.1 技术与基准表现

在 LMArena 的 “Text Leaderboard” 中，Grok 4.1 的 “thinking 模式”（代号 quasarflux）达到 1483 Elo 分，领先所有非-xAI 模型。其 “non-reasoning 模式”（代号 tensor，即没有思考 tokens 的即时响应模式）也达1465 Elo，超越所有其他模型的完全推理配置。
在“情感智能”评测（EQ-Bench3）中，Grok 4.1 表现出了更好的共情、理解、洞察与人际交互能力。
在“创意写作”评测（Creative Writing v3 benchmark）中也展现提升，其语言更具“角色感”、更具情感和叙事张力。
在减少“幻觉”方面（即对事实性问题的错误回答）也有进展。4.1 在“非推理”模型配合搜索工具时，幻觉率有显著下降。尤其使用了 FActScore（生物传记问题基准）衡量。

详情查看：https://x.ai/news/grok-4-1

微信关注我们

原文链接：https://www.oschina.net/news/384175/x-ai-grok-4-1

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

🔥 AI + 低代码是颠覆企业开发效率的利器，还是程序员的智能玩具？

9.6K Star的背后，是开发者的共同选择在数字化转型的浪潮中，企业开发团队面临着这样的困境：一方面，业务部门期望快速交付系统；另一方面，开发者不想被传统低代码平台的“黑盒代码”和平台锁定所束缚。一场效率革命正在悄然发生，而VTJ.PRO正是这场革命的核心引擎。 🤔 是生产力利器还是高级玩具？答案可能让你惊讶 VTJ.PRO，这个在Gitee上狂揽9.6KStar的开源项目，远不止是开发者的新玩具。它通过“AI+低代码”的双重赋能，正在重新定义企业级开发的效率边界。在实际应用中，一家金融系统团队使用VTJ.PRO将开发周期从6周压缩到9天，提速150%，维护成本降低75%。这样的成果，很难用“玩具”来形容。 🚀 三大核心黑科技，让开发效率跃升300% 1️⃣ 双向代码自由：打破低代码的“宿命论” 传统低代码平台最大的痛点在于生成的代码不可读、难迁移，导致开发者被平台绑架。VTJ.PRO彻底解决了这一问题：设计即代码：拖拽组件搭建界面后，一键输出纯净的Vue3标准.vue文件，无冗余代码，无黑盒依赖，可直接嵌入现有项目代码即设计：已有Vue组件可直接反向解析成低代码DSL...

2025-11-18

192

TDUCK-platform 5.3 已经发布，开源表单系统。此版本更新内容包括：社区版5.3更新 TduckX v3.2更新 v3.2 ✨ 新增表单新增级联多选组件表单新增视频录制组件新增钉钉和飞书登录消息模板增加飞书和钉钉通知新增表单打印线下使用表单填写增加时间限制开始倒计时显示新增打印模板复制功能新增自定义函数获取矩阵列值（支持获取表格计算值）流程条件增加（包含）多选下拉支持优化部分组件后端校验开关优化矩阵，表格计算组件打印显示表单逻辑 DSL 保存提示移动端时间组件出现Invalid Date 主题设置优化（logo 大小动态设置、默认主题颜色等）待填/已填表单列表样式优化本地存储支持相对路径存储优化会签回退等情况下异常 cas登录同时兼容本地登录三方账号登录微信用户名修改为时间戳修复上传同时选择多个文件只保留最后一个子表单支持必填开关详情查看：https://gitee.com/TDuckApp/tduck-platform/releases/5.3

2025-11-18

136

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能，例如代码缩略图，Python的插件，代码段等。还可自定义键绑定，菜单和工具栏。Sublime Text 的主要功能包括：拼写检查，书签，完整的 Python API ， Goto 功能，即时项目切换，多选择，多窗口等等。Sublime Text 是一个跨平台的编辑器，同时支持Windows、Linux、Mac OS X等操作系统。