Andrej Karpathy：AGI 仍需十年，强化学习存在根本缺陷-低调大师

Andrej Karpathy：AGI 仍需十年，强化学习存在根本缺陷

2025-10-20 214

特斯拉前自动驾驶负责人、OpenAI 联合创始人 Andrej Karpathy 近日在播客访谈中系统阐述了他对人工智能发展的最新看法，认为实现通用人工智能（AGI）至少还需要十年时间，并对当前 AI 技术路径提出了尖锐批评。

在谈到强化学习时，他表示强化学习“非常糟糕”，因为它假设解决问题过程中的每个步骤都是正确的，实际上却充满噪音。他指出，人类绝不会像 AI 那样进行数百次尝试，然后仅根据最终结果来加权整个过程。当前大语言模型评判者也容易被对抗性样本欺骗，导致训练过程出现严重偏差。

关于超级智能，他认为 AI 发展是计算演进的自然延伸，不会出现人们想象的“智能爆炸”，而是会延续过去几百年来 2% 左右的经济增长率。他将 AI 比作历史上的编译器、搜索引擎等工具，认为它们都是递归式自我改进过程的一部分。

在教育领域， Andrej Karpathy 在创建 Eureka Labs，致力于打造「星际舰队学院」式的精英技术教育机构。他相信 AI 将彻底改变教育，但强调当前 AI 能力尚不足以提供真正的一对一辅导体验。他设想未来每个人都能掌握多门语言和各学科知识，人类将像健身一样追求智力提升。

微信关注我们

原文链接：https://www.oschina.net/news/378480

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

美团 LongCat 团队发布 Agent 评测基准“VitaBench”

美团 LongCat 团队正式发布当前高度贴近真实生活场景、面向复杂问题的大模型智能体评测基准——VitaBench（VersatileInteractive Tasks Benchmark）。据介绍，VitaBench 以外卖点餐、餐厅就餐、旅游出行三大高频真实生活场景为典型载体，构建了包含 66 个工具的交互式评测环境，并进行了跨场景的综合任务设计。例如，在旅游规划任务中，要求智能体通过思考、调用工具和用户交互，完整执行从买好票到订好餐厅的终端状态。我们首次基于深度推理、工具使用与用户交互三大维度对智能体任务进行了量化拆解，以可控地构建复杂问题。我们发现，即便是当前领先的推理模型，在主榜（复杂跨场景任务）中的成功率也仅有30%，揭示了现有智能体与复杂真实生活场景应用需求之间的显著差距。VitaBench 现已全面开源，旨在为推进智能体在真实生活场景中的研发与应用提供重要基础设施。随着大语言模型在复杂推理与工具调用能力上的快速进步，基于LLM的智能体在真实生活场景中的应用日益广泛。然而，现有的智能体评测基准与现真实生活场景的应用需求之间依然存在显著差距，主要体现在以下几个方面：...

2025-10-20

204

LangChain4j 和 Solon AI 是 Java 生态中实现大模型应用开发的重要框架，但二者的区别是啥？生产级别又该使用哪种框架？令很多人犯了难，所以本文就来浅聊一下，希望给大家在技术选型时有一个简单的参考。一、功能对比 LangChain4j 和 Solon AI 的功能是比较类似的，甚至两者可以配合使用，例如使用 Solon AI 实现 MCP 服务器端，再使用 LangChain4j 实现 MCP 客户端调用 Solon AI，二者可以无缝对接。而且，都可以嵌入到任何第三方框架中使用。那二者的区别是啥呢？接口或体验 LangChain4j Solon AI LLM 接口有有 LLM 体验复杂简单 RAG 接口有有 RAG 体验复杂简单 MCP 接口有有 MCP 体验复杂简单总体来说，LangChain4j 提供的功能更多，尤其是 RAG 方面，提供了更丰富的适配。二、使用和学习成本 LangChain4j 的使用和学习成本比 Solon AI 高很多，举个例子，例如 Solon AI 要实现流式对话，只需要一行代码就搞定了： @Pro...

2025-10-21

203

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题，腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构，目前腾讯云软件源站支持公网访问和内网访问。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。