Transformers 作者:未来互联网将演变为 AI Agent 网络
日前,Transformers 合著者 Illia Polosukhin 接受了 a16z 的专题采访,并在交流中分享了自己对于 AI、Agent 等方面的观点。
开篇,Illia 就分享了自己对现有 AI Agent 的看法。他表示,据团队观察,大量用户对需要复杂规划的场景特别感兴趣。但这种局面在未来将会反过来:AI 助理将会主动提出方案给用户,用户也仅需要做出方向性选择即可。对于这种 AI 何时面世,Illia 预测在未来一年内,就会出现首批成熟应用的场景。
对于「死亡互联网理论」,Illia 则坦言:虽然开放网络正在消亡,但并非网络上的机器人数量过多,而是因为平台容易被垃圾信息攻陷。对此他认为智能 Agent 能够为人类进行信息把关,未来 AI 助手也会成为互联网「垃圾分拣员」:能够为用户提供上下文链接,如实指出错误信息并揭露事实真相。
另外,主持人问及「未来将会有多少 AI Agent?与人类的数量比例又是如何?」时,Illia 则表示,未来每个人都会拥有属于自己的 AI 助手,而 AI 助手的背后可能运行着数十个子 Agent 项目,因此这会构建起一个庞大的 Agent 网络,并且每个人都将如同获得一套「按需助理系统」。
主持人还特别向 Transformers 作者问起了对 DeepSeek 的看法:
Robert:
您如何看待DeepSeek最新发布的高性能开源模型?相比其他选项,它不仅表现优异且成本更低,更特别的是由中国对冲基金以开源方式推出。
Illia:
首先这确实是激动人心的突破。他们在有限硬件上实现大规模高性能模型训练的工程能力令人惊艳,证明优秀工程实践能大幅降低成本。中国模型训练成本正在快速下降,但最关键的创新在于:他们提出了一种极其简单的强化学习方法——这个方法具有普适性,无论是10亿还是70亿参数模型都能快速获得优异效果。
这种“阶跃式创新”让我想起Transformer的诞生——原理简单、开箱即用、人人可复现。
坦白讲,这类基础方法论本应自由传播(毕竟只是公式或原理),但必须承认DeepSeek团队极其专业,他们凭借后发优势规避了许多早期问题。现在更重要的机遇在于:借助可验证计算技术,我们可以训练用户或社区拥有的模型——确切知道训练数据来源。
当前所有开源模型都只公开参数,无人知晓训练数据构成,即便公布也无法验证真伪。
区块链领域现在有机会联合训练一个“加密透明”的开源模型:所有人都能验证数据输入、训练过程及潜在偏差,确保没有隐藏后门或恶意代码。这样的模型才能真正成为AI时代可信赖的基础设施。

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
马斯克旗下 xAI 拟融资 200 亿美元
彭博社援引知情人士透露,马斯克旗下 xAI 目前正与投资者洽谈,计划筹集大约 200 亿美元资金,用于其新合并的人工智能初创公司和社交媒体业务。 数据提供商 PitchBook 的数据显示,如果成功,这笔交易将成为历史上第二大创业公司融资,仅次于今年早些时候 OpenAI 的 400 亿美元融资。据知情人士透露,凭借此轮洽谈中的融资,xAI 的估值超过 1200 亿美元。 值得一提的是,该轮融资可能有助于偿还马斯克在将 X 前身 ——Twitter 私有化后所承担的一部分债务。知情人士透露,上述债务一直对 X 构成财务压力。此前彭博社报道指出,仅在今年 3 月,X 就支付了约 2 亿美元的债务服务费用,截止 2024 年底,其年度利息支出将超过 13 亿美元。 据了解,尽管谈判仍处于初期阶段,但 xAI 目标是未来几个月内筹集资金。知情人士表示,融资规模可能会超过最初的 200 亿美元,具体金额和条款尚未确定。 报道指出,这一大规模融资凸显了投资者对人工智能公司日益增长的兴趣,同时也显示了马斯克作为商业巨头和政治影响力人物的地位。尽管特斯拉的市值有所下滑,但马斯克的其他企业仍在蓬勃发...
- 下一篇
Anthropic 向逆向工程 Claude Code 的开发者发送删除通知
TechCrunch 报道称,在 Anthropic 的 Claude Code 和 OpenAI 的 Codex CLI 两款“智能体”式 AI 编程工具的较量中,后者获得了更多开发者的青睐。部分原因在于,Anthropic 向一位试图逆向工程 Claude Code 的开发者发出了删除通知,而 Claude Code 的使用许可要比 Codex CLI 更加严格。 Claude Code 和 Codex CLI 都是让开发者能够利用云端的 AI 模型来完成各种编程任务的工具,功能相似。两家公司几乎在同一时期发布了这两款工具,争夺开发者的关注。 Codex CLI 的源代码采用 Apache 2.0 许可证,允许分发和商业使用。相比之下,Claude Code 则依赖于 Anthropic 的商业许可证,限制了“在未获得公司明确许可的情况下对其进行修改”的方式。 另外,Anthropic 对 Claude Code 的源代码进行了“混淆”,意味着其源代码并不容易获得。当有开发者通过反混淆手段将代码发布到 GitHub时,Anthropic 提出了 DMCA 投诉 ——这是一份要求删除...
相关文章
文章评论
共有0条评论来说两句吧...