您现在的位置是:首页 > 文章详情

商汤科技联合创始人、首席科学家林达华:多模态是通向 AGI 的必经之路

日期:2025-08-13点击:30

商汤科技联合创始人、首席科学家林达华发表长文《商汤的思考,为何我们如此坚定多模态通用智能?》,深度解析了公司在多模态通用智能道路上的一些思考与实践。

开头,林达华指出,AI 是—场长跑。从大语言模型(LLM)的兴起到真正意义的通用人工智能(AGI),还有很多开放性的问题有待解决。而商汤认为,多模态是从 LLM 到 AGI 的必经之路。

林达华提到,人工智能的核心目标是通过计算来构建智能,而智能是一个复杂的多维度概念。其认为,智能的核心就是与外界(包括世界或者其他人)进行自主交互的能力,同时这也是一种综合能力——可以被归纳为多种能力维度,包括感知、推理、决策、学习等。

同时,林达华也表示,语言只是人类智能演进过程中的一种产物,但不是智能的本源;语言是描述世界的工具,但不是世界本身。「单靠语言模型并不能构建真正意义的 AGI。」

「但之所以大模型浪潮会首先源自于语言模型的突破,是因为在人类数千年的历史中积累了海量的语料,这些语料在信息时代被广泛地数字化,从而成为最容易规模化获取的数据形态。」林达华指出:

大语言模型是朝着 AGI 迈出的重要一步,但不是终局。随着现存的文本语料被快速耗尽,人工智能下一阶段的突破必然要超越语言,回到智能的本源——和世界的交互。

其认为,世界的信息以多元形态存在,人工智能若要具备通用性,必须能像人类通过感官接收信息那样,将这些原始模态转化为可计算的内部表征。「因此,多模态信息感知与处理的能力是 AGI 的核心要求,也是从语言模型迈向 AGI 的必由之路。」

原文链接:https://www.oschina.net/news/365903
关注公众号

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。

持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。

文章评论

共有0条评论来说两句吧...

文章二维码

扫描即可查看该文章

点击排行

推荐阅读

最新文章