商汤科技林达华:AI 下一阶段突破必然要超越语言,回归世界交互
IT之家 8 月 13 日消息,商汤科技联合创始人、执行董事、首席科学家林达华在 8 月 12 日发布了深度文章《迈向多模态通用智能:商汤的思考》,阐释了发展多模态智能的底层逻辑、技术路径、实践探索与未来方向。
林达华提到,AI 的核心目标是通过计算来构建智能,而智能是一个复杂的多维度概念,其核心就是与外界(包括世界或者其他人)进行自主交互的能力,可以被归纳为包括感知、推理、决策、学习等多种能力维度。
同时他表示,语言只是人类智能演进过程中的一种产物,不是智能的本源;语言是描述世界的工具,但不是世界本身。他还表示:“单靠语言模型并不能构建真正意义的 AGI”。
林达华还指出,大语言模型是朝着 AGI (IT之家注:通用人工智能)迈出的重要一步,但随着现存的文本语料终有一天会被 AI 吸收殆尽,AI 下一阶段的突破必然要超越语言,回到智能的本源 —— 和世界的交互。
他认为,AI 若要具备通用性则必须能像人类一样用感官接收信息,将原始模态转化为可计算的内部表征。他写道:“多模态信息感知与处理的能力是 AGI 的核心要求,也是从语言模型迈向 AGI 的必由之路”。
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。