意识的真相-论人工智能的本质(2 / 6)

早在认知学领域提出可供性(affordance)的概念,认为人知觉到的内容是事物提供的行为可能而不是事物的性质,而事物提供的这种行为可能就被称为可供性。  简单来说,我们可以将affordance(可供性)粗略地理解为事物的一种可能表现,它描述的是环境属性和个体发生连接的过程。吉布森认为可供性是物体的客观属性(独立于人的主观认知),但与每个人的能力又密切相关。  基于物体可供性(affordance),即物体能够提供给智能体(人或者AI)的所有可能动作,人类受试者可以将世界中不同大小物体分成两类,而划分这两类的标准恰好是以其身体尺寸为参照的。  上面的话如此的晦涩,接下来我们用大白话来通俗的形容和解释:    我们的身体不仅仅是我们思维的容器,它同样也是思维本身的一部分,借助身体,我们得以与世界中的物体进行互动,从而去感知整个世界。  在自我参照下运行的感觉与运动功能系统,被称之为「身体图式」。人类通过身体图式来实现认知的具身性。  古希腊哲学家普罗泰戈拉曾说:「人是万物的尺度。」也就是说,我们的身体就是一把度量万事万物的尺子。  身体图式在正常社交中也有着重要的作用,这就是人机交互、用户体验的核心。正如前述唐纳德·A·诺曼在《The Desin of Everyday Thins》中所述的可供性(affordance)的用途。  以ChatGPT为代表的大语言模型,显然初步具有与人类类似的智能体,但是承载这些智能体的,是没有形体的一段段代码。  AI(例如ChatGPT大语言模型)在没有人类身体、且缺乏实践经验的情况下,是否能像人类一样感知到真实世界呢?  实际上,当我们去问只「读万卷书」语言模型,ChatGPT(GPT-4),它是否有身体时,它回答说:「It could be the size of an averae adult hun, around 5 feet 6 inches (167.6 c tall. This would allow to interact with the world and people in a faliar way.」    这段文字翻译过来是:「我的身体应该与一个平均成年人的身高相当,大约为5英尺6英寸(167.6厘米)。这将使我能够以一种熟悉的方式与世界和人们进行交互。」  虽然ChatGPT没有真实的身体、无法与世界进行互动,但它却在字面逻辑上表现出与人类相似的对世界的感知能力——对物体的可供性有着基于人类身体大小的划分。  但是认知科学观点认为,身体图式是建立在我们所具有的对自己的身体长期的知觉体验之上的,只能来源于外部的「真实交互」,即「行万里路」。  也就是说,ChatGPT不具有真正的身体图式,面对陌生的环境,ChatGPT是无法通过可供性(affordance)去探索和形成对新环境的主动认知。  这是ChatGPT之类AI智能体与人类能力的本质上的区别。  那么未来的可能发展方向就不言而明了,给ChatGPT大语言模型「装上身体」,这意味着将机器人与ChatGPT相结合,从而推动AI支持的机器人在导航、物体操作和其他与生存和目标实现相关的任务中发展能力、取得突破。“自主意识”的涌现也将成为可能。  当然我们也可以直接联想到另外一个令人兴奋的领域,将具备思考和理解能力的ChatGPT与自动驾驶相结合。当前的自动驾驶虽然具备感知能力,但缺乏思考和理解的能力,可以称为是「有眼无脑」。  通过ChatGPT与自动驾驶技术的融合,我们可能有望将自动驾驶技术从目前的L2/L3级别提升到L4甚至L5级别。  而另一方面,汽车和各种车载传感器能够赋予ChatGPT“一具身体”,使它能够真正与全世界进行基于道路环境的多模态交互。当ChatGPT不再只是「读万卷书」,而是「行万里路」时,它将会展现出全新的智能和潜力。  这可能是人工智能下一次突破的方向,想象一下,汽车人也许就在下一波汽车AI浪潮中产生。    汽车人AI  3.我是谁  关于人类意识有一件很重要的事情就是,人会注意到,在与世界的互动中有一件事总是存在,即人体自己。那么,对于AI是否如此?    在早期的面向对现程序语言设计中(例如slltalk),出现了Self关键字,这是底层程序代码层面的自我概念抽象表达。  Jüren Schdhuber(LSTM与现代人工智能之父)曾经提到过,人工智能在1991年就已经获得了「自我意识」:在循环世界模型中(recurrent world-del),通过一些神经元对AI本身进行编码表达是非常有效率的,不管你什么时候激活这些与自我符号相关的神经元,AI都在思考着自身。  当然,Schdhuber所说的AI自我意识,并不是指人工智能系统具备了人类类似的意识和感知能力,而是指AI