按:ChatGPT日前宣布推出插件功功能,赋予了ChatGPT使用工具、联网、外界交互等能力,有开发者表示这是ChatGPT推出后最重要的迭代更新,基本提供了应用商店式的服务,让它足以成为新一代的全能数码助手。
ChatGPT推出至今已一月有余,每隔几周时间就会出现令世界震动的功能拓展。有人兴奋有人恐惧,《AI 3.0》一书开篇即提出这样一个“侯世达的恐惧”:不是担心人工智能太聪明,而是担心人工智能太容易取代我们人类所珍视的东西。这本书的作者,复杂系统科学家梅拉妮·米歇尔在书中着重探究的问题也与此有关:人类和机器理解力的区别是什么?今天的机器距离真正像人一样来理解世界还有多远?
她认为,机器与人之间尚存在着“意义的障碍”(barrier of meaning):人类能够以某种深刻且本质的方式来理解他们面对的情境。尽管当前最先进的人工智能系统在完成一些任务已经超越人类,但这些系统都缺乏理解人类在感知、语言和推理上赋予的丰富意义的能力,人工智能和人类水平智能之间的“意义的障碍”至今仍然存在。
《预测可能的未来》
作者|[美] 梅拉妮·米歇尔 翻译|王飞跃
理解任何情况,其本质是一种能够预测接下来可能会发生什么的能力。当你预测正在过马路的人会继续朝着他们原来的方向行走;女士将继续推着婴儿车、牵着狗,同时拿着手机。你也会预测:这位女士会拉一下狗绳,而那条狗会反抗,并想继续探索那个地方的气味,这位女士会更使劲儿地拉狗绳,然后这条狗会跟在她身后,走到马路上。如果你正在开车,你就需要为此做好准备!在一个更基本的层面上,你一定是希望女士的鞋子待在她脚上,头待在身体上,道路还固定在地面上。你预测那位男士会从婴儿车后面走出来,并且他将会有腿、脚和鞋子,这些会支撑着他站在路上。
简而言之,你拥有心理学家所说的关于世界之重要方面的“心智模型”,这个模型基于你掌握的物理学和生物学上的事实、因果关系和人类行为的知识,表示的是世界是如何运作的,使你能够从心理上模拟相应的情况。神经科学家还不清楚这种心智模型或运行在其之上的心智模拟,是如何从数十亿相互连接的神经元的活动中产生的。一些著名的心理学家提出:一个人对概念和情境的理解正是通过这些心智模拟来激活自己之前的亲身经历,并想象可能需要采取的行动。
心智模型不仅能够让你预测在特定情况下可能会发生什么,还能让你想象如果特定事件发生将会引发什么。例如,如果你按车喇叭或从车窗向外大喊“从路上让开!”,这位女士可能会吓一跳,并将注意力转向你;如果她绊了一下,鞋子掉了,她会弯腰把鞋子穿上;如果婴儿车里的婴儿开始哭闹,她会看一眼出了什么事情。想要理解一个情境,其关键在于要能够利用心智模型来想象不同可能的未来。
心理学家劳伦斯·巴斯劳(Lawrence Barsalou)是“理解即模拟”(understanding as simulation)假说最为知名的支持者之一。在他看来,我们对于我们所遇到的情境的理解包含在我们在潜意识里执行的心智模拟中。此外,巴斯劳提出,这种心智模拟同样构成了我们对于那些我们并未直接参与其中的情境的理解,比如我们看到的、听到的或读到的。巴斯劳写道:“当人们理解一段文本时,他们构建模拟来表征其感知、运动和情感等内容。模拟似乎是意义表达的核心。”
我可以轻易地想象出这样一个场景——一位女士在打着电话过马路时发生了车祸,并且通过我对这一情境的心智模拟来理解这件事。我可能会把自己代入这位女士的角色中,并通过我的心智模型所做的模拟来想象,我拿着手机、推着婴儿车、牵着狗绳、过马路、受到干扰等分别是什么感受。
对于像“真相”“存在”“无限”等这类非常抽象的概念,我们是如何理解的呢?巴斯劳和他的同事们几十年来一直主张:即便是最为抽象的概念,我们也是通过对这些概念所发生的具体场景进行心智模拟来理解的。
根据巴斯劳的观点,我们使用对感觉-运动(sensory-motor)状态的重演(即模拟)来进行概念处理,并以此来表征其所属类别,即使是对最抽象的概念也是如此。令人惊讶的是(至少对我来说):这一假说最具说服力的证据来自对隐喻的认知研究。
我们赖以生存的隐喻
很久以前,在一堂英语课上,我学习了“隐喻”的定义,其大致内容如下:
隐喻是一种以并不完全真实的方式来描述一个物体或动作,但有助于解释一个想法或做出一个比较的修辞手法……隐喻经常应用在诗歌等文学体裁上,以及人们想要为其语言增添一些文采的时候。
我的英语老师给我们列举了一些隐喻的例子,包括莎士比亚最著名的诗句:
“那边窗户里亮起的是什么光?那是东方,朱丽叶就是太阳。”
“人生不过是一个行走的影子,一个舞台上指手画脚的拙劣的伶人,登场片刻,就在无声无息中悄然退下。”
我当时的认识是:隐喻只不过是用来为原本平淡无奇的作品增添一些文采罢了。
许多年后,我读了由语言学家乔治·莱考夫(George Lakoff)和哲学家马克·约翰逊(Mark Johnson)合著的《我们赖以生存的隐喻》(Metaphors We Live By)一书,之后,我对隐喻的理解完全改变了。莱考夫和约翰逊的观点是:不仅仅是我们的日常语言中充斥着我们意识不到的隐喻,我们对基本上所有抽象概念的理解都是通过基于核心物理知识的隐喻来实现的。
莱考夫和约翰逊引用了大量的语言示例来证明他们的论点,展示了我们如何用具体的物理概念来概念化诸如时间、爱、悲伤、愤怒和贫穷等抽象概念。
例如,莱考夫和约翰逊指出,我们会使用具体的概念,如金钱,来谈论抽象的概念,如时间。例如,我们经常会说:你“花费”或“节省”时间;你经常没有足够的时间来“花费”;有时你“花费”的时间是“值得的”,而且你已经合理地“使用”了时间;你可能认识一个在“借用的时间”里活着的人。
莱考夫和约翰逊提出的这些隐喻揭示了我们对概念进行理解的物理基础这一主张,支持了巴斯劳的人们通过构建源自我们核心知识的心智模型的模拟来进行理解的理论。
心理学家通过许多有趣的实验探讨了上述想法。一组研究人员指出:不管一个人感受到的是身体上的温暖还是社交上的“温暖”,激活的似乎都是大脑的相同区域。为了研究这种可能的心理影响,研究人员对一组志愿者进行了接下来的实验,每位被试都由一名实验人员陪同经过一段较短的电梯行程前往心理学实验室。在电梯里,实验人员请被试拿一杯热咖啡或者冰咖啡几秒钟,以方便实验人员记录被试的名字,而被试并不知道这实际上是实验的一部分。进入实验室之后,每位被试需要阅读关于同一个虚构人物的一段简短描述,然后被要求评价该人物某些性格特征。结果表明:在电梯中拿过热咖啡的被试对该人物的评价明显比拿冰咖啡的被试的评价更让人感到温暖。
尽管这些实验及其解释在心理学领域仍然存在争议,但其结果可被理解为支持了巴斯劳、莱考夫和约翰逊的观点:我们通过核心物理知识来理解抽象概念。如果物理意义上的“温暖”概念在心理上被激活,例如,通过手持一杯热咖啡,这也会激活更抽象、隐喻层面上的“温暖”概念,就像评价一个人的性格的实验那样,并且反之亦然。
抛开意识来谈理解是困难的。当我开始写这本书的时候,我打算完全回避意识的问题,因为它从科学角度来讲是如此充满争议,但不知为何,我仍然对一些意识方面的猜测很感兴趣。如果我们对概念和情境的理解是通过构建心智模型进行模拟来实现的,那么,也许意识以及我们对自我的全部概念,都来自我们构建并模拟自己的心智模型的能力。
我不仅能在心智上模拟打着电话过马路的情境,还能在心智上模拟自己的这种想法,并预测自己接下来可能会想什么,也就是说,我们有一个关于自己心智模型的模型。为模型建构模型,模拟我们的模拟——为什么不可以呢?就像对温暖的物理感知,能够激活对温暖的隐喻感知,并且反之亦然,我们拥有的与物理感觉相关的概念可能会激活关于自我的抽象概念,后者通过神经系统的反馈,产生一种对自我的物理感知,你也可以将这里的“自我”称为意识。这种循环因果关系类似于侯世达所说的意识的“怪圈”:“符号和物理层面相互作用,并颠倒了因果关系,符号似乎拥有了自由意志,并获得了推动粒子运动的自相矛盾的能力。”
抽象与类比,构建和使用我们的心智模型
到目前为止,我从心理学角度描述了人类与生俱来的,或在生命早期获得的核心直觉知识,以及这些知识如何成为构建了我们的各种观念的心智模型的基础。构建和使用这些心智模型依赖于两种基本的人类本能:抽象和类比。
抽象是将特定的概念和情境识别为更一般的类别的能力。让我们把抽象这一概念描述得更加具体些。假设你是一位家长,同时又是一位认知心理学家,为方便表述,让我们把你的孩子称作“S”。在你观察S成长的过程中,你通过写日记来记录她日益增长的、复杂的抽象能力。下面,我来设想一下这些年来你可能会记下的一些内容。
3个月:S能够区分我表达快乐和悲伤的面部表情,并将其泛化到其他与之交流的不同的人身上。她已经抽象出了“一张快乐的脸庞”和“一张悲伤的脸庞”的概念。
6个月:S现在能够在人们向她挥手告别时识别出其含义了,并且她能够挥手回应。她抽象出了“挥手”的视觉概念,同时学会了如何使用相同的手势做出回应。
18个月:S已经抽象出了“猫”和“狗”,以及许多其他类别的概念,因此,她能够在图片、绘画和动画片,以及现实生活中识别各种不同种类的猫和狗了。
3岁:S可以从不同人的手写字迹和印刷字体中识别出字母表中的单个字母了。另外,她还能区分大小写字母,总之,她对与字母相关概念的抽象已经相当高级了!此外,她还将自己对胡萝卜、西兰花、菠菜等的知识归纳为更抽象的概念——蔬菜,而且现在她将蔬菜等同于另一个抽象概念——难吃的。
8岁:我无意中听到S最好的朋友J告诉S,有一次J的妈妈在她足球比赛后忘了去接她。S回应说:“嗯,在我身上也发生过完全相同的事情。我猜你一定很生气,而你妈妈觉得非常愧疚。”然而,这个“完全相同的事情”实际上是一个相当不同的情境:S的保姆忘记去学校接她,并忘记带她去上钢琴课。当S说“在我身上发生过完全相同的事情”时,很明显她已经构建了一个抽象的概念,类似于一个看护人忘记在某个活动之前或之后接送孩子的情境。她还能够将自己的经验映射到J和J的母亲身上,来预测她们肯定会有的反应。
我提及这一想象出来的家长日记的目的是,阐述一些关于抽象和类比的重要观点。从某种形式上来说,抽象是我们所有概念的基础,甚至从最早的婴儿,甚至从最早的婴儿时期就开始了。像是在不同的光照条件、角度、面部表情以及不同的发型等条件下识别出母亲的面庞,这样简单的事情,与识别一种音乐风格,或是做出一个有说服力的法律上的类比,是同样的抽象的壮举。正如上面的日记所表明的:我们所谓的感知、分类、识别、泛化和联想都涉及我们对所经历过的情境进行抽象的行为。
抽象与“做类比”(analogy making)密切相关。侯世达几十年来一直研究抽象和做类比,在一种非常一般的意义上将做类比定义为:对两件事之间共同本质的感知。这一共同的本质可以是一个命名的概念,如“笑脸”“挥手告别”“猫”“巴洛克风格的音乐”,我们将其称为类别;或在短时间创造的难以用语言进行表达的概念,如一个看护者忘记在活动之前或之后接送孩子,“或一个并不对公共写作空间中用户创作的内容承担责任的所有者,我们将其称为类比。这些心理现象是同一枚硬币的两面。在某些情况下,诸如“同一枚硬币的两面”的想法是从一个类比起步,但最终以习语的形式融入我们的词汇中,这使得我们更像是将其当作一个类别来对待。
简而言之,类比在很多时候是我们无意识地做出来的,这种能力是我们抽象能力和概念形成的基础。正如侯世达和他的合著者、心理学家伊曼纽尔·桑德尔(Emmanuel Sander)在《表象与本质》中所阐述的:“没有概念就没有思想,没有类比就没有概念。”
我当然不是说抽象和类比涵盖了人类理解的所有组成部分。事实上,很多人已经注意到“理解”和“意义”等术语只是我们用来当作占位符的定义不明的术语,更不用说意识了,因为目前我们还没有用来讨论大脑中究竟发生了什么的准确的语言或理论。“人工智能的先驱马文·明斯基这样说道:“尽管近代科学出现了一些思想萌芽,使得‘believe’(相信)、‘know’(知道)、‘mean’(意味着)这样的词语在日常生活中变得很常用,但严格来说,它们的定义似乎太过粗糙,以至于无法支撑强有力的理论……就如同目前的‘self’(自我)或‘understand’(理解)这样的词语对我们而言一样,它们尚处于通往更完善的概念的起步阶段。”明斯基继续指出:“我们对这些概念的混淆,源于传统思想不足以解决这一极度困难的问题……我们现在还处在关于心智的一系列概念的形成期。”
为了可靠、稳定地完成其工作,人工智能系统需要在多大程度上拥有像人类那样的理解能力?或达到多大程度上的近似?没有人知道答案,但人工智能领域的研究者都认同这样的观点:掌握核心常识以及复杂的抽象和类比能力,是人工智能未来发展不可或缺的重要一环。
本文书摘部分节选自《AI 3.0》第十一章,内容有删节,经出版社授权发布。
评论