第六章 知觉瞬间:视觉理论

"心理学是一门很不能令人满意的学科。"

——沃尔夫冈·科勒尔(Wolfgong Kohler)

图标记忆和工作记忆的衰减时间可能是相当短暂的。我们对引起意识的各种处理过程所需的时间了解多少呢?回忆一下第二章的内容就知道,某些认知学家喜欢把大脑的活动看成是执行计算的过程,他们认为,引起意识的不是计算本身而是计算的结果。

有些人声称,某些脑的活动并不能达到意识水平,除非它们持续的时间超过某个最短的时间。如果这种活动较弱,这一时间可能要长达半秒。单是为了指导我们探索意识的神经相关物,就需要我们了解与单个"知觉瞬间"(moment of perception)对应的脑活动的持续时间类型。单个处理周期涉及怎样的时间类型呢?

让我们考虑如下的情况。首先,给被试者呈现一个20毫秒长的瞬时红光刺激。之后,在原来的地方马上呈现一个20毫秒的绿光刺激。被试者报告看到了什么呢?他看到的不是一个红色闪光紧接着一个绿色的闪光,而是一个黄色闪光。就如同这两种颜色同时闪烁时所看到的情形一样。然而,如果绿色闪光不是紧跟红光之后,被试者就会报告看到红色闪光。这说明,直到来自绿光的信息被加工完之前,被试者不可能意识到黄颜色的存在。

因此,你不能感受到一个刺激的真正开始时刻,你也无法估计出一个短暂刺激的真正持续时间。早在1887年,法国科学家查蓬特尔(A.Charpentier)就发现,长达66毫秒的闪光刺激,看起来并不比7毫秒的闪光刺激持续更长的时间。

1967年美国心理学家罗伯特·埃弗龙(Robert Efron)就此问题写了一篇颇具洞察力的好文章。他通过用不同方法进行估算得出结论,处理周期的持续时间大约为60到70毫秒。这个数字是对较容易观察的突出刺激而言。对于不清楚或较为复杂的刺激,其处理周期将会更长,这是不足为奇的。。

那么,对于更为复杂的加工又需要多少时间呢?在这种情况下,通常是先呈现一个视觉刺激,然后紧接着一个快速的掩蔽(mask),即在视野中的同一位置呈现一个视觉模式,用以干扰观看原刺激所必需的某些处理过程,详细解释这一结果是困难的。如果系统是简单的、顺序进行的,信号从一个阶段稳定地进展到另一个阶段中间没有停顿,而且步入意识不花费时间,那么来自掩蔽的信号根本不可能赶上来自刺激的信号。既然掩蔽能够干扰刺激的知觉,这就意味着至少某些处理步骤是要花费时间的。这无论如何都是可能的。尽管在解释上还存在困难,但掩蔽效应仍可以向我们提供某些该过程的有用信息。

美国心理学家罗伯特·雷诺兹(Robert Reynods)通过若干个实验来研究这个问题。他希望说明,知觉的不同方面可以在不同时刻看到。换句话说,他试图研究从刺激呈现到形成相对稳定的知觉的时间历程。

作为一个例子,让我们看一看第四章描述过的虚幻轮廓的知觉所形成的时间。为了避免被试者猜测或撒谎,雷诺兹向被试者呈现图22中两个图样中的一个。每个图案都是由如图所示的三个缺口圆盘组成,其中第一个幻觉边框是直线,而第二个为曲线。刺激呈现时间为50毫秒,经过某个延迟①时间之后,紧接着呈现的是如图22c所示的一个掩蔽。刺激模式大而明亮,即使呈现时间很短被试者也能够清楚地看见三个缺口圆盘,由于存在图标记忆,在没有掩蔽的情况下,我们有理由认为,来自显示图形的信号对大脑的作用时间将会超过图形闪烁的时间50毫秒(大概有几百毫秒)。

雷诺兹发现,如果掩蔽紧随刺激出现,则绝大多数被试者就看不到幻觉三角形。少数报告看到幻觉三角形的人也常常发生错误,将直线三角和曲线三角搞混。然而,如果延迟时间为50到75毫秒,即SOA为100到125毫秒,则所有的观察者都报告说看到了三角形,尽管他们还不能完全准确他说出三角形的边是直线的还是曲线的。

这清楚地表明,总的加工时间完全取决于他看到的是什么。在幻觉三角形出现之前的一段时间内,三个缺口圆盘(pacmen)可以看得很清楚。

需要注意的是,这些实验并不能精确他说明,在何时大脑产生知觉的"神经相关物"。它只能说明,对于知觉的某些方面其处理时间很可能比其他方面要长。

雷诺兹又进行了另一个更为复杂的类似实验。同样的幻觉三角形被画成是好像放置在透明的砖墙后面。对这样一种视觉图样的解释是不确定的。被试者先看见三个缺口圆盘,之后看见一个亮三角形,接着这个三角形又被拒绝,然后三角形知觉又重新出现①。这后三个阶段,每个的时间约为150毫秒。

显然,"计算"的时间(timing)依赖于它们的复杂度。尽管详细的解释仍然有赖于确切了解不同脑区之间信号的传递方式及它们之间的相互作用(这不大可能是简单的),但目前起码我们对视觉处理所需的各种时间类型已有了一个粗略的想法。直到我们对参与看(seeing)的不同大脑过程以及它们的相互作用②方式有了更清楚的了解之前,我们不大可能得到更为精确的时间。

我已经简要地阐述了视觉加工的诸多方面,但还没有系统他说明我们应如何认识所有这些加工,这是一个困难的问题。如果这是一本专门讨论视知觉的书,我将不得不用一定篇幅来描述一些有关视觉的最新思想,即大脑如何通过执行复杂的活动而使我们看见外部世界。除了第二章中提到的那些认知科学家以外,大多数理论家对意识没有表现出多大兴趣,由于这个原因,再加上还没有一个被普遍接受的视觉理论,因此,很多不同的探讨我都没有给出详细的描述。然而,下面简短的综述将会给读者一个大体的印象。①

人们对视觉感兴趣有多种不同的原因。某些人希望制造一种视觉机器,它能像我们一样或比我们更好地看东西,以便把它应用于家庭、工业或者军事目的,除了把大脑看作是思想的源泉外,他们不太关心大脑如何完成这一工作。一个视觉机器并不需要严格模拟人脑,就像飞机并不需要扇动翅膀一样。

另外一些人的主要兴趣则是人类如何看物体。某些功能主义者持有一种极端的观点。他们认为,了解脑的细节永远得不到任何有用的东西(2)。这一观点是如此古怪,以至大多数科学家都惊讶它为什么能够存在。而另一种极端的观点是来自某些神经科学家,他们主要关心动物脑神经细胞对视觉图像的响应,却极少关心这一活动如何产生视觉。幸运的是,现在有少数研究视觉的学生,他们的观点介于这两个极端之间,他们既对视觉心理学感兴趣也对神经细胞的行为感兴趣。

人们对这些问题的想法也是千差万别的,某些人认为重要的是研究视觉环境——即我们脚下的大地、头顶的蓝天以及其问的万物。他们并不关心大脑,因为他们认为,所有需要去做的就是对环境的各方面产生"共鸣",不管它意味着什么。他们将自己称为吉布森主义者。因其己故宗师吉布森(J.J.Gibson)而得名。另外的一些人则试图分析基本的、但是相当有限的视觉操作,如由阴影恢复形状、理发店标志错觉等,并且编制能解决这些问题的计算机程序。在人工智能领域,这种传统仍然很强。还有一些人则将大脑中的过程比作日常生活中的物体或事件。他们经常谈论"探照灯"或"为某一物体打开一个文件"之类的东西,在过去的二三十年间,所使用的解释常常建立在计算机如何工作这一基础之上。他使使用一系列明确的规则以获得所需的结论,并且涉及某些计算机概念,包括中央处理、随机存储等,较新近的进展便是神经网络(由相互作用的神经元集合组成),它们的相互作用大致上是并行的,而且没有明确的规则。(在第十三章中将作较全面的讨论。)

正如我们在第四章看到的那样,格式塔心理学家希望揭示视觉活动的基本原理。他们争辩说,正如理解空气动力学定律对于理解鸟和飞机的飞行非常重要一样,理解视觉也必须寻找它所涉及的普遍原理。这一研究方法的现代形式常使用信息学术语表达他们的理论。毫不奇怪,数学家们则倾向于发现某种普遍的数学原理。对普通读者来讲,要描述所有这些思想也许需要一大本书的篇幅。

所有这些观点都有一定的价值,但它们尚未被融合在一起,形成一个详细的、被广泛接受的视觉理论,只要回避视觉意识问题。任何现有的视觉理论都是不充分的,无论如何,视觉是一个复杂和困难的过程,直到下一个世纪以前,我们都不大可能提出一个综合的视觉理论。如果现在我们就想研究视觉意识问题,我们就不得不竭尽全力。为此,我们需要某种尝试性的观点,否则我们就只能错失良机。

我认为,已故戴维·马尔(Devid MaIT)提出的研究方法是非常有用的,马尔是一个英国年轻人,为了给脑研究做准备,他在剑桥大学获得了一个数学学位。其博士论文提出了一个详细而新颖的小脑理论。后来,悉尼·布伦纳(sydney Brenner)和我在英国剑桥我们的实验室内为他提供了一间办公室,在那里,他提出了有关视皮层与海马的一般性操作理论,他的兴趣部分转向视觉人工智能,并到麻省理工学院(MIT)与意大利理论家托马索.波吉奥(Tomaso Poggio)合作,1979年4月,他们两人一块到索尔克研究所(Salk lnstitute)对我进行了为期一个月的访问。马尔曾经写了一本名为《视觉》的著作(他死后才出版)。在书中,他以简捷的方式解释了许多有关视觉的创新思想(他的科学论文不易读懂)。虽然并非所有这些思想都能经得起时间的考验,但在当时,这本书对这些问题的阐述仍然是巧妙精辟的。最后一章中有一段马尔与一个勉强的信奉者(我本人)之间的假想对话,它大体上模仿了他和波吉奥在索尔克的时候,我们三人之间的多次谈话。

马尔设想出一个普遍的框架,用以描述视觉过程的粗略轮廓。他认为视觉的主要任务是获得形状的表象;明度、颜色、纹理等都不如形状重要,他自然而然地采纳了这样的观点,即大脑在其内部构建外部世界的符号表象,使隐含在视网膜图像中的很多方面显现出来。马尔认为(当然,这基本上是正确的),所有这些不可能一步完成,相反,他假设存在一个表象序列。他把它们称为"原始要素图"、"2.5维图"和"三维模型"表象。

原始要素图(primalsketch)使二维图像中的光强变化、几何分布和组织等重要信息显现出来。它处理的特征包括边界线段、斑点、端点、间断点和边界等。2.5维要素图使以观察者为中心的坐标系中的可见表面的朝向(和大概深度)和它们的轮廓显现出来。3D模型表象则描述以物体为中心的各种形状及其空间组织。

这样视觉任务至少可分成三个独立的阶段。这是非常有益的,因为它至少使我们意识到,看东西还需要做那么多事情。但在细节上不可能都是正确的。三个阶段可能只是一级近似,比如,颜色、纹理、运动理应加到"形状"之上。也许比三个阶段还要多,而且这些处理阶段也可能并不像他描述的那样具有严格的区别,它们可能存在双向相互作用,然而,他的框架毕竟说明了当我们看物体时所发生的处理类型,(我将在第十七章中讨论它和神经科学的关系。)

马尔35岁时因患白血病英年早逝,这是理论神经生物学研究的一个重大损失。我坚信,如果他还在世,他绝不会固步自封,而会随着研究的进展进一步发展其脑理论,他的聪明才智和富于想像的创造力一定会帮助我们冲破今天所面临的一切困难。因为他不仅仅具有非凡的智力,对不同领域内的大量实验证据还有极强的消化吸收能力。

为了理解大脑我们需要怎样的解释风格呢?我本人所持的观点与拉马参准的知觉功利主义理论最为接近,他认为,视知觉既不涉及我们争论时所使用的那种严格的、理智的推论,也不涉及大脑对视觉输入的"共振"那种含糊不清的想法。视知觉也不像人工智能研究者经常暗示的那样,需要求解复杂的方程才能解决。与此相反,他认为知觉"使用的是粗略的拇指规则、捷径以及某些手法熟练的小窍门。这些都是经过亿万年的自然选择,由实验和错误获得的。这是生物中熟悉的策略,但由于某种原因没有引起心理学家的注意,他们似乎忘记了大脑本身就是一个生物器官。……"我也同意拉马参准的如下表述:"直接打开黑箱去研究神经细胞的响应是解决这一问题的最好方法。但是心理学家和计算机科学家却常常对此心存疑虑"。

按照拉马参准的观点,现阶段视觉心理学家的主要任务不是构建复杂的数学理论来解释他们的结果,而是去勾画出所谓的视觉"自然历史",特别是视觉的旬级阶段。当视觉任务被分解成许多组成部分,特别是当显示出某些相互作用较弱或缺少时,我们就会知道到底哪些东西需要用神经元术语去解释。这些解释未必包括复杂的数学理论,但必定涉及相互作用的神经元的特性以及它们相互联结的细节。因此,由于视觉世界的复杂性,人们期望找到具有多种动态相互作用方式、粗糙但却有效的快速加工过程。

下一步我们就要了解人脑(和猴脑)以及组成它们的众多神经细胞和分子,这将是第二部分的主题。

①雷诺兹报告他的结果时使用的术语是"刺激前沿非对称"(stimulus onsel asynchrony)(SOA)。由于刺激的持续时间为50毫秒,因此,50毫秒的SOA意味着刺激结束后掩蔽立刻开始。我把它称为零延迟。

①请注意,被试者井非在一个实验中报告所有这些阶段。本结果是通过比较不同的掩蔽延迟之后的知觉做出的推论。

②我把里贝特(Libet)的某些研究工作放到第十五章去考虑。

①当然,对于那些进行视觉意识实验的人,最重要的是要具备视觉心理学和各种视知觉理论的详尽知识。这样,起码可以避免出现不应有的错误。

(2)"关于大脑,你需要知道的一切就是如何模拟它。"哲学家、人工智能专家和语言学家常常采纳这种观点。在逃避严格的科学方法的人中间,这种观点并不陌生。