第4章 见证和个案研究证据——安慰剂效应和了不起的兰迪

画面切换到奥普拉秀——过去十年中最著名的电视脱口秀节目之一——的现场。今天的嘉宾是俄狄浦斯人类潜能研究所的所长阿尔弗雷德·庞蒂菲科特(Alfred Pontificate)博士。这位博士新提出了一个有关出生次序的激进理论,这一理论的基本理念是:个体的生命进程是被家庭互动所设定的,而家庭互动是由出生次序决定的。奥普拉鼓励观众对此理论进行提问。讨论无可避免地由最初的理论关注,转向了为观众个人生活中的重要事件做出解释。这位博士欣然应允。

例如,“博士,我的哥哥是个不要命的工作狂。他对妻子和家庭完全不管不顾,并且把与工作有关的问题看得比什么都重。他有溃疡和酗酒问题,但他拒不承认。他们家在近两年内从没过过一个真正意义上的假期。他的婚姻也快玩完了,但他似乎并不是特别在乎。他为什么要选择这样一种自我毁灭式的生活呢?”

博士反问道:“亲爱的,他在家中排行第几?”

“哦,他是子女中的老大。”

“这就对了,”博士说道,“这在生活中比较常见。我们在临床上经常见到这种现象。这类现象出现的深层次原因是,父母将自身的愿望和挫折都转移到他们第一个出生的孩子身上。通过愿望的这种无意识的转化过程,即使父母从未明确要求过孩子,孩子也在内化这些愿望和挫折。然后,通过这种我称之为‘期望上旋’的动力过程,父母的抱负转化为孩子对于成功的病态的渴求。”

当嘉宾挑战观众的信念时,奥普拉秀的观众有时会提一些尖锐的问题,但当行为“专家”似乎是在印证观众的传统观念的时候,这种情况就很少发生。然而曾经有过那么一次,节目因为一位观众质疑嘉宾的主张而显得异彩纷呈。有一位热切而直率的观众当时正身处演播室,“但是请等一下,博士,”提问者开始了他的问题,“我的哥哥也是家里的老大。我的父母把那个笨蛋送到哈佛,而让我去了一个将来能够成为一名牙医的两年制专科学校。但他们的‘神童’在一年之后就辍学了,跑到了科罗拉多州的山顶上。我们最后一次见到他时,他正在编篮子!我搞不懂你关于‘长子’的说法。”

这位观众使现场气氛骤然紧张,但是博士总是能够逢凶化吉:“哦,是的,我也曾经见过很多像你哥哥一样的个案。是的,我经常可以在我的从业中遇到这样的人。他们的‘期望上旋’的动力过程发生中断,生成潜意识的要求来抵抗父母转化到他们身上的期望。这样的话,个体的生活规划会朝着与传统成就标准相反的方向发展。”一阵肃然的沉默之后,讨论转向了下一个“案例”。

这些场面我们都再熟悉不过了,只不过又是一个关于本杰明·拉什问题的例子罢了。关于出生次序的“理论”是在没有一个事例能够证明其“不成立”的思维框架下被构想出来的。由于它是一个不能证伪的理论,搬出再多能证明它的证据也没有意义,因为这个理论不能排除任何可能的情况。

然而,我们在本章所关注的并非这一理论本身,而在于那些用于支持它的证据。当被迫出示证据时,庞蒂菲科特博士搬出了他的“临床经验”或“个案研究”。这在媒体心理学领域是一个惯用的套路。脱口秀节目和通俗心理学图书中充斥着基于作者临床经验的心理学理论。他们通过这类渠道提供给公众的许多疗法,能够支持这些疗法的,无非是那些曾接受治疗并认为得到了改善或被治愈了的人的个人见证。在本章中,我们将为心理学信息的消费者建立一个非常有用的原则:个案研究和见证作为评估心理学理论和治疗的证据是毫无价值的。

在本章中,我们将要证明这个原则为什么是正确的,并且还要讨论个案研究在心理学中的正确作用。

个案研究的地位

个案研究的作用,很大程度上取决于科学探索在某个特定领域进展到什么程度。从个案研究或临床经验中获得的灵感,在特定问题的早期研究阶段或许比较有用,因为它们可以提示哪些变量需要进一步研究。个案研究在开启心理学新的研究领域方面起到过关键作用。让·皮亚杰(Jean Piaget)的工作中就是很著名的例子。皮亚杰的研究提出了一种可能性,即儿童的思维并不只是成人思维的简易版或低级版,而是有其自身结构的。皮亚杰关于儿童思维的部分推测已经被证实,但很多还有待证实(Bjorklund, 2004; Goswami, 2004)。然而,对于我们这里的讨论来说,更重要的不是皮亚杰的哪些思想被证实了,而是要理解,皮亚杰的个案研究尽管没有证实任何事情,但它为发展心理学家的研究提供了难以置信的广阔领域。第5章和第6章中所要介绍的相关研究和实验研究,为皮亚杰个案研究中提出的假设提供了或支持或否定的证据。

然而,当我们从科学研究的早期阶段(在此阶段个案研究可能是极为有用的)步入更为成熟的理论检验阶段之后,情况就大大不同了。由于个案研究在特定理论的检验中不能作为证实或证伪的证据,所以它在科学研究的后期不再有效。其原因就是:个案研究和见证叙述都是所谓的“孤立事件”,缺乏比较性信息,而这种信息对于排除其他可能的解释来说是必要的。

见证叙述与个案研究相似,因为它们都是孤立事件。依赖见证叙述的问题在于,如果累积起来的见证能够为几乎每一种疗法提供支持,那么它也就不可能用来支持任何一种特定的疗法,因为所有相互对立的疗法都有各自的见证。当然,我们想知道的是哪种疗法是最好的,但我们不能依据见证来决定。正如心理学家雷·尼克尔森(Ray Nickerson,1998)在评论我们用以欺骗自己的认知过程时所说的那样,“江湖郎中的骗术往往得逞,是因为他们总能找到一些病人愿意为他们做见证,这些病人总是发自内心地告诉别人,他们自己的确从治疗中获益匪浅”(p.192)。例如,有大量的见证声称潜意识自助式录音带(用一种低于听觉阈限的信号制作出来的录音带)可以提高人的记忆力,甚至提高人的自尊,然而,在严格控制条件下进行的研究显示,这类录音带对记忆力或自尊没有任何改进(Greenwald, Spangenberg, Pratkanis, & Eskenazi, 1991; Moore, 1995)。

“其他可能的解释”这一理念,对于理解理论检验来说至关重要。实验设计的目标就是构建某一事件或现象,使其只能用某一种特定的理论来解释,而其他理论则解释不通。正如第2章所说的,只有当我们收集的数据排除了其他可能的解释时,科学才能进步。科学为理论观点的自然选择创设了条件。有些理论观点经过实证检验存活了下来,而另一些则被淘汰出局,凡保留下来的都更接近真理。但是,这是个慢工出细活的过程,各种理论观点都必须经过细致审査,以便发现哪些更接近真理。但是这一过程必须有所取舍:为支持某一特定理论所收集的数据,不能同时支持许多其他可能的解释。基于这一理由,科学家在他们的实验中设有控制组,或称为对照组,以期得到比较性信息。这样做的目的,是为了能够在比较控制组与实验组的结果时,排除其他可能的解释。至于实验设计如何能做到这一点,将是后面几章的主题。

个案研究和见证叙述作为孤立的现象而存在,它们缺少必要的比较性信息,不能证明某一特定的理论或疗法更优越。因此,引用某个见证叙述或个案研究的结果来支持某一特定理论或疗法是错误的。如果这么做的那些人不指明他们所提供的所谓证据其实也适用于大量其他可能的解释,那他们就是在误导公众。简言之,针对某个现象的孤证具有高度的误导性。安慰剂效应的例子将更清晰具体地阐释这一论点。

为什么见证叙述毫无价值:安慰剂效应

几乎每种产生于医学和心理学的疗法都有一定数量的支持者,并且总能催生出一些发自内心认可其疗效的人。医学文献记载了猪牙齿、鳄鱼粪便、埃及木乃伊的粉末,以及很多更富想象力的东西都曾经具有疗效(Harrington,1997;Shapiro, 1960)。事实上,人们早已熟知,仅仅暗示正在接受某种治疗,就足以使许多人感觉病情好转了。

无论治疗是否有效,人们都会报告某种疗法曾经对他们有所帮助,这种倾向被称为安慰剂效应(Christensen, 2001; Ernst & Abbot, 1999; Harrington, 1997; Kirsch, 1999; Russo, 2002; Stewart-Williams & Podd, 2004)。安慰剂效应的概念在电影《绿野仙踪》中有绝佳的阐述。仙女并没有真的给铁皮人一个心脏,没有给稻草人一个大脑,也没有给狮子以勇气,但是他们都感觉更好了。实际上,直到近一百多年,医学才发展出较多具有确凿疗效证据的治疗方法,因此有人曾经这样说:“本世纪以前,整个医学史只能说是安慰剂效应的历史罢了”(Postman, 1988, p.96)

我们可以通过对生物医学研究的考察来说明安慰剂效应这一概念。在生物医学研究中,所有的新药研究程序都必须包括对安慰剂效应的控制。一般来说,如果在一组病人身上试验一种新药,就要组建一个患同样病症的对等组,给他们服用等量不含任何药物的药剂(安慰剂)。两组病人都不知道他们吃的是什么药。这样,两组进行比较时,安慰剂效应——即给予病人任何一种新的治疗都会使他们感觉好些的这种倾向——就能得到控制了。仅仅报告百分之几的病人吃了新药后症状得以缓解是不够的,因为如果没有控制组的数据,就不知道拫告症状缓解的病人是由于安慰剂效应还是药物本身的疗效。

安慰剂效应在抑郁症治疗中是29%(即29%的病人服用安慰剂后报吿症状缓解了),在十二指肠溃疡中是36%,在偏头痛中是29%,食道炎是27%(Cho,Hotopf, & Wessely, 2005)。一项研究(Bower, 1996b)建议,将安慰剂效应与当下流行的抗抑郁剂百忧解结合起来,将会最大限度地发挥药物自身的作用。安慰剂效应的效力是很强的,以至于曾有报告说有人对安慰剂成瘾(Bok,1974;Ernst & Abbot, 1999),这些人需要服用剂量越来越大的安慰剂来保持他们的健康状态!

当然,在有关药物治疗的实际研究中,安慰剂控制并不只是一个什么都不含的药片,而是含有当前认为最有效的药用成分。实验比较的目的在于揭示,新药是不是比当前最有效的药还要好。

你每次吃处方药时都会得到安慰剂效应的提示信息,下次吃处方药的时候(如果你非常健康,就看看你祖母的药吧!),仔细查看一下药物附带的说明书(或者登陆药品制造商的网站浏览一下),你将在药物问题说明里看到安慰剂效应的信息。例如,我吃一种叫做Imitrex(琥珀盐酸)的药物来缓解偏头痛。此药附带的说明书告诉我:控制研究已经证实,在服用一定量的药物之后,57%的病人在两个小时之内其症状得到了缓解(我就是这幸运的57%之一!)。但是说明书同时告诉我,同样的研究显示,这类偏头痛中安慰剂效应是21%——有21%的人在服药后两小时内症状得到缓解,即使他们服用的药物里是中性材料而非琥珀盐酸。

安慰剂效应在心理治疗中也很常见(Wampold et al, 1997)。许多有轻度和中度心理问题的人,在接受心理治疗后说他们的情况有所好转。然而控制研究证明:这一康复比例中,有相当一部分是由于安慰剂效应和时间推移这两个因素共同作用的结果,时间推移通常被称为自然康复现象。大多数有效的治疗都是由于治疗效果和安慰剂效应以某种不为人知的组合而产生的效果。正如多兹(Dodes, 1997)指出的:“即使严重的疾病也有恶化和缓解的时候;关节炎和多发性硬化症就是典型的例子。甚至癌症也会莫名其妙地消失”(p.45)。他同时也警告说,对于安慰剂的积极反应并不意味着病人的病是虚构出来的,他还警告,与流行的观念正相反,安慰剂可以是有害的:“安慰剂效应能够通过证实或强化想象中的疾病来‘诱发’慢性病。病人会对那些利用安慰剂效应的非科学从业者产生依赖。”(Dodes, 1997, p.45)

在关于心理治疗效果的研究中,怎样合理地对待安慰剂效应控制组,往往令人颇费周折。但是,这些复杂的问题不是我们在这里所要关注的,理解研究者为什么要将药物治疗的真实效果与安慰剂效应及自然康复区分开却很重要。高登·保罗(Paul,1966,1967)关于治疗效果的研究为我们提供了例子,告诉我们这类研究结果揭示了什么。保罗调查了几组学生,他们“在公开场合说话时会产生不适和焦虑”。实验组接受了针对语言紧张问题的脱敏疗法,85%的被试表现出显著的改善。安慰剂组拿到了一些药片,他们被告知这些药片是有效的镇定剂,但实际只是一个碳酸氢钠胶囊。在该组中,有50%的人表现出明显的好转。第三组根本没有接受任何的治疗,仍然有22%的人表现出明显的好转。这样看来,对于这一特定问题来说,自然康复比例为22%,另外28%表现出的改善产生于安慰剂效应(50%减去22%),脱敏疗法所具有的真实疗效则高于安慰剂和自然康复加起来的效果(85%>50%)。

和保罗的研究类似,其他研究也显示,心理疗法确实优于只用安慰剂所产生的效果(Hollon et al.,2002; Lipsey & Wilson, 1993; Nathan & Gorman, 1998; Shadish & Baldwin, 2005)。但是,使用了安慰剂控制组的实验也表明,仅报告有多大比例的人感觉自己有所好转,会严重高估治疗的实际效果。问题就在于,得到见证叙述简直不费吹灰之力。康奈尔大学的心理学家托马斯·吉洛维奇(Thomas Gilovich, 1991)指出:“人类拥有如此容易自愈的身体,即使医生不做任何事情,很多寻求医学帮助的人也将体验到积极的疗效。如此一来,当自然康复的比率很高的时候,即使是毫无价值的治疗手段也能显得有效”(p.128)。简言之,无论干预的效果如何,只要运用治疗干预,潜在的安慰剂效应就会显现。问题在于,安慰剂效应是如此强大,以至于无论某个人使用的疗法多么荒唐,只要是被应用于一大群人的话,总有一些人会乐于为它的效果做出见证(清晨头部击打疗法,每天使用让你神清气爽!给我寄10.95美元,你就可以得到这个特制的、经过医学测试的橡胶锤)。

但我们确实不应该拿这种严肃的事情开玩笑。轻信见证叙述和个案研究的证据可能会导致灾难性的后果。曾为抽动性秽语症做出科学界定——将之定义为器质性紊乱——的研究小组(Shapiro et al., 1978;见第2章)指出,人们对于个案研究证据的错误依赖,使得关于该病的、不可被证伪的精神分析理论长期盘据不去,阻碍了对于该病病理进行真正的科学研究。英国科学期刊《自然》的华盛顿记者史蒂芬·巴蒂安斯基(Budiansly, 1984)在总结医学领域中的这种现象时说了如下一段话,强调了很多我们在前面章节中提到过的一些科学的观点:

科学回避个人化的东西。虽然这种倾向常常被归结为科学家所应具备的冷静,但事实上,它确实是20世纪人类智慧的伟大战利品之一。科学家们深知,要探寻自然界的原因和结果,就必须排除个人的感觉及经验。健康科学曾经有过一个粗糙的阶段,人们生病有许多原因,大多数情况下,人们无论接受何种“治疗”之后,都会有所好转。各类庸医庸术之所以能够大行其道,凭借的就是那些对疗效满意的患者的见证叙述,这些活生生的例子,说明人们要跳出个人经验的束缚有多么困难。(p.7)

发表在《新英格兰医学杂志》(England Journal of Medicine)上的一篇社论,论述了在医学科学的从业者眼中个案研究和见证叙述的地位。“例如,如果这本杂志收到一篇论文,说一个患胰腺癌的病人在服用了大黄根(rhubarb)后康复了……我们可能会发表一篇个案报告,但是,我们发表它并不是宣告它为一种新的疗法,而仅仅是推荐它作为一个值得用正规的临床实验进行验证的假设。与之相反,关于各类偏方秘方的轶闻(通常发表在通俗书籍和杂志上)则没有做出这样的声明,并且这些轶闻本身也不足以作为支持那些疗效的文献。”(AngeU & Kassirer,1998,pp.839—840)。

“鲜活性”问题

安慰剂效应的存在,宣告了见证叙述作为证据是无效的,这么做尽管很痛快,但是我们必须意识到,还存在着另外一个障碍,它阻碍了人们理解这一问题。社会和认知心理学家已经研究了人类记忆和决策中的所谓“鲜活性效应”(Kunda,1999; Ruscio, 2000; Sinaceur, Heath, & Cole, 2005)。当面临问题解决或决策情境的时候,人们会从记忆中提取与当前情境有关的信息。因此,人们倾向于利用更容易获得的、能够用来解决问题或做出决策的信息。对可获得性造成强烈影响的一个因素,就是信息的鲜活性。

问题在于,再没有比发自内心的个人见证更鲜活、更引人注目的了,这都是一些已经发生的事或者是真实的事。个人见证的鲜活性常常令其他一些更可靠的信息黯然失色。购物时,我们在不同的品牌前权衡了半天,最后却由于某个朋友或某则广告对于另一产品的推荐,而在最后一刻放弃了自己的选择。买车就是一个典型的例子。在翻看了《消费者报告》中的数千份消费者调查之后,我们终于决定要购买一辆A品牌的车;又参考了几本汽车杂志之后,看到里面的专家们也都推荐A牌子的车,这更坚定了我们的选择——直到在一次聚会上,我们遇到一位朋友,他说他一个朋友的朋友买了一辆A牌子的车,结果是辆残次品,光维修就花了几百美元,而且这哥们决定再也不会买这个牌子的车了。显而易见,这样一个个别案例本不该在很大程度上影响到我们的决定,因为我们是在收集了针对数千名用户所做的调查报告和众位专家的评判之后才决定要买A牌子的车的。然而,我们中究竟有多少人能做到不把这个个别案例看得很重呢?

购买汽车的例子说明,鲜活的个人见证所造成的问题并非心理学领域所独有。鲜活性影响人们决策,这样的例子无论在哪个领域都不难找到。作家迈克尔·刘易斯(Michael Lewis, 1997)描述了政治评论家乔治·威尔(George Will)——一个声名狼藉的反对政府干预的人——是如何在目睹了一场发生在其家门口、导致有人死亡的车祸之后,发表专栏文章呼吁强制使用安全气囊的。

设想一下,一个周五的早上,你在报纸上看到下面这样一个标题:“喷气式客机坠毁,413人死亡”。天啊,你也许会想,多可怕的事故啊!发生了多么糟糕的事情啊!继续设想,在接下来一周的周四,你起床看到报纸写道:“另外一场空难,442人死亡。”“哦,不!”你也许会想。“不要再有任何灾难了,多么可怕啊,我们的空运系统怎么了?,,然后想象一下——请尽可能地想象——接下来的周五你起床时看到的是:“第三起空难悲剧:431人死亡。”不但是你,整个国家都会抓狂的。联邦政府会被要求尽快调查此事,所有航班禁飞,各种调查委员会如雨后春笋般成立起来,还有海量的法律诉讼被提起。《新闻周刊》和《时代》杂志将会对此作封面报道,它还会占据近期的电视新闻节目的头条。电视纪录片将会对此主题做深度挖掘。躁动和暄嚣是巨大而深远的。

这并不是一个虚构出来的问题,它是真实的。每周都有喷气式客机坠毁。也许不是一架巨型喷气式客机,而是很多小型飞机;或者也不是小飞机,而是小型交通工具,这种小型交通工具叫做汽车。在美国每周都会有超过350人死于汽车交通事故(每年超过19000人)(National Highway Traffic Safety Administration, 2004),人数足够坐满一架巨大的喷气式客机的了。

每周在高速公路上死于车祸的人数,相当于一架喷气客机的载员数,但我们对此漠然置之。这是因为,“能坐满一架喷气式客机的人死了”这一信息没有通过媒体以一种鲜活的形式传达给我们。因此,每周死于汽车交通事故的350人(加上每周死于卡车或摩托车的330人),对我们来说不具有鲜活性。我们在餐桌前不会像谈论一架喷气式飞机坠毁并且死了很多人那样谈论这些死于车祸的人。我们不会就汽车出行的安全性和必要性进行争论,但是,如果大型喷气式客机每周都发生坠毁,并且每次都导致350人死亡的话,我们就会讨论空运交通的安全性。车祸中死亡的这350人不会上新闻,因为他们分布在全国各地,因此对于我们中的大多数人来说只是统计学上的抽象概念。媒体不会为我们生动地呈现这350名死者,因为他们并不是死在同一个地方。相反,媒体呈现给我们的(有时候)是一个数据(例如,每周350人)。这已经足够引起我们的思考了,但是我们对此毫无反应。与我们生活中的其他任何行为相比,驾驶汽车都是一种极端危险的行为(Galovski, Malta, & Blanchard,2006; National Safety Council, 2001; Ross, 1999; Sunstein, 2002)。然而,关于它的风险和相对应的收益,从未有过全国性的大讨论。这对于住在郊外、需要驾车往返的人来说,是不是一个可以接受的代价?我们从不去问这样的问题,因为问题还没被意识到,而没被意识到的原因就是:代价和风险没有像空难那样以鲜活的方式呈现给我们。

想想下面这个例子的荒谬之处吧。一个朋友开车20公里载你去机场,因为你要乘飞机作一次750公里的旅行。分别的时候,你的朋友很可能会说,“一路平安”,这个临别赠言其实是具有悲伤的讽刺意味的,因为你的朋友在回家的20公里路上死于车祸的风险,要比你飞行750公里的风险高出3倍(National Safety Council, 1990)。这就是鲜活性问题,它解释了A对B的安全祝福存在着明显的不合理性,因为恰恰是A正处在更大的风险之中(Sivak & Flannagan, 2003)。

科尔(Cole, 1998)报道了这样一个民意测验,在环球航空公司(TWA)空难事故后,如果飞机能够提高安全系数的话,很多人都愿意为自己的往返机票多付50美元。同样是这些人,却拒绝为机动车中的安全功能支付50美元,即使那样会提供更加安全的保障。同样地,很少的人能够意识到,当他们驾车10公里去买一张彩票的时候,他们在车祸中丧命的几率要比他们获得头奖的几率高16倍(Orkin, 2000)!

这些例子并非只是假设,在“9·11”恐怖袭击事件之后,乘飞机出行的人数锐减,因为人们害怕飞行。当然,人们还要继续外出旅游,而不只是待在家里。他们只是改为其他方式出游——大多数情况下都是自驾车。但是,自驾游比飞行要危险得多,从统计学上讲,注定有更多人因转成自驾游而死亡。事实上,研究者估计,在2001年的最后一个月,有超过300人由于乘坐汽车而非飞机旅行导致死亡(Gigerenzer, 2004)。有一个研究团队能够以一种鲜活的统计来传达出驾驶机动车有多么危险。西瓦克和福兰纳根(Sivak & Flanagan,2003)计算出,如果驾车和乘坐飞机的危险系数是一样的话,那么“9·11”这个级别的事故将会每个月都发生一次!

在媒体的帮衬下,鲜活性误导个人判断的情况在其他领域里也同样广泛存在。一项研究(MacDonald, 1990; Cole, 1998; Radford,2005)调查了父母最担心他们的孩子遭遇哪种风险。结果显示,父母最担心的是孩子遭绑架,而这一事件发生的概率是1/700000。相形之下,父母则不太担心孩子在车祸中身亡的危险,然而这种可能性比遭绑架要高出100倍。显然,对绑架的担心大部分是媒体渲染的结果。这项研究结果说明,由于鲜活性效应对知觉的扭曲,“美国父母所担心的竟是一些不大可能发生的事”(MacDonald,1990)。一个研究人员哀叹道:将担心聚焦在“当下流行”的事件上,势必会误导父母的注意力,导致他们“忽视了他们本来能够施加更多影响的方面,例如学业成绩、看电视的坏习惯、吸毒和驾车安全等”(MacDonald,1990)。

作家彼得·鲍耶尔(Boyer,1999)描述了支持持枪自由的议员们如何以同样的方式培养美国人对危险的错误知觉,他们试图将公众的注意力放在“入侵者”破门而入的鲜活案例上。这里的潜台词是:拥有一杆自我保护的枪将会降低你的风险。鲍耶尔(1999)指出了具有讽刺意味的事实,当真实的统计展示了真正的问题在于“枪在好人手里”的时候,枪械制造工业却力图关注“枪在坏人手里”。在这个国家,罪犯并不是导致大多数枪击死亡案的原因。饮弹自尽的人数事实上要远多于被枪杀的人数。大多数死于枪支的人都是枪支走火和自杀——这就是为什么有研究指出,把枪支带回家实际上反而增加了家庭的风险(Miller,Azrael, & Hemenway, 2002; Samuels, 2004)。

最后,我们对可能患上糖尿病的担心要小于对因感染葡萄球菌而住院的担心,即使前者波及450万美国人,而后者每年只有1500人而已(Fountain, 2006)。这是因为,就个人而言,我们能够对前者做出一些对策(改变饮食或者锻炼),而对后者却无能为力。

单一个案的压倒性影响

人们有这样一种倾向:即使能够获得更为精确的信息,人们的判断也常常受到某个突出例子的影响,对此心理学家已经进行了广泛的研究。威尔逊和布里克(Wilson & Brekke,1994)证明了鲜活性问题是多么具有欺骗性,以及它是怎样影响实际的消费者行为的。他们调查了两类信息如何影响人们选择两个不同品牌的避孕套(品牌A和品牌B)。一类信息是《消费者报告》杂志中的一篇调查报告,另一类则是两个大学生对于偏好的避孕套品牌的观点。首先,威尔逊和布里克调查了一组被试,询问他们更乐于受哪种信息的影响。该组中超过85%的被试都认为比起两个学生的观点,他们更乐于受《消费者报告》文章的影响。研究者随即招募了一组相似的被试,在研究中,被试被告知他们将会免费得到一些他们自己选择的避孕套。被试被告知可以参考以下两类信息中的任何一类或两类:一类信息是在《消费者报告》杂志中的一篇调査报告,另一类是两个大学生的观点。尽管此组中只有不到15%的人愿意接受两个大学生的观点,但还是有77%的人同时询问了两类信息。很显然,被试无法抵御他人见证的诱惑,尽管他们不认为自己会受其影响,但他们事实上却被影响了。当被试同时选择了解两类信息并且这两类信息相互冲突时,接受学生推荐意见的人数比接受《消费者报告》推荐意见的人数多31%。

另外一个关于人们如何对鲜活的轶事信息做出不同反应的例子,来自于在20世纪60年代中后期媒体对越战的报道。随着战事的拖延,美军的死亡人数仿佛无休止地增加,媒体开始报道当周美军死亡的人数。一周接一周地过去了,这个数字在200至300之间徘徊,公众似乎已对这种报道习以为常了。然而,某杂志用几个版面的篇幅连续刊登了前一周阵亡者的个人照片。这时公众非常具体地看到了在这样一个有代表性的一周内逝去的大约250个鲜活的生命。结果,此举导致了大规模的、针对这场代价巨大的战争的抗议声浪。250张照片所产生的影响是每周数字报道所远不能及的。但是作为一个社会成员,我们应该克服这种不相信数字、必须亲眼目睹才去相信的倾向。绝大多数影响我们社会的复杂因素都只有靠数字才能捕捉。只有当公众学会像重视图像材料一样重视以数字形式表达的抽象材料时,公众自己的立场才不会像屏幕上闪过的最新图像那样变化无常。

2004年,一档叫做《晚间在线》的电视节目在伊拉克战争一周年之际,公布了在这场战争中死亡的700多名战士的名字和照片,在这一时刻,历史又重演了。这一做法与该档节目在“9·11”事件一周年之际播放受害者的姓名和照片的套路完全相同,当时这些照片的播放都征得了受害者家属同意。然而,死亡士兵的照片还是引发了战争支持者的抗议。有些人控诉节目主持人泰德·考佩尔对这场战事抱有敌意,但是这些指控显然瞄错了对象,因为考佩尔并不反对这场战争。相反,考佩尔说,“你们中的一些人深信我是反对战争的,其实我并不是,但这不是重点。我只是反对那种一直以来的幻觉,即认为战争仅牺牲少数人,不会连累我们余下的人”(CNN.com,2004)。战死的人数并非没有被报道,这700多人死亡的消息日复一日地出现在这个国家的每一份报纸上。但是争论的双方都知道,公众尚未对那些数字进行“加工”——没有计算代价,是因为那些数字还太过抽象。双方都知道很多人在看过这些照片之后,都会从头对这些信息进行加工,并开始真正在意战争的代价。

不仅公众受到鲜活性问题的困扰,在心理学和医学领域,有经验的临床从业者一直都在努力摆脱个别案例的压倒性影响给他们的决策带来的阴影。作家弗兰辛·卢素(Russo,1999)描述了弗吉尼亚大学的肿瘤专家威利·安德森面对的两难境地,安德森一直提倡控制实验,并会定期招募一些病人来做有控制的临床测试。但是他仍旧纠缠于自己对突出个案的反应,那些鲜活的个案对他的决策产生了影响。尽管他相信科学,但仍承认“当真实的人眼巴巴地看着你的时候,你将被他们的期望以及自己对他们期望的期望所包围,这确实非常困难”(p.36)。但是安德森知道,有时对他的病人来说,最好的办法就是忽略“看着你的那个真实的人”,并且遵循最佳证据的指示。最佳证据来自于有控制的临床试验(将在第6章表述),而不是看着你的那个人的情感反应。

评估证据的时候,鲜活性问题是一个我们都要面临的难题。并且,在这样一个充斥着媒体影像的环境中,对于社会来说,不受影像支配而基于有效的证据来解决自身的问题变得越来越困难了。作家巴瑞·格拉斯纳(Glassner,1999)讲述了一个特别相似的例子。在1995年的一场奥普拉秀中,围绕着某一次外科手术而展开讨论(这里不具体说出外科手术的名字,以免渲染鲜活性效应)。这种手术引起了一些争议,因为一些人声称在手术过程中受到过伤害。来自梅奥临床医院、哈佛大学和密歇根大学的研究证据都显示,这种手术总体上是没有危险性的。就在此时,一位声称受到过伤害的妇女从观众席里跳出来并喊道:“我们就是证明,我们这些坐在这儿的人就是结论!(Glassner,1999,p.164)。你认为哪种说法会让数百万电视观众记忆犹新——是来自梅奥临床医院的研究,还是大喊自己就曾受到过伤害的那位妇女?

总之,过于依赖见证证据的问题一直存在。此类证据的鲜活性常常掩盖了更加可靠的信息,并且混淆视听。心理学教师担心的是,仅仅指出依赖见证证据的逻辑谬误,并不足以让人们从一个更深的层次理解这类数据的缺陷。我们还能做些什么呢?还有什么其他的方法能让人们理解这个概念吗?幸运的是,我们还有一个法宝——一种与学术方法略有不同的方法。这种方法的本质是以鲜活性来对付鲜活性,是以一种“以彼之道,还施彼身”的方法对付见证证据,让见证用自身的荒谬来击溃自己。这个方法的实践者,就是独一无二、毋庸置疑的“了不起的兰迪”!

了不起的兰迪:以彼之道,还施彼身

詹姆斯·兰迪(James Randi)是一位魔术师,并且是个多面手,他曾经被麦克阿瑟基金会授予过“天才”奖。多年来,他一直尝试着教公众学会一些基本的批判性思维的技巧。“了不起的兰迪”(Amuirig Randi,他的艺名)通过揭穿“通灵”骗术和庸医疗法来达到教育公众的目的。尽管他拆穿了很多魔术和伪装的所谓“通灵术”,但最为著名的,还是他拆穿20世纪70年代通灵术超级明星尤里·盖勒(Uri Geller)的把戏的那一回。盖勒靠吹嘘通灵术红透荧屏,他对媒体的蛊惑程度简直可以用无以复加来形容。各大洲的报纸、电视节目和主要的新闻杂志对他争相报道(盖勒仍健在,还在写书;Radford, 2006)。兰迪发现并揭露了盖勒经常表演的通灵术“绝活”其实不过是些普通和简单得令人难以置信的魔术把戏,包括使勺子和钥匙弯曲、使钟表开始走动等等,这些对于一个优秀的魔术师来说,简直就是家常便饭。自从盖勒被拆穿以后,兰迪继续将他那非凡的才智用于维护公众的知情权,他不断揭露超感官感知、生物节律、超自然力、通灵外科手术、天外来客、漂浮术以及其他伪科学的谬误,帮助公众了解真相(Randi, 1983, 1995, 2005; Sagan, 1996)。

兰迪的另外一个兴趣就是去证明,对于任何一个荒谬的事件或无中生有的言论而言,获得见证是多么地容易。他的手法就是,让人们掉进其见证所编织的陷阱里。兰迪常常使用脱口秀这一理想的美国文化载体来实现他的目的。他经常作为嘉宾出现在节目中,但不以真名示人。在几年前纽约的一个节目中,他对观众说,今天早晨开车经过新泽西的时候,他看到一个澄色的V形物体飞过头顶飘向北方。几秒钟之内,正如兰迪所说,“电台的接线总机像一棵电子圣诞树般闪烁起来”。一个接一个的目击者打电话过来证实这一奇异的景象。可他们运气不好,这一“景象”只是兰迪想象出来的,但是打电话的人提供了许多兰迪“忽略了”的细节,包括其实有多个“飞碟”飞过。这个小小的把戏证明,个体关于“某事发生”的报告是多么不可靠。

在加拿大的温尼伯市,兰迪在一个广播节目中以“星相学家”的身份出现。节目一周前,听众被要求提交他们的笔迹样本和出生日期。有三个人被甄选出来,并且进行电话连线,这样兰迪就可以“解读出”他们的性格特征。他大获成功,三位听众在1-10分的准确性量表上给出的评分分别为9、10和10。兰迪在节目的最后向听众解释了他的秘诀。他其实只是逐字逐句地读出了占星师希德尼·奥马尔在最近的一个电视节目中给三个观众的“解读”而已。

在另外一个广播节目中,兰迪揭示了另外一种伪科学——生物节律能够如此流行的原因(Hines, 1998, 2003)。一位听众同意每天都记日记,并将日记与一份特别为她准备的两个月的生物节律表做比较。两个月以后,她打回电话告诉听众:生物节律绝对不是盖的,因为节律表预测实际行为的准确率超过了90%。兰迪不得不把他的秘书所犯的一个愚蠢的错误告诉给这位听众,秘书错误地将本该发送给另外一个人的节律表发给了她,而不是她自己的。然而,这位妇女还是同意看一下真正属于自己的表格是怎样的,于是,又一份表格立即发送给了这位妇女,并且请她再打电话过来。几天后,这位妇女带着解脱感打进电话,说她自己的表格也同样十分准确——事实上更为准确。在下一期节目中,大家发现,另一个错误发生了。这位妇女收到的是兰迪秘书的节律表,而不是她自己的!

兰迪的生物节律和占星术小把戏,其实是一种被命名为巴纳姆效应(Bamum,著名的嘉年华和马戏团的团主,提出了“每分钟都会有人上当受骗”的说法)现象的范例。这一效应曾被心理学家广泛地研究(例如,Dickson & Kelly,1985),研究者发现,大多数成年人都会认为泛化的个性总结都是准确的,并且都是对自己独特的描述。这里有一个来自谢尔默(Shermer, 2005, p.6)的例子:

你是一个非常体贴的人,总是及时地帮助别人。但是也有一些时候,你会发现你有一点点自私……有时候你太忠于自己的感受以至于会暴露过多的自己。你善于思考,并且对任何事情,在改变想法之前都希望看到证据。如果你处在一个陌生的环境下,你会非常小心,直到你看清楚发生了什么事情,然后才会充满信心地行动……你知道怎样做一个好朋友,你懂得训练自己,所以在别人看来你都在掌控之中,但其实有些时候你是缺少安全感的。你希望在人际关系中比现在更受欢迎,更加自如。你面对世界表现得很有智慧,这种智慧来源于艰难的体验而非书本学习。

大多数人都发现,这个总结是对其个性非常准确的概括,但是很少有人自发地意识到大多数其他人也同样认为它描述了他们自己!许多众所周知的语句和措辞(如这个例子)使很多人认为适用于他们自己。谁都能够将其作为一个个人化的心理“分析”提供给“顾客”,而这些顾客常常会为个人化的“性格解读”的“准确性”而感到震惊,却不知道其实每个人的解读都是一样的。当然,巴纳姆效应正是手相学和占星术的基础(Kelly, 1997, 1998)。巴纳姆效应还可以证明产生见证有多么容易,以及为何见证毫无价值。

这就是詹姆斯·兰迪运用这些小把戏努力想要达到的目的——给人们好好上一课,告诉人们见证证据是没有价值的。他不断地证实,形成有利于虚假主张的见证是多么容易。正是这个原因,用见证来支持自己提出来的特定理论是毫无意义的。检验一个主张时,只有来自于有控制的观察中的证据(第6章中将会描述)才是足够充分的。

见证为伪科学打开方便之门

有时候有人会说,类似刚才所讨论的种种伪科学,只不过是人们给自己找乐子的一种方式,无伤大雅。再者说,我们又何必较真呢?不就是有几个人在异想天开,而另外几个人从中赚点儿小钱吗?

然而,对此问题进行一番彻底的考察就不难发现,伪科学的盛行对社会的危害比人们想象的要大得多。在一个复杂的、科技化的社会中,一些能够影响千万人的决策会为伪科学的影响推波助澜。也就是说,即使你并不认同这些伪科学的观念,你也可能受到这些观念的影响。例如,大银行和一些500强企业雇佣笔迹学家来做人事选拔(Sutherland, 1992),即便大量的证据表明,笔迹学在实现这一目的方面是没有作用的(Ben-Shalfhar,Bar-Hillel, Blui, Ben-Abba, ScFlug, 1989; Neter & Ben-Shakhar, 1989)。伪科学的笔迹学指标在一定程度上使雇主忽视了其他更有效的选拔标准,导致的结果是经济上的零效益和对一些人的不公平待遇。如果仅仅因为笔迹中有一个连写的“小圈圈”,就让你丧失了获得一份你很心仪的工作机会,你会作何感受?或者,你求职被拒,只是因为一个“通灵师”从你的“气场”中看到了一丝扰动,你又会作何感受?事实上,这类事情的确发生在一些人身上,一些公司会花钱请人为求职者进行“通灵分析”。例如,苏姗·金(SusanKing)是一个所谓的“通灵大师”,公司花钱请她运用“读心术”来为人事决策提供帮助。“尽管一些雇主会请她来参与最后一轮面试,或者在随后的鸡尾酒会上让她去观察一些入围的候选人”,但她宣称她甚至不需要见到这些申请者——她可以从照片或是他们的姓氏中发现问题(Kershaw,1991)。在这样一个竞争激烈的经济时代,这是你所期望的决定自己能否获得一份工作的方式吗?

不幸的是,这样的例子绝非凤毛麟角(Shermer, 2005; Stanovich, 2004; Sternberg, 2002)。当伪科学的观念渗透于整个社会的时候,我们都以不同的方式受到影响——即使我们并不认同这些信念。例如,警局雇通灵师协助办案(Marshall, 1980),即便研究表明这一举动是没有任何效果的(Hines, 2003; Rowe, 1993)。ABC电视网络的制作人居然花钱请好莱坞的通灵师帮助他们确定节目内容,要知道电视网络可是当今社会最具影响力的通信科技(Auletta, 1992, p.114)。最令人大跌眼镜的是,有个占星师曾受雇于里根时代的白宫,专门为“总统演说的时机、穿着打扮、与州长会面、飞机的飞行时刻表甚至讨论的议题等”这类事项提供建议(Johnson, 1991, p.454)。

如今,类似占星术这样的伪科学是一项巨大的产业,涉及报纸专栏、广播节目、图书出版、网络、杂志文章以及其他各种传播渠道。星相学杂志的发行量要比很多正规的科学杂志大得多。据美国众议院老龄化问题委员会估算,浪费在医疗骗术上的钱已经达到数十亿美金。简而言之,伪科学是个油水颇丰的行当,数以千计的人靠公众的盲信盲从而获得收益。

医学领域中的伪科学话题具有借鉴意义,因为在抨击伪科学,以及把正规的与不正规的医疗实践划清界限方面,医学界的各类组织都比心理学界表现得更为激进和勇猛。下面就让我们看看由关节炎基金会出版、曾被美国众议院老龄化问题委员会所引述的一套识别不道德药品推销员的指南:

1.他或许会提供一种用于治疗关节炎的“特别的”或“秘密的”处方或设备。

2.他会做广告,用的都是“个案史”和“满意患者”的见证。

3.他或许会承诺(或者暗示)能够快速或轻松见效。

4.他也许会声称知道关节炎的成因,并且说能够“清除”你体内的“毒素”,同时促进你的健康。他或许会说外科手术、X光和医师所开的处方是没有必要的。

5.他或许会指责“医学体制”故意阻碍了进步,或者迫害了他……但是他不允许他的方法以已有的或已获证明的方法来验证。(U.S.congress, 1984, p.12)

这份清单同样可以作为识别带有欺骗性的心理学疗法和理论的指南。在这里,请注意第2条,这正是本章关注的焦点。同时注意,第1条和第5条论证了之前所讨论过的一个观点:科学是公开的。除了宣扬见证叙述作为“证据”,伪科学的从业人员经常以指责他人有意要压制他们所获取的“知识”,以此试图逃避“公开可证实”这一科学的标准。这样,他们就有借口带着他们的“研究成果”直接走进媒体,而不是通过正规的科学出版程序将这些成果公诸于世。通常,这种伎俩在心理学领域中更为成功,因为相比于其他科学领域,媒体通常对心理学的正常科学机制缺乏尊重。记住这一点,这很重要(在第12章中我们将会深入讨论这个问题)。媒体从来不会考虑去报道物理科学中未经证实的主张,但如果这类主张是心理学方面的,就会被当做正规的心理学话题加以报道,因为新闻记者早就被宣扬“心理学里没有规则”的伪科学洗了脑。然而,消费者必须意识到,电视和纸质媒体只要认为读者有需要,就会报道心理学领域中任何出格的主张,无论这些主张与已有证据之间是多么矛盾。最终的受害者是公众。

有关神奇疗法的宣传助长了人们的错误希望,当希望破灭时,会给人们造成心理上的致命打击。在我关于这个问题所掌握的例子中,其中最卑劣的案例之一就是一篇来自杂货店小报的文章,标题冠以“通灵师展示肓人如何通过超感官知觉看见东西”。人们可能会由于身陷伪科学的重重包围而无法获得真正科学的知识,通灵外科手术的倡导者暗中怂恿人们把钱花在骗人的疗法上,并且忽视对患者有帮助的传统的“非通灵的”的医疗手段(Angell & Kassirer, 1998)。在一个关于医疗保健欺诈行为的市民大会上,“密歇根反健康欺诈顾问委员会”的主席展示了一则骗人的、治疗癌症的小册子,上面写着“本产品不能与其他癌症疗法同时使用”(“听上去像真的”,1990)。类似案例已造成的损害是无法估算的。

心理学家越来越关注医学骗局在互联网上的蔓延,以及它对健康带来的损害。麦克斯·考皮斯(Max Coppes)博士不得不给《新英格兰医学杂志》写了一封信,警告人们注意医学中的伪科学所带来的危害(Scott, 1999)。他描述了一个9岁女孩的案例,这个孩子在经历癌症手术之后,如果接受化疗的话,将会有50%的机会可以多活3年。但她的父母找到一种未经验证的、利用鲨鱼软骨的偏方来代替化疗。小女孩在4个月后失去了生命。

当我正在讲述这个话题的时候,经常有人会针对我的演讲提出非常中肯的问题:“你不也是正在用生动的个案来阐述你的观点吗——这种做法难道不正是你所反对的吗?”这个问题问得好,并且它让我有机会详细阐述本章中包含的一些论点间的微妙之处。这个问题的答案是肯定的,我运用了生动例子来阐述观点。但是,是为了阐述观点,而不是为了证明观点。这里的关键是要区分两点:主张的提出和主张的交流。对于每个主张,我们都能问这样一个问题:它是不是基于鲜活的见证?这会产生四种可能的情况:

1.一项主张基于鲜活的见证,同时依靠鲜活的见证来交流

2.一项主张基于鲜活的见证,同时不依靠鲜活的见证来交流

3.一项主张基于证据而非鲜活的见证,同时依靠鲜活的见证来交流

4.一项主张基于证据而非鲜活的见证,同时不依靠鲜活的见证来交流

本章中的一些讨论属于第3种情况:一项主张基于证据而非鲜活的见证,同时依靠鲜活的见证来交流。例如,我引用了很多非见证的证据贯穿整章,就是为了说明:个案研究的证据不能用于建立因果性结论,鲜活的例子在人们的判断中被赋予了过高的权重,伪科学的代价巨大等等。对于这些主张中的每一项,我都标出了引证和参考文献。尽管如此,出于交流的目的,我使用了一些鲜活的案例,将注意力吸引到这些主张上,并让它们给人们留下深刻的印象。关键的一点是,支持这些主张本身的并不仅仅是鲜活的见证。比如,我曾使用一些鲜活的例子来阐述“鲜活的例子在人们的判断中被赋予了过高的权重”这一事实,但是这一主张的证据包含在我所引用的经过了同行评议的科学证据之中(例如,Kunda, 1999; Lassiteret al., 2002; Nisbett & Ross,1980; Sinaceur, Heath, & Cole, 2005)。

回到这部分的主要观点上并做个总结吧:伪科学的传播所造成的代价是巨大的。需要搞清楚哪种类型的证据能够揭示某种现象中蕴含的道理或理论是否可信,如果搞不清楚这一点,就会大大有利于伪科学的传播。由于见证叙述可以为任何主张提供唾手可得的支持,以及自身所具备的冲击力,见证打开了通往伪科学的大门。对于心理学信息的消费者来说,对它们保持警惕应当是头等大事。在接下来的几章中我们将会看到,在证实某种主张的合理性时,究竟需要哪些类型的证据。

小结

个案研究和见证叙述在心理学(以及其他科学)研究的早期阶段是有用的,因为此时,寻找有趣的现象和待研究的关键变量很重要。虽然个案研究在早期的、理论形成前的阶段是有用的,但在研究的后期,当对理论进行检验之时,个案研究就毫无用处了。这是因为,作为一个孤立现象,个案研究的结果遗漏了太多其他可能的解释。为何个案研究和见证证据对于理论检验来说是没有用的?要想理解这一点,就需要想一想安慰剂效应。安慰剂效应是指,无论疗法是否包含了有效的成分,人们都倾向于报告任何疗法都对他们有效。安慰剂效应的存在,催生了许多关于疗效的见证叙述,致使对一种心理(或医学)疗法效果的证明成为“不可能的任务”。原因就在于,无论治疗手段是什么,安慰剂效应都会使人们提出证实其疗效的个人见证。

尽管见证证据在检验理论的时候是无用的,但心理学研究指出,由于鲜活性效应,这类证据经常被人们过分地倚重:对于更为生动、并因此在记忆中更易提取的证据,人们会赋予其过高的权重。对大多数人来说,见证证据就是一种格外生动和鲜活的信息,因此,人们在验证某一心理学主张的合理性时,会过度依赖这类证据。事实上,理论主张是否合理,是不能用见证叙述和个案研究的证据来判定的。