对“伪心理学”说不_第2章可证伪性——如何捕捉头脑中的小精灵

第2章可证伪性——如何捕捉头脑中的小精灵

1793年，一场严重的流行病黄热病袭击了费城。当时，这座城市里有一位顶尖的医生名叫本杰明·拉什（Benjamin Rush），他是独立宣言的签署人之一。在灾难过程中，拉什是少数几位确实治疗了几千例黄热病的医生。拉什信奉一种医学理论，认为黄热病必须用大量放血的方法治疗（用手术刀或水蛭吸血的方法使血液离开身体）。他为许多病人实施了这种疗法，当他自己感染这种疾病的时候，他也如法炮制。评论家指责他的治疗方法甚至比疾病本身更危险。然而，随着疾病的流行，拉什对他的疗法却更加自信了，即便曾有几个病人死去。这是为什么呢？

有人这么总结拉什的态度：“一方面坚信自己的理论是正确的，另一方面又缺乏有效的方法对治疗效果进行系统研究，因此他将每个好转的病例都归为治疗方法的功效，而将每个死亡的病例都归为病情的严重性”（Eisenberg，1977，p.1106）。换句话说，如果病人情况好转，就被作为放血疗法有效的证据；如果病人死掉了，就被拉什解释为病人已经病入膏肓，无药可救。我们现在知道为什么对拉什的批评是正确的了：他的治疗方法和黄热病本身一样危险。在本章中，我们将要讨论拉什错在哪里。他的错误为阐明科学思维中最重要的一项原则提供了样本，而这一原则在评估心理学理论时尤其有用。

本章中，我们关注第1章中已经讨论过的科学的第三个基本特征：科学只研究可解的问题。科学家们所说的“可解的问题”通常是指“可检验的理论”。科学家要确认某个理论是不是可检验的，采取的方法就是确保该理论是可证伪的，也就是说，理论对应着自然世界中的真实事件。接下来，我们就要看一看为何所谓的可证伪性标准在心理学中如此重要。

理论和可证伪性标准

本杰明·拉什在评估其疗法的效果时跌人了一个致命的陷阱。他的评价方法根本就不可能让人得出其治疗方法无效的结论。如果说，病人的恢复是对他治疗方法有效性的肯定（对其医疗理论的肯定），那只有当病人的死亡是对其治疗方法的否定时才算公平。但事实上，他却把这种否定合理化了。拉什解释证据的方式，违反了科学理论建构和检验应遵循的最重要原则之一：他令自己的理论不能被证伪。

科学理论的表述应该遵循这样的原则——从中得出的预测有可能被表明是错误的。因此，对某理论的新证据进行评价，必须使新的数据具有证伪该理论的可能性。这项原则通常被称为“可证伪性标准”。一位叫卡尔·波普尔（Karl Popper）的哲学家一直致力于强调可证伪性标准在科学进程中的重要作用，他的文章被现在仍从事科研工作的科学家们广泛阅读（Magee, 1985）。

可证伪性标准主张，一项理论如果有用，它所做出的预测必须是明确的。理论必须两面兼顾，也可以说，这项理论在告诉我们哪些事情会发生的同时，应该指出哪些事情不会发生。如果不会发生的事情确实发生了，我们就得到了一个明确的信号——这项理论有问题：它可能需要修正，或者我们需要去寻找一个全新的理论。不管哪种方式，我们将最终有一个更接近真理的理论。相反，如果一项理论预测包括了所有可能观察到的数据，那么它将永远不能被修正，同时我们将被禁锢在当前的思维方式中，失去了取得进步的可能。这就是说，一项成功的理论并不是可以用来解释所有可能的结果，因为这样的理论本身就丧失了任何预测能力。

在这本书的余下部分，我们会经常涉及理论的评估，因此我们必须澄清一个关于理论的常见误解。这个误解体现为我们常说的一句话：“哦，这只不过是一种理论。”这句话代表了外行人使用“理论”这个词时通常所指的意思：一项未经证实的假设，一个纯粹的猜想或直觉。这意味着一个理论与其他理论并无优劣之分。“理论”这个词在科学上绝对不是这么用的。当科学家说到“理论”的时候，他们指的不是未经验证的猜想。

科学上的理论是一组具有内在联系的概念，它们能对一组数据做出解释，并对未来实验的结果做出预测。假设是从理论中产生的具体预测（理论则更加普遍和全面）。目前可行的理论是那些产生了一些假设，并且其中许多已经得到了验证的理论。因此这种理论的理论结构与大量的实证观察相一致。然而，当观察数据开始与理论中提出的假说相矛盾的时候，科学家们会尝试构建一个能为数据提供更好解释的新理论（或者，在更通常的情况下，只是修正已有的理论）。因此，目前在科学范畴内所讨论的，都是在一定程度上已经被证实了的、所做出的预测并没有与现有的数据相矛盾的理论。它们并非纯粹的猜想和直觉。

外行人和科学家们使用“理论”这个词时的这种差异，经常会被一狴试图将神创论纳入公立学校教育的虔诚的正统基督教徒所利用（Forrest & Gross, 2004; Scott, 2005; Talbot, 2005）。他们的论点通常是“进化论毕竟只是理论”。这种观点试图借用外行人对“理论”术语的用法，蓄意将理论歪曲为“只是一个猜想”。然而，通过自然选择的进化理论不是外行人所理解的“理论”（相反，在外行人的理解中，它应被称之为“事实”，见Randall, 2005），而是一个科学意义上的理论，是由一系列庞大而多样的数据支持的结论（Maynard Smith, 1998;Ridley, 1996, 1999; Scott, 2005）。它并不等同于其他任何猜想，不是一个纯粹的猜测。相反，它与从属于其他学科的知识紧密相联，这些学科包括地质学、物理学、化学以及生物学的各个分支。著名的生物学家西欧都萨斯·杜赞斯基（Theodosius Dobzhansky）（1973）在他的一篇题为《生物学中除了进化论以外，别无他物》（Nothing in Biology Makes Sense Exceptin the Light of Evolution）的著名文章里就阐述了这—观点。

敲门节奏理论

下面假设一个例子来展示可证伪性标准是如何起作用的。一个学生在敲我的门。踉我同一办公室的同事有一套“不同的人以不同的节奏敲门”的理论。在我开门之前，我的同事预言门后是一位女性。我打开门，这个学生确实是女的。事后我告诉同事，他的表现令我惊叹，但这种惊叹程度非常有限，因为，即使没有他所谓的“敲门节奏理论”，他也有50%的正确几率。他说他的预测能高于随机水平。另一个人来敲门，我的同事预测说，这是个男性，而且不到22岁。我打开门，果然是个男生，而且我知道他刚从中学毕业。我承认我有点被震撼了，因为我所在的大学有相当数量的学生是大于22岁的。当然，我仍然坚持说校园里年轻的男性相当普遍。见我如此难以被取悦，我的同事提出做最后一次测试。在下一个人敲门之后，我的同事预测：女性，30岁，5英尺2英寸高，左手拿书和挎包，用右手敲的门。打开门后，事实完全证明了预测，对此我的反应截然不同了。我不得不说，如果我的同事不是使用诡计事先安排这些人出现在我门口的话，我现在的确非常震惊。

为什么我的反应会不同呢？为什么我同事的三次预言会让我产生三种不同的从“那又怎么样？”到“哇哦！”的反应？答案与预测的具体性和精细度有关。越精细的预测在被证实的时候会给我们越大的触动。要注意，不管怎样，精细度的变化和可证伪性直接关联。预测越具体和精细，有可能证伪它的观测现象就越多。例如，有很多不是30岁和5英尺2英寸高的女性。请注意这里的暗示：从我截然不同的反应可以看出，一个能够预测出最多不可能事件的理论最容易将我征服。

好的理论做出的预测总是会显示自己是可证伪的。坏的理论不会以这种方式把自己置于危险的境地，它们做出的预测是如此笼统，以至于总会被证明为正确的（例如，下一个来敲我门的人会是100岁以下），或者，这些预测会采用一种能免于被证伪的措辞方式（如本杰明·拉什的例子）。事实上，当一种理论被置于“不可被证伪”的保护下，那么可以说它已经不再是科学了。事实上，哲学家卡尔·波普尔正是由于试图界定科学和非科学的区分标准，才会如此强调证伪原则的重要性。这里的讨论和第1章中我们有关弗洛伊德的讨论，甚至与心理学之间都有直接的联系。

弗洛伊德与可证伪性

在本世纪最初的几十年，波普尔一直在探寻，为何一些科学理论似乎导致知识的进步，而其他一些则导致智力停滞（Hacohen，2000）。例如，爱因斯坦的广义相对论引发了一系列惊人的发现（例如，从一个遥远的恒星发出的光线经过太阳附近时发生弯曲），恰恰是因为它是这样建构预测的：许多事件或现象一旦被证实与之相矛盾，就可以证伪该理论。

波普尔指出，一些使知识停滞的理论却并非如此，并以弗洛伊德的精神分析法作为例子。弗洛伊德的理论使用一个复杂的概念结构，在事后解释人类行为，但并不做事前的预测。它可以解释一切，但是波普尔认为，也正是这个属性使得它在科学上无用。它不做具体的预测。精神分析理论的拥护者花费大量的时间和精力试图用他们的理论解释人类所有已知的活动——从个人的怪癖行为到广泛的社会现象，但他们在使这个理论成功地成为事后解释的丰厚资源时，也剥夺了其所有的科学实用性。如今，弗洛伊德的精神分析理论在激发文学想象方面比在当代心理学中扮演着更重要的角色（Robins，Gosling, & Craik, 1999，2000）。

它在心理学中的地位日益下滑，部分原因就是未能满足可证伪性标准。

这种不可证伪理论的存在会导致实际的危害。正如一位评论家所指出的：“不正确的但被广泛传播的有关心理的理念，不可避免地会对社会造成危害。由于精神分析学派的声望一度被人为地抬高，令社会上许多有疾病及遗传缺陷的人拒绝有效的治疗，转而从个体早期经历中寻找自己现有痛苦的根源”（Crews, 1993, p.65）。以抽动性稷语症为例。这是一种以身体抽搐和痉挛为特征的紊乱，并伴有言语症状，如嘟囔、吠叫、模仿言语（无意识地重复他人的话）和秽语（强迫性重复淫秽词语）。抽动性秽语症是一种器质性的中枢神经系统紊乱，并已经成功地被药物治疗所攻克（Bower, 1990, 1996a）。纵观历史，抽动性秽语症患者一直遭受着迫害，早期被宗教统治者视为妖魔，近代又被认为是鬼怪附体，要被强制驱魔（Hines, 2003）。更重要的是，在1921至1955年之间，对这种病的解释及疗法一直被精神分析学派的概念体系所把持，这在很大程度上阻碍了人们对此病成因及治疗的理解（见Kushner, 1999）。有关这种病症的不可证伪的精神分析解释层出不穷。这些似是而非的解释所造就的概念泥潭蒙蔽了这一病症的实质，也阻碍了对其进一步的科学探究。例如，有一位作者曾经这样写道：

（抽动性秽语症是）精神分析导致脑部疾病研究发生倒退的典型例子。勒·图雷特（La Tourette）将疾病归因于大脑的退行性变化过程。而在本世纪最初的几十年，由于弗洛伊德理论的盛行，对这种病的关注偏离了大脑……这一倒退的结果使病人往往被转到精神科医生（通常是精神分析学派的医生）而非神经科医生那里，因此没有接受生理检查和研究（Thomton, 1986, p.210）。

夏皮罗等人（Shaphroeta L, 1978）提到，一位精神分析师认为，他的病人“不愿意放弃抽动，因为这成了她性快感的源泉和潜意识性欲的表达”。另一位精神分析师则认为，抽搐“等同于手淫……与生殖器快感相联系的力比多转移到了身体的其他部位”。第三位认为抽搐是一种“肛门施虐的迁移症状”。第四位认为，抽动性秽语症的患者具有“强迫型人格以及自恋倾向”，病人的抽动“代表了一种情感症状，对想表达情感的压抑性防御”。夏皮罗等人（1978）对这类理论现状的总结，很好地说明了忽视可证伪性标准的有害影响：

精神分析这种理论化的方式简直面面俱到。抽搐是迁移性的症状而非歇斯底里症、肛门的而又是性欲的、受意志控制的而又是强迫性的、器质性病变同时又与原始心理动力有关……这些心理标签、诊断和治疗被不幸地强加在病人及其家属身上，而且是以一种毫不谦卑、相当武断、伤害巨大的方式。因为其随后的广泛影响，这些观点为对此病症的认识和诊治造成了极大的障碍。（pp.39-42，50，63）

当研究人员承认精神分析的“解释”对治疗该疾病毫无用处的时候，对抽动性秽语症的认识和治疗才开始获得进展。那些毫无用处的解释是诱人的，因为它们似乎能对事情进行解释。事实上，它们都是在事后对所有事情做出解释的。然而，它们提供的解释不过是制造了理解的幻觉。由于总试图在事后解释一切，它们也就堵死了前进的大门。只有当一种理论并不预测所有事情，而是提出具体的预测——提前告诉我们哪个特定的情形会出现时，该理论才会出现进步。当然，从这样的理论推导出的预测可能是错误的，但这是优势，而非缺点。

小精灵

如果人们能够从所研究的问题里跳出来，尤其是，如果人们能以史为鉴的话（如本杰明·拉什的例子），就不难识别出那些不能证伪的概念体系。当其例证明显是编造的时候，也很容易察觉其不可证伪性。举例来说，大家还不知道，我已经发现有一种大脑机制在控制行为，你很快就会在随处可见的八卦杂志上看到这个发现。我发现在大脑左半球的语言区附近住着两个小精灵，它们有能力控制大脑许多区域中的电化学过程。而且，长话短说，它们基本上控制了一切事情。但是，有一个问题阻止我们看到它们，那就是小精灵有能力发现任何对大脑的侵人（外科手术、X光等），一旦觉察到外界的探测，它们就会消失（我忘记说了，它们具备隐身能力）。

毫无疑问，我在这里是用一个更适合小学生的例子来侮辱你的智慧。很明显这个例子是我捏造的，但我对小精灵的假设永远无法被证实是错误的。然而，考虑一下。作为心理学导论的讲师和公开演讲者，我经常被问到，为什么不讲授在过去几年里在超感官知觉（ESP）和通灵学方面取得的那些惊人的新发现。我不得不告诉这些提问者，他们所获悉的大多数相关信息，无疑都是来自于大众媒体，而非科学界所承认的信息来源。事实上，一些科学家曾关注过这类说法，但没能够重复这些发现。我要提醒各位读者，要将一个研究成果认定为确定的科学事实，可重复性是至关重要的，尤其是当研究结果与以前的数据或现有的理论相矛盾的时候。

我甚至可以坦率地说，许多科学家对ESP研究已经失去了耐心。原因当然与此领域充斥着欺诈、江湖骗术和媒体炒作有关，但令科学界觉醒的更重要的原因是马丁·加德纳（Martin Gardner, 1972）所谓的“ESP研究第22条军规”。

其运作方式如下：一名“信奉者”（在开始调查之前就相信ESP现象存在的人）声称已在实验室证明了ESP。一名“怀疑者”（质疑ESP存在的人）被邀请证实这种现象。通常，在观察实验情境之后，怀疑者会要求信奉者进行更多的控制（我们会在第6章中讨论这种类型的控制），虽然这些要求有时候会被拒绝，但通常善意的信奉者们会同意他们的要求。当加人了实验控制之后，这种现象就不再出现了（见Alcock, 1990; Hines, 2003; Humphrey, 1996; Hyman, 1992, 1996; Kelly, 2005; Marks, 2001; Milton & Wiseman, 1999）。怀疑者会对这种失败做出正确的解释——早先对这个现象的证实是由于缺乏足够的实验控制，因此结论不能被接受。但他们往往吃惊地发现，信奉者并不承认早先的证明是无效的。相反，他们搬出超感知的“第22条军规”：他们坚称，心理能量是很敏感的、微妙的，并容易受到影响。怀疑者的“负面感应”是瓦解这一“超感官能量”的罪魁祸首。信奉者认为，怀疑者的“负面气场”被移开后，这种心理能量无疑会回归。

这种对无法在实验室中证实ESP的解释方式，在逻辑上与我编造的小精灵的故事相似。ESP的运作就像小精灵一样。只要你不侵入性地仔细观察它，它就在那儿。如果你观察它了，它就不见了。如果我们接受这种解释，那么向怀疑者证明这一现象就变得不再可能。这种现象只为信奉者现身。当然，这种说法在科学领域是不能接受的。我们没有磁力物理学家和非磁力物理学家之分（即磁场只对前者存在）。以这种方式解释ESP的实验，使得ESP的假设变得像小精灵的假设一样不可证伪。正是这种解释方式，将ESP排除在了科学殿堂之外。

不是所有的证实都等价

可证伪性原则对于我们如何看待一个理论的证实过程具有重要的意义。许多人认为，一个好的科学理论就是被多次证实的理论。他们假设，被证实的次数是对理论进行评价的关键。但是，可证伪性原则意指，理论被证实的次数并不是最重要的因素。原因在于，正如“敲门节奏理论”所展示的那样，并不是所有的证实都是等价的。证实能否令人信服，取决于预测在何种程度上将自己暴露在可能被证伪的情境下。一个非常具体的、可能被证伪的预测（例如，一位女士，30岁，5英尺2英寸高，左手拿书和拷包，用右手敲门），比20个不可证伪的预测（例如，一个小于100岁的人）拥有更强的说服力。

因此，我们不能仅关注理论被证实的数量，更要关注验证本身的质量。将可证伪性作为一种评价标准，就可以使那些使用研究结果的人抵制不科学的、全能理论的诱惑。这种全能理论会不可避免地妨碍我们对世界和人类本质进行更深人的探索。事实上，这种理论的死角也正是最魅惑人的地方，因为它们永远不能被证伪。在纷繁多变的现代世界中，这种理论千年不变。

波普尔经常指出，“这些（不可证伪的）理论拥有巨大的心理吸引力，其秘密在于它们能够解释一切事情。预先知道无论什么事情发生，你都能理解它，不仅给你智力上的掌控感，而且，更重要的是，让你拥有应对这个世界所需的安全感”（Magee, 1985, p.43）。但是，这种安全感的获得并不是科学的目标，因为对这种安全感的追求是以知识发展的停滞为代价的。科学是一套不断挑战原有信念的机制，在这种机制里，原有信念以一种能够被证伪的方式接受实证检验。这一特点往往使科学（尤其是心理学）与所谓的世俗智慧或者常识直接发生冲突（正如我们在第1章中所讨论的）。

可证伪性和世俗智慧

心理学威胁到世俗智慧能所提供的安逸感，因为作为一门科学，它不能只提供无法被反驳的解释。心理学的目标是对各种行为理论逐一进行实证检验和筛选。某些世俗智慧表述得很清晰，经得起实证检验，这当然是心理学所欢迎的，而且其中许多已经被纳入了心理学理论。然而，心理学并不追求那类事后能解释一切，但事先无法做出任何预测的理论，不追求这种解释系统所带来的安逸感。它不接受那些被设计得永不可变、并代代相传的世俗智慧体系。试图向学生和公众隐瞒这一点无疑是自毁长城。不幸的是，一些心理学指导教师和普及者觉察到了心理学对世俗智慧的威胁给一些人造成的困扰，于是他们有时会通过传递错误信息来试图安抚这种情绪，如“你会学到一些有趣的东西，但别担心，心理学不会挑战那些你深信不疑的观点”。这是一个错误，它对“什么是科学”和“什么是心理学”都会造成混乱。

科学寻求概念上的变化。科学家试图描绘世界的真实图景，这个图景可能与我们的固有信念正好相反。现代思潮中有一种危险的趋向——认为应避免让一般大众知道世界的真正本质，一种无知的面纱是必要的，以防公众面对真相时手足无措。心理学与其他科学一样，拒绝向人类隐瞒真相的观点。生物学家米希尔·吉瑟林（Michael Ghiselin）进一步宣称，当知识不能广泛普及时，我们都会蒙受损失：

如果我们有健康的邻居，那么我们会过得更好，而通过垄断药品的供应使自己变得比他们更健康的做法是愚蠢的。知识也是如此。我们邻居的无知和不健康对我们一样有害，而无知很可能正是造成他们健康问题的原因。工业的进步和我们所有人都受益于技术性劳动力的供给，我们依赖于他人的技能和专门知识。

同吉瑟林一样，心理学家也认为，当我们被那些对人类行为有误解的人们所包围的时候，大家都会蒙受损失。公众对于教育、犯罪、健康、生产力、儿童福利和许多其他重要问题的态度塑造了我们的世界。如果这些态度源于错误的行为理论，那么我们大家都会受到伤害。

承认错误的自由

科学家们发现，可证伪性原则的一个最具解放意义和最有用的启示是：在科学上，犯错弁不是罪过。被证伪的假设为科学家们提供了信息，他们可以用来调整理论，使理论更紧密地与数据相一致。哲学家丹尼尔·丹尼特（Daniel Dennett，1995）曾说过，科学的本质就是“在公众面前犯错”（p.380）。当数据与理论不符时，通过对理论进行不断地修正，科学家们最终构建起能更好地反映世界本质的理论。

事实上，如果我们能够在日常生活中使用可证伪性原则的话，我们生活的质量将会大大改善。这就是为什么我在本节的第一句话中使用“具有解放意义”这个词的原因。它包含着一种个人化的期许，即此处产生的理念能够同时对科学之外的领域有所启示。如果我们能够理解这一切，当我们的信仰与观察到的事实相冲突时，我们最好是调整信仰而不是否认事实和坚持错误的想法，这样我们将会少遇到一些个人和社会问题。物理学家罗伯特·奥本海默认为：

每个人在训练自己的推理能力时都要学会这一点，当他回顾过去时会说“这个问题我当时没想明白”。生活中的人们也需要这种能力，即脸不红心不跳地说：“我当时槁错了。”而科学能让认错每时每刻都发生。你注意到某些东西与你已经思考了很久的事情相冲突或不一致，它会触动你改变想法。这与人们没完没了地去寻找一些合理说法来为自己先前的错误辩解的做法完全不同（Dos Passos, 1964, pp.150-151）。

当你与某人激烈地争论的时候——也许就是当你给出一个有力的反击来捍卫你的观点的时候——有多少次你会突然意识到你搞错了某个关键事实或论据？这时你会怎么做？你会收回前面的话并向别人承认错误，同时承认别人的解释现在看起来比你的更合理吗？或许不会。如果你和我们中的大多数人一样，那么你一定会“没完没了地寻找一些合理说法来为自己先前的错误辩解”。你试图在拒不承认失败的情况下使自己从争论中全身而退。你最不可能做的就是承认自己错了。这样的话，你和争论对手都会更加疑惑：到底哪一种信念更接近真理？如果争论不能成为公共性的（如在科学中那样），如果正确和错误的信念以同样激烈的方式争辩，如果争论的结果不能得到正确的反馈（如本例），那就没有更可靠的机制使信念与现实相吻合了。这就是为什么那么多私人和公开的对话令人困惑，为什么相比所谓的常识或世俗智慧，心理科学在解释人类行为的原因方面更加可靠。

在科学中犯错是正常的，对于科学进步来说，真正的危险是人类有一种固有的倾向，即避免让其信仰暴露在可能被证明是错误的情境之中。许多科学家已经证实了这一观点的重要性。诺贝尔奖得主彼得·米德瓦（Peter Medawar，1979）写道：

在能够被更好的假设所取代的情况下，错误的假设尽管是情有可原的，但它们确实会对曾经深信它们的科学家造成严重的伤害。这些人深深地热爱他们的假设，因而不愿意接受否定的实验结果。有时，他们不让自己的理论假设接受严格的检验，而是绕过这类检验，仅仅让假设中无足轻重的部分接受检验，或不断寻求一些边缘化的证据来支持假设，而不愿冒可能被彻底推翻的风险。对于任何时代的任何科学家，没有比这再好的忠告了：一个假设在何种程度上被确信为正确实际上与其是否为真无关。（p.39; 原文为意大利语）

心理学界许多最具声望的科学家都遵循米德瓦的建议。在一篇报道实验心理学家罗伯特·克诺德（Robert Crowder）职业生涯的文章中，引述了他的一位同事马扎林·巴纳吉（Mahzarin Banaji）的话：“他是我认识的最不维护自己理论的科学家。如果你发现一种方法证明他的理论有漏洞，或者他的实验发现有局限性或有缺陷，他会非常高兴，并和你—起计划如何推翻该理论”（Azar, 1999, p.18）。艾泽（Azar, 1999）描述了克诺德如何提出了一个叫做“前分类听觉存储器”的记忆成分理论，然后又仔细地设计了一个实验研究证伪了自己的模型。最后，进化心理学家约翰·图比（John Tooby, 2002）在一篇精彩的评论中提到是何种态度使达尔文对科学做出不朽贡献：“达尔文比他同时代的人走得更远，因为他并没有受缚于‘让宇宙符合自己预期’的冲动”（p.12）。哲学家乔纳森·阿德勒（Jonathan Adler, 1998）则采用了另一种说法：“一个真正开明的人愿意跟随证据的引导。开明的人愿意听从公正的调查，而非他自己的预测。科学方法是对世界的印证，而不是对我们自己的印证”（p.44）。

但是，要让科学发挥作用，并不需要每位从事科学工作的科学家都具备证伪的态度。雅各布布·布罗诺夫斯基（Jacob Bronowski, 1973, 1977）在他的许多文章中指出，科学那种揭示世界真知的独特力量，并不产生于科学家们独特的德行（即他们是完全客观的、他们在解释研究结果时从来不带偏见等）。实际上，这种力量的产生是因为会犯错的科学家们身处一个证实与平衡的程序中。在这个程序中，总会有其他科学家提出批评并发现他们同行的错误。哲学家丹尼尔·丹尼特（Daniel Dannett, 2002）提出过相同的论点：不是每位科学家都必须表现出罗伯特·克诺德的客观性。正如布罗诺夫斯基和丹尼特所强调的那样，科学家和其他任何人一样容易犯错，但认识到他们及其所属团体的犯错根源之后，他们设计出精巧的系统来约束自己，努力防止自身弱点和偏见影响自己的研究结果（p.42）。心理学家雷·尼克尔森（Ray Nickerson, 1998）以一种更为幽默的说法道出相同的观点：科学家们的虚荣心实际上在科学进程中起着作用，“科学家对自己的想法抱有的批判性态度并没有在很大程度上导致科学的成功……更真实的情况是，每个科学家都积极地想要证明某些科学家所持有的观点是错误的”（p.32）。这些作者认为，科学知识的力量并不是来自于科学家的德行，而是源于他们不断交叉检验彼此的知识和结论的这一社会过程。

想法不值钱

先前关于检验世俗智慧的讨论，将我们引向了可证伪性原则的另一个有趣推论：想法不值钱。说得更准确些，我们的意思是某些类别的想法不值钱。生物学家和科学作家史蒂芬·古尔德（Stephen J.Gould, 1987）对此有所阐述：

15年的月刊专栏写作生涯，让我收到各个科学领域非专业读者的海量来信……我发现一个常见的、同时是压倒性的错误观点。人们会告诉我他们提出了一项革命性的理论，它会拓展科学的边界。这些理论通常以单倍行距打印在几张纸上，内容通常是对最深层的终极问题的猜测——什么是生命的本质？宇宙的起源？时间的起点？但是，这些想法不值钱。任何智力正常的人都能在早饭前想出几个这样的念头。科学家们自己也很容易就能想出来。但我们不这样做（或者说，我们只让它们留在自己脑子里），因为我们不能找到方法来验证它们，以决定它们的对错。一个既不能被证实也不能被证伪的可爱想法，对科学来说又有什么用呢？

古尔德对最后一个问题的回答是：“没有用。”古尔德这里所说的廉价想法正是我们早先在对卡尔·波普尔观点的讨论中提到的那些：包罗万象、复杂、“模糊”、能够用来解释一切的宏大理论——这种理论的建构更多是为了提供情感支持，因为它们没打算被改变或抛弃。古尔德告诉我们，这种理论对于科学目标是无用的，无论它们多么有抚慰功能。科学是创造性的过程，但是这种创造性需要让概念结构符合实验数据。这并不容易做到。那些如实解释真实世界的想法一点儿也不廉价。也许这就是为什么好的科学理论很难提出、而不可证伪的伪科学信仰体系泛滥的原因，因为后者容易建构得多。

科学理论与世界紧密联系。它们是可证伪的，并能做出明确具体的预测。事实上，形成真实的、科学真正可以解释的理论是一项困难的任务。但是，理解科学运作的一般逻辑并没有那么困难。事实上，现在已经出版了不少专为儿童撰写的关于科学思维逻辑的书籍（Kramer, 1987; Swanson, 2001, 2004）。

科学中的错误：接近真理

在解释可证伪性原则的过程中，我们已经勾勒出科学进步的简单模式。提出理论、并从中推导出假设，然后假设接受各种技术或方法的检验——我们将在本书余下的部分讨论这些技术。如果假设通过了某些实验的检验，该理论就得到了某种程度的确证；如果假设被实验证伪，这个理论就得做出某种程度的改变，或者被一个新理论所取代。

当然，虽然科学上的知识是暂时性的，由理论得出的假设可能是错误的，但这并不是说所有的一切都要被拿来检验一番。科学中有很多理论已经被确认过无数次，它们被称为“公理”，因为它们几乎不可能被未来的实验推翻。我们不大可能在某一天发现，血液不是循环的，或者地球并没有在环日轨道上。这些众所周知的事实并不是我们一直在讨论的假说。它们也不是科学家们的兴趣关注点，因为它们已经是确定无疑的。科学家只对已有知识范围之外的问题感兴趣：它们并不是确定无疑的。

科学实践的这一面——科学家侧重于已知事实的前沿，而忽视那些已经被充分证实的问题（所谓的公理）——对大众来说很难理解。科学家们似乎总是更强调未知的事物而非已知事物。这千真万确，而且科学家有很好的理由这么做。为了推进知识的进步，科学家们必须一直身处已知的前沿。当然，这里是很多事情都不确定的地方。但科学进步正是通过这个过程来实现的，即试图在已知的前沿减少不确定性。这种特点常常使得科学家被公众视为是“没谱的”。但这只是表面现象，科学家们只是对知识的前沿不确定——这使我们对于事物的理解不断加深。科学家们不怀疑那些被很多研究重复证实的事实。

同样需要强调的是，当科学家通过观察法证伪一个理论或用一个新理论代替旧理论的时候，并不意味着他们要将先前用以建立旧理论的事实全都扔到一边（我们会在第8章展开讨论这个话题）。相反，新理论应该能够解释所有旧理论能解释的事实，还能够解释旧理论不能解释的事实。理论被证伪并不意味着科学家非得建构一个全新的理论。科普作家伊萨克·阿西莫夫（Isaac Asimov）在一篇题为《错误的相对性》（The Relativity of Wrongs 1989）的文章中很好地说明了理论修正的过程，文中谈到我们对地球形状的理解是如何完善的。他首先提醒我们，不要以为“地球是平的”这一古老信念是愚蠢的，在平原上（大部分有文字的人类文明都发源于平原），地球看上去相当平坦。阿西莫夫要求我们试着对不同的理论进行定量的比较，看结果会告诉我们什么。首先，我们能够将不同理论表述为它们预测地球表面每公里曲率的大小。“地平理论”会说每公里的曲率为0。现在我们都知道，这种理论是错误的。但从某种意义上说，它又很接近真理。正如阿西莫夫（1989）所述：

亚里士多德之后的一个世纪，古希腊的另一位哲学家埃拉托·塞尼斯（Eratosthenes）指出，太阳在不同鲜度上投射不同长度的影子（如果地球是平面的，所有的影子应该一样长）。根据影子长度的不同，他计算出地球的周长为2.5万英里，那么这个球体曲率是0.000126度/英里。正如你所见，这个数值非常接近0……这从0到0.000126的差别解释了为何我们用了如此长的时间，才放弃“地球是平的”这一观念，并转而相信地球是球状的。提醒你一下，即使是像CK）.000126之间这样细小的差别也是至关重要的。失之毫厘，谬以千里。如果这点小差别没有被考虑到，如果地球被认为是一个平面而不是一个球，那么我们将无法精确地绘制地球上大面积区域的地图。（pp.39-40）

当然，科学没有止步于“地球是球状的”这一理论。我们早先讨论过，科学家们一直在尝试尽量改进他们的理论，并挑战当前知识的局限。例如，牛顿的引力理论预言地球并不是完美的球形，这个预言确实被证实了。现在已经证明，地球在赤道附近略微凸起，而在两极附近略微扁平。这是个被叫做“扁球体”的形状。地球从北极到南极的直径是7900英里，赤道直径是7927英里。所以，地球的曲率并不是一个常数（像一个理想的圆球那样），而是在每英里上有约7.973英寸到8.027英寸的微小变化。正如阿西莫夫（1989）所言：“从球体到扁球体的修正比从平面到圆的修正要小得多。因此，虽然‘地球是球状的’这一理解有误，但严格地说，它没有错到‘地球是平的’那种程度。”阿西莫夫关于地球形状的例子为我们展示了科学家们使用错误、误差和证伪这些术语的不同情境。这些术语并不是说被检验的理论错得一无是处，这些理论仅仅是不完善的。所以当科学家强调说理论是暂时性的、可能被未来的研究发现所修正的时候，他们所指的就是例子当中的情形。当科学家相信地球是球状的时，他们认识到在未来某一天，这个理论需要在细节上进行修正。无论如何，从球体到扁球体的变化维持了地球是一个球体的“大体正确性”。我们绝不会在某天醒来突然发现它其实是一个立方体。

临床心理学家斯科特·利连费德（Scott Lilienfeld，2005）向心理学专业的学生介绍了阿西莫夫的观点：

当向学生解释心理学知识本来就是暂时性的、可以被修正的时候，有些学生会错误地得出结论，认为真正的知识是不存在的。这种观点在某些后现代主义圈子里非常流行，它忽视了对不同确定程度的知识的区分。虽然绝对的肯定在科学中无法实现，但一些科学理论，如达尔文的自然选择学说，已经被极好地证实了，而其他一些理论，如支持占星术的理论，已经遭到了有力的驳斥。还有一些理论，如认知失调理论，仍处在科学争议当中。因此，科学理论是个确定程度不同的连续体：有些已经成为了确定的事实，另外一些则被完全地证伪了。对于科学问题，方法论上的怀疑主义并不产生完全确定的答案（原则上说，这些答案可能会被新的证据推翻），这个事实并不意味着知识是不存在的，只是说知识是暂时性的。

小结

科学家们提到“可解的问题”时，通常指的是“可检验的理论”。“可检验的理论”的定义在科学上是非常明确的：这个理论是有可能被证伪的。如果一个理论不可证伪，并且和自然界的真实事件没有关联，那么它就是无用的。心理学里一直充斥着不可证伪的理论，这也正是心理学发展缓慢的原因之一。

好的理论能够做出具体的预测，具有高度的可证伪性。相比于一个不精确的预测，一个明确具体的预测如果得到证实，会为产生这个预测的理论提供更大的支持。简言之，可证伪性原则的一个含义就是，并非所有理论的验证都具有同样的价值。可证伪性越高，预测越具体，得到证实的理论就越受青睐。即使预测并没有得到证实（比如它们被证伪了），可证伪性对于理论的发展也是有用的。一个被证伪的预测说明，原有理论要么应当抛弃，要么需要进行改变以解释不一致的数据。正是通过这种由被证伪的预测所引发的理论修正，像心理学这样的科学才能逐步向真理逼近。

第2章 可证伪性——如何捕捉头脑中的小精灵