第二部 人性化世界 1、创造完美的人性世界为什么“数字化生存”如此辛苦?
多年来,我每天至少在电脑面前度过3个小时,但有的时候,我仍然发现自己饱受折磨。搞懂电脑就和搞懂银行结算单差不多同样困难。为什么电脑(以及银行结算单)非得毫无必要地弄得这么复杂呢?为什么“数字化生存”竟是如此辛苦呢?
其实,电脑并不复杂,数字化生存也不需如此辛苦。计算的发展速度飞快,但直到最近,我们才获得了足够的成本低廉的计算能力,可以随心所欲地将其用来改进入与电脑的双向交流。过去,把时间和金钱花在用户界面上,会被认为是愚蠢而浪费的行径,因为电脑的运行周期太宝贵了,应该把它全花在解决问题上,而不是花在人的身上。
科学家会从许多方面论证简单生硬的界面的合理性。例如,在70年代初,好几篇“学术”论文问世,论述黑白显示器为什么“优于”彩色显示器。彩色没什么不好。整个研究圈子不过一心想为他们无力以合理的成本制造出好的界面而辩护罢了;或者,说得更难听一点,他们根本不具备这样的想象力。
从60年代未一直到70年代,我们这群致力于研究人机界面的人,被视为缺乏男子气概,受到公然的蔑视。尽管后来这一领域逐渐得到认可,但是我们的工作仍然被视为旁门左道。
只要回想一下你上一次按了电梯按钮之后灯却不亮的情景,你就能体会到感知、生效和反馈有多么重要了。电梯不亮的原因也许是灯泡烧坏了。但你心里一定万分沮丧,开始怀疑:电梯听到我的指示了吗?由此可见,界面的设计和功能是非常重要的。
1972年的时候,全球总共只有15万台电脑。然而从现在起直到2000年,单单英特尔一家集成电路生产商,就预期可以每年售出1亿枚芯片(而我认为他们还大大低估了市场的潜力)。30年前,使用电脑就好像驾驶登月艇一样,懂得机器操纵魔法的人寥寥无几。
那时的电脑语言极为粗糙,甚至根本没有什么语言可用(只有许多拨动开关和一闪一闪的灯泡)。我的看法是,科学家曾经下意识地想保持电脑的神秘性,就好像中世纪黑暗时期的僧侣,刻意维护自己独尊的地位,或像当时的某些人,要独自把持古怪的宗教仪式一样。
今天,我们还在为此付出代价。致命的反应当人们谈到电脑的样子和它给人的感觉时,其实他们指的是“图形用户界面”,也就是“行家”所说的GUI。1971年左右,施乐公司开始研究GUI,后来又有麻省理工学院和其他几个地方介入,这种界面获得了长足的进步。10年后,史蒂夫.乔布斯凭着他的智慧和毅力,推出了麦金托什机,使GUI得以在一种真正的产品中出现,有关它的研究才达到了高潮。麦金托什机使整个电脑市场向前跨越了一大步,相形之下,后来市场上几乎没有发生过什么激动人心的事情。其他电脑公司花了整整5年时光,来模仿苹果电脑的技术。然而即使到了今天,在某些方面,它们的成果依旧比苹果电脑逊色。
在努力使机器更能为人所用的过程中,人类几乎把全部心力都投入到改进人与机器接触时机器对人的感应和作出更好的物理设计上。界面在很大程度上被当作一个传统的工业设计问题。就好像设计茶壶和耙子的人,要考虑把手的形状、传热程度,并防止表面出现疤痕一样。
设计驾驶舱是一大挑战,不只是因为驾驶舱中有众多的开关、按钮、转盘、仪表,还因为两三种类似的传感输入装置可能会相互干扰。1972年,一架东方航空公司的L1011型客机失事坠毁,原因是飞机起落架没有放下来。空中交通管制员的声音和机上电脑的哗哗声掩盖了警告讯号声,使机组人员没能听到。这真是致命的界面设计。
我家里从前有一台非常聪明的录像机,能够近乎完美地辨认出我的声音,而且很清楚我的喜好。只要我说出节目名称,它就会帮我录像存档。有时候,甚至不劳我开口,它可能就会自动帮我录好。但是,突然有一天,我儿子上大学去了。
最近6年多来,我不曾再录过一个电视节目。不是因为我不会录,而是因为就耗费的力气而言,录像的价值太低了。录像过程毫无必要地困难。更重要的是,大家一直把录像机和遥控器的使用,看成按钮问题。同样地,一般个人电脑的界面,也被当成是物理设计的问题。但是界面不仅和电脑的外表或给人的感觉有关,它还关系到个性的创造、智能化的设计,以及如何使机器能够识别人类的表达方式。
一只狗在百码之外就可以通过你的步态认出你来,然而电脑却甚至连你就在那儿都不知道。你生气的时候,几乎任何一只宠物都会察觉气氛不对,但是电脑却一片茫然。
甚至连小狗都知道自己做了错事,而电脑还是懵懂无知。
下一个10年的挑战将远远不止是为人们提供更大的屏幕、更好的音质和更易使用的图形输入装置;这一挑战将是,让电脑认识你,懂得你的需求、了解你的言词、表情和肢体语言。当你说“Kissinger”(基辛格)和“kissingher”(吻她)时,电脑应该能分辨个中差异。但这并不是因为它能找出声音信号上的微小差别,而是因为它懂得你的意思。这才是好的界面设计。
今天,人机交互的负担全部落在人的肩上,就连打印一个文件这样家常便饭的事情,都可以把人搞得疲惫不堪,简直就是装神弄鬼的巫术,而不像体面的人类行为。结果,许多成年人掉头他去,自认为是不可救药的电脑盲。
这一切都将改变。
漫长的旅程1968年,阿瑟.克拉克和斯但利.库布瑞克(SianleyKubrick)因电影《2001年:太空漫游记》同获奥斯卡奖提名。奇特的是,他们在拍完电影之后才出书,克拉克得以在看过初剪的毛片后,修改他的小说手稿。(电影是根据更早的一个故事版本拍摄出来的。)影片使克拉克可以根据电影场景模拟书中的情节,并锤炼原先的构想。在这本书付辛之前,他已经实际看到和听到了他的构想。
或许这就是为什么他笔下的主角——一台名叫HAL的电脑,能如此出色地描绘出未来的人机界面的原因(HAL同时也是致命的)。需要说明的是,HAL的名字与IBM无关(有人推测出比H、A、L恰好分别是IBM前面一位的字母)。HAL的语言能力绝佳(能听懂别人的话,也能清晰地表达),见解超凡,而且十分幽默,这表明它的智商很高。
几乎又过了1/4世纪,才出现了另一个完美的界面典范——知识导航员。苹果电脑当时的首席执行官约翰.斯卡利(JohnScul1ey)委托制作了这盘录像带,它也具有电影般的效果,被称作原型录像。斯卡利写了一本书,名字也叫做《漫游记》,书的结尾提到了“知识导航员”的构想,后来就变成这盘录像带的内容。他希望通过录像带,描绘出未来超越鼠标(mouse)和菜单(menu)的界面。他做了一件非常出色的工作。
在《知识导航员》录像带中,可以看到一位不修边幅的教授,他的书桌上放着一个平平的书籍模样的装置,处于打开状态。在这个装置的显示器的一角,出现了一个打着领结的人,也就是这部机器的化身。教授请这位机器代理人帮他准备演讲稿,还分配了几件工作给它,这位代理人偶尔也会插进来提醒教授其他的事情。它能看、会听,还对答如流,和一般的助手没什么两样。
HAL和知识导航员的共同之处是,它们都表现出超凡的聪明才智,以至于物理界面本身几乎消失不见了。这就是界面设计的秘诀:让人们根本感觉不到物理界面的存在。当你第一次和某人晤面时,可能会非常注意他的相貌、谈吐和仪态,但是很快地,你的注意力就会转移到谈话内容上,尽管这一内容仍然主要通过说话的音调和面部表情来表达。
好的电脑界面也应该有同样的表现。界面应该设计得像人一样,而不是像仪表板一样。
另一方面,大多数界面设计人员一直在顽固地试图使笨机器更容易为聪明人所用。
他们在美国人所谓的“人性因素”(humanfactors)或欧洲人口中的“工效学”(ergonomics)的领域各领风骚,研究人体如何运用感觉和反应器官来配合身边环境中的工具。
电话听筒或许是世界上设计得最多也最滥的一种设备了,但仍然十分不如人意。移动电话的差劲界面令录像机都相形见拙。一部班和欧路森电话机根本不像电话,而像雕刻品,比旧式的黑色转盘电话还难用。
更糟的是,电话的“功能”往往多得离谱。电话号码存储、重拨功能、信用卡管理、电话等候、电话转接、自动应答、电话号码过滤等各种功能,全部挤进了只有已掌大小的话筒中,让我们简直没有办法使用。
我不但不想要所有这些花哨的功能,我甚至根本不想拨电话。为什么设计电话的人全都不明白,没有人爱拨电话,我们只想利用电话来和别人取得联系!
像拨电话这样的事情,只要有一点点机会,我们都愿意别人代劳。这使我想到,电话的问题也许不在于听筒设计,而在于我门能否设计出可以塞进口袋里的机械秘书。与电脑共生电脑界面设计始于1960年3月,当时杰西.里克莱德发表了他的论文《人与电脑共生》(Man一Comp-uterSymbiosis)。大家都亲切地称里克莱德为里克,他是位实验心理学家和声学家,在这两方面受过良好的训练,后来成为电脑计算的信徒和救星,主持了美国高级研究计划署早期的电脑研究。60年代中期,他应邀为卡内基委员会、(CarnegieCommission)一份关于未来电视的报告撰写附录。正是在这份附录中,里克提出了“窄播”的说法。然而,里克当时没有料想到的是,他的两大贡献,“人与电脑共生”
和“窄播”注定要在90年代相互融合。60年代初期肇始的人机界面研究分成两部分,这两部分在其后的20年中各自独立发展,始终未能相互融合。一部分研究的是互动性问题,另一部分则把重心放在感应的丰富性方面。互动性的研究偏重于解决电脑共用的问题,因为在当时,电脑是一种极其昂贵而且大一统的资源。在50年代和60年代的早期,由于电脑太宝贵了,你会想尽一切办法让它不停地运转。把一部电脑接上键盘,用电脑打出一个问题,接着。再让它闲置在那里,等待人们阅读问题、思考,然后回答,这简直是无法想象的。分时的发明使这样做成为可能。所谓分时,就是让多个用户能够在彼此相隔很远的地方,共同使用一台电脑。假如你把电脑资源在10个人当中分配,那么,不但每个人可以分享1/10的机器使用时间,而且,当一个人在思考的时候,或许电脑可以完全为另外一个人所用。这种分食数字化大饼的做法要想行得通的条件是:没有一个用户的胃口过大,需要进行大量的计算或需要大量带宽。早期终端机的速率是110波特;我还记得清清楚楚,当速率提高到300波特时,感觉真是快极了。同床异梦相反地,有关感应丰富性的研究则偏重于极高带宽的图形互动上。早期的电脑制图需要一部机器专门用来提供图像。基本上,它与今天的个人电脑并无二致,但是却大得多,能够装满一间屋子,并且要耗费数百万美元。电脑制图技术刚诞生时,是一种勾画线条的媒介,需要强大的计算能力来直接控制阴极射线管的电波。一直到了10年之后,电脑制图才从单纯的勾画线条,发展到可以制作多种形状和图像。出现了一种叫做“光栅扫描显示器”(rasterscandisplay)的新型显示器,它需要大量的记忆容量,以一点一点地存储画面,它们今天已经随处可见,然而,大多数人都不知道这种显示器当初曾经被视为异端。事实上,在1970年,几乎没有人相信电脑存储器有那么一天会便宜得可以被大量用在制图上。在此之后的20年中,分时技术和电脑制图可以说是同床异梦。感应能力贫乏的分时系统成为商业和学术界广为接受的计算工具,促成了我们今天习以为常的电子银行和民航订位系统的诞生。商用分时系统的界面设计通常十分简陋,输出形式和打字机几乎没有什么两样;而且对任何单一用户而言,整个系统似乎刻意放慢速度,以便其他人也能够得到他们应有的那一份电脑资源。另一方面,电脑制图大多应用在独立计算上。到1968年,价格在2美元左右的小型机开始出现,主要原因是当时的工厂和机器自动化(automation)进程都需要非常精确而且实时的控制系统。电脑制图也是一样。这种独立的电脑制图系统与显示装置一起,构成了今天我们所了解的“工作站”(worksta-tion)的前身,其实工作站只不过是穿上了长裤的个人电脑罢了。多模式界面我们通常都是把累赘当成一种坏现象,暗指无谓的冗长以及漫不经心的重复。在早期的界面设计中,人们研究互动技术,并且尝试为不同的环境明智地挑选出不同的界面运作方式。光笔(lightpen)会不会比数据板更好呢?这种“二者必居其一”的思维方式,是受到了一种错误信念的支配,即以为任何一种特定的情况都会有一个放之四海而皆准的“最好解决方案”。之所以说这种信念是错误的,是因为人是互不相同的,情况也是瞬息万变的。此外,某种特走的互动方式究竟适合哪种环境,很可能要视你当时可用的信道而定。大底下没有一种最佳的界面设计。
我还记得,70年代中期,我去拜访一位海军上将,当时他有一套最先进的指挥控制系统。他先向一位下级水兵发号施令,然后再由其十分尽责地把命令输入电脑。因而,在一定的意义上,整个系统有了一个绝佳界面,这个界面不仅能识别语言,而且还很有耐性。海军上将可以随心所欲地在房间里走来走去,一边谈话,一边指手划脚。他完全就是他自己。
尽管如此,海军上将从没想过通过这样的间接界面来策划一场进攻。他很清楚水兵可以从电脑系统的小小显示器上,一窥整体形势,但是他宁可和墙壁上一张很大的战区地图直接互动,因为这样一来,他就可以把小小的形状各异的蓝色和红色军舰标志,钉在这张地图上。(那时我们总是开玩笑说,苏联人也用同样的颜色。)海军上将乐于使用这张地图,不只是因为地图是传统的作战工具,有清晰的画面,而且还因为他可以把自己完全投入其中。当他移动地图上的军舰的时候,他的手势和动作都加强了他的记忆。他完全陷入到战局的演示之中,连脖子上的肌肉都绷紧了。这种界面不是“非此即彼”(either/or),而是“二者兼顾”(both/and)。“二者兼顾”
的思维带来了一大突破,简单他说来,就是“累赘是好的”。事实上,最好的界面应该是有许多不同而并存的交流渠道,通过这些渠道,一个用户可以利用一组不同的感应装置(可能是用户的,也可能是机器的)进行表达并撷取意义。同样重要的是,一种交流渠道也许能够弥补其他渠道传递信息之不足。
例如,假如一间屋子有十来个人,我问其中一个人,“你的名字叫什么?”除非在我问话的时候,你能够看见我的目光所及之处,否则这个问题根本没有任何意义。也就是说,形容词“你的”,其意义来源于我的眼睛注视的方向。
这种状况在麻省理工学院的狄克.波尔特(DickBoLL)和克里斯.施曼特(ChrisSchmandi)所开发的名为“把它放在那儿”的程序中,得到了完美的印证。1980年推出的该程序第一版,能够让你对着墙壁大小的显示器说话和作手势,以及在一个空白的屏幕上(后来改成加勒比海),移动简单的物体(后来化为船只)。在“把它放在那儿”程序的示范影片中,这个程序误解了一条指令,施曼特脱口而出:“哎呀,该死”这句话在影片中给观众留下了很深的印象,提醒许多未来的观众,有待努力的地方还有很多。
整个构想其实再简单不过:说话、指点和眼神,应该作为一个多模式界面(multimodalinterface)的不同部分共同工作。这种多模式界面,不再仅仅是来来回回地传递讯息(这是分时的基础),而是更像人与人之间面对面的谈话。
当时,这种试图以“二者兼顾”的方式来设计界面的研究,和其他类似的早期研究一样,看起来像门有水分的科学。我就不怎么看得起界面研究中的测试和评估工作。或许我大自大了,不过我认为假如你必须在小心翼翼地测试某个设计后,才能看出它所造成的差异,那么,这个设计首先根本就没有造成足够大的差异。
成长的秘密当我还是个小男孩时,我的母亲有个家用壁橱,壁橱后面有二堵“秘墙”。这个秘密其实没什么大不了的:墙面上有许多小心刻划的铅笔痕迹,代表我定期测量的身高。
所有的铅笔线旁边都尽责地标注了日期,有些线靠得很近,因为那段时间身高测得比较频繁;有些线隔得很远,很可能因为那年夏天,我们外出度假了。再弄一个壁橱建一堵秘墙,似乎不可行。
这个身高测量法是我个人的私事,我猜它某种程度上也反映了我喝了多少牛奶、吃了多少菠菜和摄取了多少其他好东西。
相较之下,“成长”具有更加戏剧化的一面。一位许久未见面的叔叔看到我时,也许会问:“你成长得怎么样啦,尼基?”(假定他已有整整两年没见到我了。)但是,我没有办法真正体会到自己的改变。我能看到的只是壁橱秘墙上那些短短的铅笔线。
这种“刚刚能够看出来的差异”或简称JND,是心理物理学的一种测量单位。单单这个名称本身,就已经影响了界面的设计。你不得不自问,假如不过只有“刚刚能够看出来的差异”,何必这么费事呢?假如你只有小心测量,才能找出其中的差异所在,也许我们的努力方向就是错误的:应该往能够产生较大差异的方向努力。
举例来说,学术研究显示,在大多数应用上,讲话和自然语言都不是人与电脑之间的合适的沟通渠道。这些技术研究报告中充斥着各种表格及对照实验等,只为了证明自然语言容易给人机沟通造成混乱。
我当然不会期望一架波音747客机的驾驶员只要高唱:“高高高高飞——!”飞机就会滑行和起飞。即便如此,我仍然想不通为什么我不能运用丰富的语言和手势来控制事物,哪怕是在驾驶舱中。无论你把电脑应用在什么地方,都必须把丰富的感应能力和机器的智能两者的力量结合起来,才能产生最有效的界面设计。
如此一来,我们将可以看到显而易见的差异。我们将看到的是我叔叔眼中的我,而下是带橱L短短的铅笔痕迹。我的梦想我对界面的梦想是,电脑将变得更像人。这种想法很容易招致批评,人们会嫌它太浪漫、太含混或太不切合实际了。真要批评的话,我会说这个想法还太保守了。可能有许多异乎寻常的交流渠道甚至到了今天,我们都还浑然不觉。(由于我妻子是双胞胎姊妹中的一个,而我自己也有对双胞胎弟弟,从自己的实际观察中,我完全相信超感觉的交流方式不是不可能存在的。)60年代中期,我给自己设立的目标是,模拟面对面的交流方式,其中包括了手势,面部表情以及肢体动作。我把海军上将作为我的模型。
在具有里程碑意义的“空间数据管理系统”的研究计划中(时间大约在1976年左右),我们的目标是提供一个“让将军、企业总裁和6岁儿童都能使用电脑”的人性化界面。我们把系统设计得能让用户在30秒种之内学会操作。由于所有人都对桌面和书架非常熟悉,这两种东西被借用来作为例览和操纵复杂的声音、影像和数据资料的工具。
在70年代末期,这样做已经算是很激进了。但按照海军上将与水兵之间的对话方式来安排人机交流,此种做法能够产生的意义和影响,仍然是“空间数据管理系统”未能洞察的。未来的人机界面将根源于“授权”,而不是直接控制——下拉菜单弹出,按鼠标等等——同时,也不再是鼠标界面。我们一直执着于让机器达到“容易操作”的境界,有时候却忘记了许多人压根儿就不想操作机器。他们只想让机器帮他们做事。
未来,今天我们所谓的“代理人界面”将崛起成为电脑和人类互相交谈的主要方式。
在空间和时间的某些特定位置上,比特会转换为原子,而原子也会转换为比特。无论这种转换是通过液晶传输还是语音发生器实现的,界面都将需要不同的尺寸、形状、颜色和语调,以及其他五花八门的能够感应的东西。