第三章 Web 3.0 拜托,搜索中立不可能
要做到公平,一直是件难事。在许多人能做出多种选择的体系中,公平通常不可能实现。肯尼斯·阿罗(Kenneth Arrow)是诺贝尔经济学奖得主,他提出了阿罗不可能定理(Arrow Paradox),即,排名投票系统本质上不可能做到公平。更准确地说,这条定理是指,如果一个投票系统试图对三个或以上的候选人进行排名,就不可能同时优化投票公平性的不同方面。这有点像老话说的“快,便宜,好——两个任意挑”,因为无法同时满足全部三项。从数学角度来看,对三个以上候选人进行排序时,无论是确保每张投票都有相同的权重,或保证每个结果都有相等的出现机会,还是采用其他公正排名的标准,都必然会对公平的某些方面造成损害。
每一种搜索算法也是在进行排序选择,对于它所排序的一些信息来源来说,同样自来就不公平。无论是哪个搜索引擎,Bing也好,Ask也罢,抑或谷歌乃至还未发明出来的搜索引擎,返回的排序结果不可能满足公平的所有维度。在某些方面它有所偏倚,就像投票系统会偏向某些方向一样。
尽管如此,我们仍然想要公平和中立。在当今生活中,搜索既是一个不可或缺的服务,也是一个非常大的业务领域。新闻、商务和个人身份都经由搜索引擎过滤,自由原则也要间接通过搜索引擎来体现。搜索引擎的权力可能被滥用。这在中国已经发生,而我们也能够在理论上想象这种可能。如果一个搜索算法本身就是有偏好的,那么是否有办法能让它变得更中立呢?
有许许多多的人都对谷歌的搜索引擎霸主地位感到不安。他们看到了搜索引擎的偏见本质。其中有些是商人,他们的生计受到谷歌算法的影响;还有一些是关注谷歌主导地位的活动家、权威人士或学者。詹姆斯·格里梅尔曼(James Grimmelmann)在一篇很长、很清晰(以及非常具有质疑精神)的科技论文中,对关于建立搜索引擎“中立性”这一问题的最好论点进行了整理。他将这些论点精炼成了8个建议性搜索中立原则:
1.平等性(Equality):搜索引擎根本不应区分对待各个网站。
2.客观性(Objectivity):搜索结果有正确与错误之分,搜索引擎应该只返回正确的结果。
3.倾向性(Bias):搜索引擎不应歪曲信息图景。
4.流量原则(Traffic):依靠访客浏览量生存的网站不应被搜索引擎排除。
5.相关性(Relevance):搜索结果应最大限度满足用户的需求。
6.自身利益(Seft-interest):搜索引擎不应利用自身利益谋利。
7.透明原则(Transparency):搜索引擎应该公开其网页排名的算法。
8.控制原则(Manipulation):搜索引擎应只根据一般规则对网站进行排名,而不应依据个人标准将网站排名升级和降级。
在我看来,这些要求似乎非常合理。接着,格里梅尔曼抛出了他的反驳论点:
可以想见,这八条原则都不可能成为健全的搜索监管的基础。
他更进一步阐述表示:
虽然搜索中立的各原则并不一致,但这并不表示搜索引擎有权无视反垄断、知识产权和隐私保护或其他法律,畅行无阻。搜索引擎有能力做出卑劣的行径:据《商业周刊》(BusinessWeek)报道,中国搜索引擎百度公然对网站进行勒索,如果企业不买百度的广告,它便把企业网站的排名降级。搜索引擎能做出什么可怕的事情,不乏恐怖先例。我的看法就是,目前所提出的搜索中立可行性很低,并很可能使情况变得更糟。从其对搜索中立的定义上看,它没有实现自己的初衷。
接着,他逐一驳斥了上述每一条原则,我在这里进行了总结:
1.平等性——“谷歌当然会对不同网站区别对待——正因此,我们才去使用它。系统性地偏好某些类型的内容,对于搜索引擎来说并非缺陷——而是其意义之所在。”
2.客观性——不存在客观性。“搜索引擎用户形形色色。他们抱着非常个人的高语境目标。一种搜索结果不可能放之四海而皆准……谁能说雅虎就是对的,谷歌就是错的?那同样也可以认为谷歌的低排名是对的,雅虎的高排名有问题。”
3.倾向性——整个网络就是有所偏倚的。“搜索引擎优化,互链作坊(Link Farm),垃圾博客评论,黑客攻击——你能想得出,就有人做得出,且都假以提高搜索排名之名。一个完全无形的搜索引擎,不引入新的价值观或自己的偏见,那么它也只会复制网络本身所潜藏的倾向性:极度商业化,垃圾信息多得吓人。
4.流量原则——网站无权过问流量或排名。如果搜索引擎认为某个网站对用户来说不可取,那么它就可以改变这个网站的排名。“搜索引擎的主观性意味着,不同搜索引擎的结果经常会彼此相左,这也意味着,同一个搜索引擎的结果也会随时间变化而不同。”
5.相关性——搜索引擎通过主观选择提高返回结果对于用户的相关性,它们并非根据网站的偏好,而是在搜索引擎认为用户想要什么的基础上,降低或提高网站排名。“搜索引擎争相向用户提供相关的搜索结果;搜索引擎之所以存在,只是因为它们能够提供有偏好的搜索结果。”离开用户范畴,相关性便难以定义,更难以检验,而且毫无用处。
6.自身利益——为自身利益影响搜索结果,这倒很有可能存在;有时确实会发生。垄断性的假公济私行为也非常可能发生。“搜索引擎批评家认为,搜索引擎应该披露与排名决定有关的商业关系。这是一个标准而明智的政策回应。”但是格里梅尔曼表示,“这并非中立性原则,也不是仅存在于搜索业务领域;这只是完善的法律规范的自然施行。”
7.透明原则——出发点是好的,但执行起来问题多多。如果算法完全透明,就会被垃圾信息制作者利用,甚至出现更糟的可能,搜索引擎也就形同虚设了。如果针对他们透明开放,而他们不大可能快速调整以保护创新。“一切都取决于监管机构对搜索算法中小细节的意义的评估能力。而从监管机构和法院其他数字技术领域的监管历史记录来看,搜索引擎自行评估的前景并不乐观。”
8.控制原则——似乎是坏事,但“所有搜索引擎都被控制着,而且越巧妙越好。”人们所担心的实际上是“人为操纵”或人工干预,或特殊待遇。“谷歌非常不愿意透露自己是否或何时会针对个体修改排名。”垃圾邮件发送者应该受到“特殊待遇”吗?“完全禁止本地操作会妨碍搜索引擎迅速关闭漏洞并惩治利用漏洞的人。”
总之,格里梅尔曼称,搜索引擎也存在不可能定理。搜索引擎更重视用户而非网站,这对于一些网站来说,可能显得不公平。
搜索中立的争论中有一点非常正确:搜索关乎用户自主权。与任何其他通信技术相比,一个好的搜索引擎对用户的利益更敏感……搜索中立的争论中提出了一个正确的问题——结构性力量是否会削弱搜索引擎提升用户自主权的能力?——搜索中立拥护者更关注对网站的保护,而非对用户的保护。然而令人不安的是,网站通常并非用户朋友。有时候他们是用户的朋友,但更多时候它们只是需要访问者,并愿意不择手段留住他们。
谷歌并不中立。它也永远不会中立,Bing和其他任何搜索引擎也一样。只要谷歌仍然把用户置于排名网站的商业利益之上,只要谷歌在有利于用户的基础上合理追求自身的商业利益,那么其非中立性就会让搜索引擎和用户皆大欢喜。
2011年4月12日