第三章 Web 3.0 知识地图
之前绘制现代科技分支之间联系的地图是通过描绘学术文献之间的引用情况来实现的。这些引用往往以本学科或相关学科文献的注脚形式出现。引用就相当于网文中的链接,它们将你带回源头。引用索引按照学科不同来统计这些链接。绘图软件可以复现链接间的内在联系模式。以下图为例:
相关部门刚刚公布了一种描绘学科之间关系的新方法,它描绘的是点击而非链接。这个程序通过读取提供在线文献服务(现今最受欢迎的获取文献的方式)的服务器根目录,记录下研究人员从一篇文献跳到另一篇文献的点击过程。随后通过绘制这些点击过程(这次绘制包含了10亿个点击过程)来厘清文献间由用户激发出的关系。下面是一张最新的科学知识联系图:
按照这篇文章作者们的观点,与引文分析法相比,点击流的优点在于它能给出引文的实时图景,且范围更大。他们着重指出:“已记录的文献间相互点击量已远多于现有文献引用量。”
我一直在思考谷歌以及搜索引擎的未来。很显然,互联网上点击量多于链接量。也就是说,相比于做链接,人们更常做的是直接点击。然而,就我所知,PR值以及其他的搜索索引排名算法主要还是依据权重链接的数量。将大众在网站中点击的智慧包含进来不是更好吗?如果把点击流和链接图相结合会怎样?我想谷歌是不是已经这么做了?现在如此多的网站都在运行谷歌的ADsense(和Analytics)分析软件,谷歌应该知道人们点击一个页面的频率以及人们从何处点击到这个页面,现在点击在PR排名中究竟起作用了没有?
我从谷歌一名副总裁那儿得到了对于我的问题的答复:“搜索质量是基于PR值和‘信息检索得分’(IR)的综合得分,而IR分值则考虑了点击(和用户感兴趣的其他指标)。”
换句话说,没错,谷歌的确将点击纳入了其创造知识图景的过程之中。
点击量将会继续领先链接量,因此我期望未来越来越多的互联网结构会依靠点击而非链接来决定。
2009年3月16日