大家知道,PageRank是Google用于评测一个网页“重要性”的一种方法。在糅合了诸如Title标识和Keywords标识等所有其他因素之后,Google通过PageRank来调整结果,使那些更具“重要性”的网页在搜索结果中的排名获得提升,从而提高搜索结果的相关性和质量。
PageRank是基于“从许多优质的网页链接过来的网页,必定还是优质网页”的回归关系来判定所有网页的重要性。其计算公式是:
R(i) = ( 1 - d ) + d·∑ j∈B(i) R(j)/N(j)
式中:
R(i)——表示网页i的权威度;
B(i)——指向网页i的网页集;
N(j)——网页j中指向其他网页的超链接数;
d——衰减因子,0
从式中可以发现以下事实:
1 指向网页i的链接数越多,网页i的网页级别越高;
2 网页i的网页级别与施链网页的网页级别有关(或权威度有关),即来自权威网页的链接将比来自非权威网页的更有利于提高网页i的网页级别;
3 网页i的网页级别与施链网页的链出数有关,当一个施链网页的链出数(出度)较少时,更能说明施链网页对网页i的肯定程度;
4 对所有采集到的网页计算它们的PageRank值,是一个大型的多元一次方程,为了节省时间,Google不采取通常的高斯消元法,而是采用递归方式来逼近最优解。
显然,PageRank可以作为网页评价的权威性或影响力的指标。
A5创业网 版权所有