一个文科生对于PR算法的研究
所有假设都是基于用户行为的分析。而算法就是把这些分析公式化。所有的算法都会有个假设前提。
PR算法主要基于数量假设和质量假设两个方面考虑的
数量假设:该页面收到越多的入链(其他网页对该页面的链接称为入链)则表示该网站建设越重要。也就是一个好的页面肯定会获得很多其他页面的推荐。
质量高的网页会通过链接传递更多的权重,质量假设:指向该页面的入链的质量不同。越是质量高的网页指向该页面,则表示该页面越重要。也就是一个好的网页肯定也会获得其他好的网页的认同。
PR算法刚开始会挑选一批网页作为种子网页并赋予较高的PR通过迭代递归算法计算来更新每个页面节点的PR得分,通过以上两个假设。直到得分稳定为止,即为当前页面PR得分。
作为网页排名其中的一个因素。但PR一个全局性的算法,PR计算进去的结果是对网页重要性的评估。和具体查询无关,即和相关性无关的PR高不能说明该网页相关。假如搜索引擎只用PR这一算法进行排序的话,那无论你输入任何的查询词,输出的结果都是一样的谁PR高就谁排前面。
PR重要吗?PR不重要吗?看果园去!过度追求PR结果往往得不偿失。
一个高不是高,对于PR来说。大家高才是真的高!
假如A网页有两个出链分别连接到B网页和C网页。假如A网页的PR值是1那么以概率平均分配的原则,PR计算很简单。B和C网页都会平均得到0.5值的传送。这种计算方法是建立在随机游走模型上的随机游走模型是指假设这个网页有三个出链,用户点击每个出链的概率是一样的所以传送的PR值也是一样的
否则最后所有网页的PR值都会无穷大。所以PR算法引入了衰减因子的概念,由于网页之间是互相连接的所以PR不能一直循环传送下去。即是中转的次数越多离种子网页越远,传送的PR值越少,直到传送值为0得分稳定为止。才计算最后PR得分,加入排序结果的计算中。
有些网页只有入链没有出链,另外。那么会导致积蓄的PR值越来越高,而不能传送进来。这样会违背PR设计初衷,影响公平性。这种结构被称为链接陷阱。
就是PR传送并不局限于出链的传送,远程跳转是解决链接陷阱的通用方式。也可以以一定的概率向任意一个页面传递PR
早已普遍运用到反作弊当中,PR算法作为谷歌标志性算法。即以挑选出一批作弊网页作为种子网页(挑选信任网页也亦然)给予一定的作弊分值(或信任分值)跟PR算法一样进行传送,设定一个惩罚阀值,达到则为作弊网页。
这种反作弊是基于假设:
则这个网页很可能也是作弊网页。一、如果一个网页将其链接指向作弊网页。
则不能说明这个网页是作弊的二、如果一个网页被作弊网页指向。
要看这个算法解决了什么问题,当然这只是最原始的反作弊思路。研究搜索引擎算法不应该只盯着公式看。基于什么样的假设,这种假设是不是符合用户行为。解了算法的来龙去脉,才干更好的知道搜索引擎解决问题的方法。这样才是学习SEO王道!
防止违反规则受到惩办。解规则是为了更好的运用规则。
本文发布于北京网站建设公司尚品中国http://www.sino-web.net/
推荐新闻
更多行业-
生物医药网站建设的压力会很高吗?如何效率制作?
因为互联网的使用在现在确实很常见,所以也是让各类型的网站使用频率提高,...
2022-12-07 -
浅谈搜索引擎优化对网站的投票原理
随着互联网的飞速发展,SEO网站优化行业近年来竞争愈演愈烈,百度算法的...
2013-08-07 -
网站设计(精选5篇)
当涉及到网站设计时,有许多关键因素需要考虑,包括用户体验、响应式设计、...
2023-09-04 -
企业网站制作要考虑什么?有哪些问题要关注?
很多人都知道经营企业在我们生活当中是非常冒险的一件事情,如果想要进行成...
2022-10-20 -
网站制作流程简单的三个步骤
网站已经成为了企业或个人展示形象、推广产品、吸引客户和扩大影响力的重要...
2023-06-13 -
您知道网站建设都有哪些发展前景吗?
对于网站建设的目的,有的企业是想通过互联网强大的信息传播能力,树立起企...
2019-08-20
预约专业咨询顾问沟通!
免责声明
非常感谢您访问我们的网站。在您使用本网站之前,请您仔细阅读本声明的所有条款。
1、本站部分内容来源自网络,涉及到的部分文章和图片版权属于原作者,本站转载仅供大家学习和交流,切勿用于任何商业活动。
2、本站不承担用户因使用这些资源对自己和他人造成任何形式的损失或伤害。
3、本声明未涉及的问题参见国家有关法律法规,当本声明与国家法律法规冲突时,以国家法律法规为准。
4、如果侵害了您的合法权益,请您及时与我们,我们会在第一时间删除相关内容!
联系方式:010-60259772
电子邮件:394588593@qq.com