收录域名 » 蓝爵观点 » 搜索引擎谷歌搜索算法更新

搜索引擎谷歌搜索算法更新

搜索引擎谷歌搜索算法更新

网络搜索是一个多方过程。首先,谷歌机器人获取每个可访问网站的内容。这些数据将被分解成一个索引(通过文字进行组织,就像书本的目录),这样就可以根据内容找到任何页面。每当用户键入一个查询,谷歌就会在索引中搜寻相关页面,然后返回一个包含多达数百万页面的列表。最复杂的是对列表进行排序,也就是决定哪些页面应该出现在最上面。

此时,上下文便有了用武之地。所有搜索引擎都会引入上下文,但没有一个像谷歌那样引入得那样多、应用那样自如。PageRank本身也是一个信号,同时也是页面的一个属性(指其相对于其他网页的重要性),该属性可以帮助确定其与查询内容的相关性,其中的一些信号在现在看来是显而易见的。

谷歌算法始于PageRank,这是1997年拉里·佩奇(Larry Page)在斯坦福大学读博士学位时开发的。佩奇的创新性想法是:把整个互联网复制到本地数据库,然后对网页上所有的链接进行分析。基于入链接的数量和重要性、及锚文本对网页的受欢迎程度进行评级,也就是通过网络的集体智慧确定哪些网站最有用。随着谷歌迅速成为互联网上最成功的搜索引擎,佩奇和谷歌的另一名创始人塞吉·布林(Sergey Brin)将PageRank这一简单概念看做谷歌的最根本创新。PageRank具有其优势,为带来高质量的搜索结果做出了贡献。

但这种过度依靠外链分析单一算法也具有弊端,那就是很多站长采取作弊手法来增加网站的外链,因此网络上有很多垃圾外链。为了应对这种情况谷歌13年更新了其核心算法,那就是蜂鸟算法(Hummmingbird)。在此套算法中,PageRank仍旧起很大作用,但是已经不是唯一的排名机制!随着时间的推移,外链在排名中所起的作用将逐渐衰落!

谷歌搜索算法是一个很普通的搜索,谷歌每天要处理成千上万的这种搜索。但事实上这一搜索过程十分复杂,可能使一些搜索引擎误解。如果把这些单词输入到必应,第一个结果是美国国家橄榄球联盟的历年球员名单,其中有一个名叫Lawyer Milloy。搜索结果中的下面几页,也没有与律师Siwek相关的内容。

这一对比显示出谷歌算法的强大,甚至可以说是智能,而这是通过反复的修正实现的。看起来谷歌拥有解读用户需求的神奇力量——不论是多么生僻的搜索,或是有拼写错误。谷歌将这种能力称为搜索质量,并且多年来一直竭力完善算法,以产生精确的搜索结果。

2013年9月27日,谷歌公布已推出“蜂鸟”(Hummingbird)算法,彻底革新代替旧版搜索算法,以应对来自网络用户更长、更复杂的查询。

 

0 Comments