搜索引擎可算是当今互联网中应用技术含量非常高的产物,虽然它们的应用形式非常简单,但却为了给亿万互联网用户提供准确快速的搜索结果,涉及到很多技术工具。作为SEOer,或许我们不用考虑搜索引擎的技术,但我们还是需要了解他们到底在研究哪些问题?
搜索引擎的三大核心问题
核心问题一:搜索引擎相关性技术
搜索引擎要准确判断用户查询词与页面的相关性,就需按相关性强弱完成页面集合的初步筛选和排序。
关于相关性的分类
1.查询关键词的相关性
搜索引擎首先就要判断用户查询关键词的语义,因为同一个词在不同的场景上有不同的意思,只有正确判断语义,才能更好地去匹配相关性强的页面。如果判断错误,造成搜索结果页面完全不是用户所需的内容,就会大大降低用户的搜索体验。
2.用户相关性
用户看过哪篇文章和进入哪个网站,在搜索某个词时,这篇文章和这个网站会有不一样的排名。又或者某用户是某个领域的专家或是经常关注这方面的爱好者,当他搜索这个领域的某些词时,他的多次进入也会使网站排名产生积极的作用。
这就是SEO优化当中常说的个性化搜索。
3.检索模型
为了检索页面与用户搜索词的相关性,搜索引擎研究人员研究出各种检索模式,其中「TF-IDF」是大家最熟悉的检索模式之一。 TF-IDF的核心概念是一定程度上增加TF(关键词频率或密度)和IDF(关键词的反文档频率)的值,最终得到的两者成绩就是判断页面相关性的值。也就是,增加关键词频率或密度,找寻百度相关搜索结果数小的词。
核心问题二:搜索引擎评价技术
如果说相关性研究仅仅是最初的筛选和排序,那么要达到用户的真正期望,就需要通过搜索引擎评价技术来完成。
① 用户点击生成的日志数据
搜索引擎会将用户点击的数据在后台记录,生成大量的日志数据,再利用这些数据对搜索引擎进行评价。
② 搜索引擎评价的方法
最常用的评价方法就是Cyril Cleverdon,其指标有两种:
准确率:指检索出来的文档中相关文档所占比例。
召回率:指全部文档中中被检测出来的文档比例。
三、搜索引擎用户搜索体验技术
搜索引擎是面向用户的,所以用户搜索体验是判断搜索引擎好坏的重要之一。搜索引擎通过数据可以分析哪些页面或网站的用户搜索体验好,提升其排名或网站权重;如果做得不好的页面或网站,则降低其排名或整站权重。
了解搜索引擎的核心问题,就能在优化网站的过程,提高网站体验度,使网站获得更好的排名,这样对PV、UV等数据提升也有很大的网站。