搜索词处理包括几个方面?
2012/03/18 搜索词处理,潍坊网络公司,潍坊网站建设 www.di7.cc
经过搜素引擎蜘蛛抓取页面,索引程序计算得到倒排索引后,搜索引擎就准备好可以随时处理用户搜索了。用户在搜索框填入关键词后,排名程序调用索引库数据,计算排名显示给用户,排名过程是与用户直接互动的。 搜索引擎接收到用户输入的搜索词后,需要对搜索词做一些处理,才能进入排名过程。搜索词处理包括如下几个方面。 1、中文分词。与页面索引时一样,搜索词也必须进行中文分词,将查询字符串转换为以词为基础的关键词组合。分词原理与页面分词相同。 2、去停止词。和索引时一样,搜索引擎也需要把搜索词中的停止词去掉,最大限度地提高排名相关性及效率。 3、指令处理。查询词完成分词后,搜索引擎的默认处理方式是在关键词之间使用“与”逻辑。也就是说用户搜索“潍坊网络公司做网站”时,程序分词为“潍坊网络公司”和“做网站”两个词,搜索引擎排序时默认认为,用户寻找的是既包含“潍坊网络公司”,也包含“做网站”的页面。 4、拼写错误矫正。用户如果输入了明显错误的字或英文单词拼错,搜索引擎会提示用户正确的用字或拼法。 5、整合搜索触发。某些搜索词会触发整合搜索,比如明星姓名就经常触发图片和视频内容,当前的热门话题又容易触发咨询内容。哪些词触发哪些整合搜索,也需要在搜索词处理阶段计算。 潍坊第七网络工作室专业于潍坊网站建设,潍坊做网站等,是企业及个人做网站的首选!