百度站长平台：搜索引擎检索系统概述_上网第一站

第一站 - 轻松上网从此开始！

高级搜索|网站地图|TAG标签 RSS订阅[设为首页] [加入收藏]

当前位置: > SEO >

百度站长平台：搜索引擎检索系统概述

时间:2015-06-17 16:18来源:网络整理作者:跌名点击: 次我来投稿获取授权

以下内容来自网络或网友投稿，www.swdyz.com不承担连带责任，如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领

前面简要介绍过了搜索引擎的索引系统，实际上在建立倒排索引的最后还需要有一个入库写库的过程，而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部，并且对数据进行压

　　

　　前面简要介绍过了搜索引擎的索引系统，实际上在建立倒排索引的最后还需要有一个入库写库的过程，而为了提高效率这个过程还需要将全部term以及偏移量保存在文件头部，并且对数据进行压缩，这涉及到的过于技术化在此就不多提了。今天简要给大家介绍一下索引之后的检索系统。

　　检索系统主要包含了五个部分，如下图所示：

百度站长平台：搜索引擎检索系统概述

　　(1)Query串切词分词即将用户的查询词进行分词，对之后的查询做准备，以“10号线地铁故障”为例，可能的分词如下(同义词问题暂时略过)：

　　10 0x123abc

　　号 0x13445d

　　线 0x234d

　　地铁 0x145cf

　　故障 0x354df

　　(2)查出含每个term的文档集合，即找出待选集合，如下：

　　0x123abc 1 2 3 4 7 9…..

　　0x13445d 2 5 8 9 10 11……

　　……

　　……

　　(3)求交，上述求交，文档2和文档9可能是我们需要找的，整个求交过程实际上关系着整个系统的性能，这里面包含了使用缓存等等手段进行性能优化;

　　(4)各种过滤，举例可能包含过滤掉死链、重复数据、*情、垃圾结果以及你懂的;

　　(5)最终排序，将最能满足用户需求的结果排序在最前，可能包括的有用信息如：网站的整体评价、网页质量、内容质量、资源质量、匹配程度、分散度、时效性等等，之后会详细给大家介绍。

(责任编辑：admin)

织梦二维码生成器

顶一下

(0)

0%

踩一下

(0)

0%

------分隔线----------------------------

上一篇：百度站长平台：搜索引擎索引系统概述
下一篇：个人博客流量靠搜索引擎不靠谱

发布者资料: 第一站编辑查看详细资料发送留言加为好友用户等级:注册会员注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08

栏目列表

推荐内容

那些很熟悉但又叫不出名字的设计
希克定律适用于任何要从多重选项做出简单决定的系统设计或程...
技能分享：用六步总结首页改版
业务策略变化品牌升级年久失修，体验变差换了老板 2)首页改...
新营销究竟是什么？这篇文章终于
成功一定是符合逻辑的，但符合逻辑的不一定成功。一个新的体...
创业者如何利用说服力策略，获得
对于创业公司和创始人来说，拥有说服力比拥有远见更重要。...
4个关键点，提升软文推广的转化率
通过优质的内容，吸引并打动消费者，促使其转化为实际的用户...
德国金融科技企业N26融资1.6亿美元
新浪科技讯北京时间3月20日下午消息，德国初创企业N26刚刚完成...

热点内容