从上图我们可以看得出,该页面不仅仅被收录,还建立了索引,并且搜索整个标题可以检索到排名。从这点我们可以看出,索引的页面无需做任何外链、内链、甚至是抄袭的文章即可有参与排名的资格。那么问题来了,该如何进行有效的页面进行建立索引并建立起参与排名的资格? 很多人在思考一个问题,文章要尽量原创,满足用户需求,提高用户体验等等。但是为何有些站点收录非常好,排名也非常不错,文章却是采集或者伪原创。讲到建立索引以前,我们继续先把剩下的一个工作原理分析完毕。 三、检索与排名 在整个检索与排名中,会体现出最常用的两个搜索引擎原理,一个就是倒排索引,另外一个就是TF-IDF算法,首先我们来了解下倒排索引的更新策略,如下图所示(来自百度百科-倒排索引):
在整个倒排索引结构中,最常见的有四种更新策略,而上述的案例中就用到了其中两种,如果大家仔细的去观察我的每一个文章,就不难发现即使我的页面是纯抄袭文章,但是我抄袭的每一个标题和原来标题不相同,并且标题会更加的去符合页面内容,提升页面词频需求(TF-IDF)。其次则是抄袭的文章不会直接复制粘贴,我会进行重新排版,重构页面从而达到页面并非采集的作用。 在搜索引擎里面。有一个算法叫做TF-IDF算法,简单来说,TF-IDF算法(详细公式参考:))是用来检索页面文档关键词出现的频次。并且可以通过该算法计算一个文件集合里面的词频出现的次数从而来评定一个页面的重要程度。而该重要程度是结合页面TITLE来计算,也就是大家常说的文章内容要符合页面标题的主题相关性(类似作文写作中的紧扣主题)。 看到这里,我相信很多朋友就会理解为何蜘蛛池程序可以快速提升收录并且有部分页面进行参与排名,很大的一个特点就是蜘蛛的频繁抓取,从而建立了索引,在短时间内让页面“权重”提升,并且促进排名,而新闻站点的原理也是因为蜘蛛抓取频繁的特点,几乎无需发布任何的外链即可有很好的排名。 现在我们再来分析和思考整个页面的抓取到最终的检索排名我一共操作了哪些: 第一、大量的不定时更新,让蜘蛛抓取频繁抓取(建议给百度提交站点地图,定时更新站点地图) 第二、大量采集文章通过修改标题与布局重构让页面变得更新有新鲜度(满足更符合页面的用户需求) 第三、每天保持大量的更新让蜘蛛抓取形成习惯 第四、由于该站是老域名,加上站点原始数据积累,可保持站点的权威度,从而相对新域名来说站点更加具备抓取优势。 总而言之,虽然最后只给大家留下了4点,当然也有很多SEO同学会觉得我说了一堆没用的,但是如何你真正的去领悟到我所提到的一些核心要点,那么你就不难发现SEO建立索引的奥妙所在,做SEO,思路决定出路,我更加建议seo同学们可以多去了解搜索引擎的一些基础算法和百度官方优化指南文档,如果能够把里面的任何一个核心点通过实战的方式去吃透他,那么比你看任何的所谓的SEO文章都要有价值! (责任编辑:admin) |