第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

新手seo概念:爬行与索引的区别

时间:2012-06-14 14:13来源:网络 作者:上海交通 点击: 我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
爬行和索引是seo的两个专业术语,当很多新手接触seo的时候,他们会将这两个词混合使用,认为爬行就是索引。今天笔者就和大家仔细讲述一些爬行好索引之间的区别

  爬行和索引是seo的两个专业术语,当很多新手接触seo的时候,他们会将这两个词混合使用,认为爬行就是索引。今天笔者就和大家仔细讲述一些爬行好索引之间的区别是什么?

  1、爬行

  当搜索引擎蜘蛛在站点中发生爬行时,站点中有一个并且只有唯一一个url被抓取,搜索引擎可以从其他网页的链接跟踪爬行到这个站点中,所以对爬行的认识就是搜索引擎按照链接对站点特定的url进行抓取。

  可能上面的概念比较抽象,我们举例简单说明,比如说,在很多时候蜘蛛在爬行站点的时候,站点中的有些链接就不能被抓取,比如:

  (1)链接编码是Javascript,因为这被称为“蜘蛛陷阱”,爬行站点的时候,蜘蛛会自动屏蔽爬行这些链接。

  (2)链接被标记为robots.txt的 “禁止指令。

  (3)孤立的链接(没有人挂的情况下的sitemaps.xml,包括如链接)

  (4)链接所在的页面是一个包含链nofollow指令的页面

  (5)本来是要抓取的链接,但是因为服务器不稳定的原因无法进行抓取。

  2、索引

  索引和爬行最大的区别就是,索引不是一个特定的url被抓取,而是页面中的很多歌url,简单的说就是当搜索引擎确定好要索引哪个页面之后,它就会这个页面中的所有url进行处理和抓取,在抓取的过程中,蜘蛛会根据页面的内容进行适当的处理,举一个简单的例子,在有的页面内容中虽然存在一个url但这个url已经加上了NOINDEX指令,那么搜索引擎是不会抓取这个页面的。

  站点页面处于非索引状态的原因:

  (1)在页面中含有NOINDEX指令()

  (2)重复的内容:具有相同内容页面可能无法被索引。

  (3)其他原因:链接的年龄和链接流行

  如果新手想知道站点中的哪些页面已经被索引了,那么可以通过“site+网站域名”的方式检索,通过这样的方式,搜索引擎将会显示有多少个页面已经被蜘蛛所引并且是哪些页面。

  爬行和索引虽然表示的都是蜘蛛抓取站点,但他们所包含的方向是不一样的,这里笔者建议注意区分开。

  本文原创 网站,首发A5网站,转载请保留有效的链接地址,谢谢!

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕