第一站 - 轻松上网从此开始!

上网第一站

当前位置: > SEO >

SEOER必须关注百度蜘蛛抓取体验

时间:2014-05-21 23:19来源:loghao.com 作者我来投稿获取授权
以下内容来自网络或网友投稿,www.swdyz.com不承担连带责任,如有侵权问题请联系我删除。投稿如果是首发请注明‘第一站首发’。如果你对本站有什么好的要求或建议。那么都非常感谢你能-联系我|版权认领
百度蜘蛛抓取体验,听上去是一个新名词,其实它和用户体验一样,很早就出现在SEO行业里面了。百度蜘蛛抓取体验,可能是潜伏在资深SEOER脑海里的一个词。

  百度蜘蛛抓取体验,听上去是一个新名词,其实它和用户体验一样,很早就出现在SEO行业里面了。百度蜘蛛抓取体验,可能是潜伏在资深SEOER脑海里的一个词。

  什么是百度蜘蛛抓取体验呢?良好的代码结构,良好的URL结构。相信很多站长都有采集经验,很多CMS都带有采集功能。

  百度蜘蛛抓取体验和你写采集规则是一样的,一个网站有良好的代码结构,良好的URL结构,你可以轻易写出采集规则,顺利完成这个网站内容采集工作。

  URL,一个网站的URL如果很复杂,经过几次302或301跳转后才能到达目的页面。这样的URL,如果你要用CMS写采集规则,是不是增加了采集规则的难度。有些URL甚至通过JS跳转,才能到达内容页面,这些URL链接,请问该如何写采集规则。

  代码结构,一个网站的列表页面和内容页面,代码非常复杂。有可能是word编辑的内容,直接复制到网站后台编辑器,直接发布。一个列表页面,可能是JS,iframe嵌入页面,这样的代码结构,该如何写采集规则?你可能就直接放弃采集这个网站。百度蜘蛛也一样,可能计划来1万次抓取的,由于分析效率太低,它可能只能来3000次。

  如果SEOER有编程经验,通过对代码复杂的分析,针对网站写出采集规则是没问题的。那么,百度蜘蛛呢?百度蜘蛛该如何来抓取这些内容,百度蜘蛛可不会针对某个网站写采集规则。

  前几天Loghao一个蜘蛛分析案例,他网站的百度蜘蛛状态码40%都是302?笔者仔细看了他网站的链接结构,都是/xxxx结尾的,访问后链接后面自动加了/,变为/xxxx/。百度蜘蛛访问/xxxx后通过302跳转,到了/xxxx/。请问,这样的跳转访问,百度蜘蛛抓取体验是怎么样的?答案很明确,造成了蜘蛛多访问一次,如果这个网站有100万页面,蜘蛛就会多访问100万次,才能抓取到目标内容。

  所以,一个良好的URL规则,和代码规则,可以很大程度提高百度抓取体验,提高收录几率。

(责任编辑:admin)
织梦二维码生成器
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
发布者资料
第一站编辑 查看详细资料 发送留言 加为好友 用户等级:注册会员 注册时间:2012-05-22 19:05 最后登录:2014-08-08 03:08
栏目列表
推荐内容
分享按鈕