4、定时定量更新内容,最好是原创,其次是伪原创,最次是完全采集。建议采集后二次加工一下,变成伪原创会好很多,另外,我的网站内容都是采集的,但是采集的是百度没有收录过的内容,所以其实也算是原创了 5、使用百度统计,这个是百度自己的产品,百度会借助他们更深入的了解你的网站内部的情况,如果你的流量大,百度会提升网站权重,加速收录,这个算是加分项 6、使用百度站内搜索,百度搜索和百度站内搜索用的是同一套索引库,所以如果能加速站内搜索对网站的收录,那么其实也就加快了百度搜索对网站的收录 7、提供百度站内搜索要求的格式的sitemap并提交给百度,这个格式比较丰富,带有很多额外数据,对百度爬虫非常友好 8、百度新链接推送有三种方式:主动推送、自动推送和sitemap,效果最好的是主动推送,自动推送次之,sitemap最差 9、如果你是资讯类网站或有资讯类栏目,那么建议接入百度推荐,也是百度自家的产品,好处跟上面一样 10、加强站内链接,建议把网站做成扁平化的,这样在每个页面都能看到整个网站的各主要栏目的链接,爬虫在任何页面爬虫都有机会链接到其他重要栏目或页面,便于爬取和收录 11、sitemap每日定期更新,但不要把全站链接放进去,每次只放最近一天或几天产出的新的、优质的链接即可,否则sitemap中链接太多会让爬虫不堪重负,导致新的链接迟迟无法收录 最后,补充两点关于资讯内容的个人见解: 1、互联网上太多资讯了,有优质的但更多是垃圾的,什么是优质资讯?合适的字体大小和颜色、图文并茂、篇幅适中、与网站或栏目主题相关、能为用户提供帮助,照这个标准去做数据,百度一定喜欢,具体可以参考我的"购物头条"栏目,这里为了配合我的商品栏目中的商品类目,设计了几个资讯分类,基本是一一对应的,所以内容与主题呼应,每篇文章都是图文混排,看起来比较舒服。 2、关于资讯数据采集,没几个站长有时间每天挖空心思写原创,而且就算写得出来被人家大站采集了,百度还是不认为我们是原创,所以采集是唯一最可行的办法,怎么采集呢?最好采集一些冷门的或者是封闭的网站的内容,这样百度从你的网站上看到了之前从来没有看到过的内容,自然就认为是你的原创了,百度对原封不动的采集深恶痛绝,对原创则是爱不释手,所以,站长同学,花点心思采集原创资讯,还是很有价值和意义的 3、谨慎使用CDN,我在网站图片和静态资源上用了七牛的CDN,但是页面还是网站直出的没用CDN,因为刚开始我用过免费的百度CDN,发现很多时候页面打不开而且错误页面非常不友好,就取消了,鉴于CDN的工作原理,建议新站审核收录期间谨慎使用CDN,最好不要用,过了审核期收录稳定之后再用 4、如果你坚持按照百度赞同的做法在更新和运营网站,那么在看到收录量上升之前一定要有耐心,百度会根据网站内容的更新频率抓取网页,但不放出来,如果网站的表现足够好,百度会每隔2-3周释放一次,每次释放的量会逐次增加 5、千万不要100%采集百度已收录的内容,尤其是低质量内容,否则百度会认为你这是一个垃圾镜像站,轻则延长审核期,重则直接打入底层库,以后再想升上来可就难了 最后的最后,祝愿各位的网站都能尽快被收录,网站流量直线上涨! (责任编辑:admin) |