简单来说:建议有新闻属性站点,使用主动推送进行数据提交;新验证平台站点,或内容无时效性要求站点,可以使用Sitemap将网站全部内容使用Sitemap提交;技术能力弱,或网站内容较少的站点,可使用手工提交方式进行数据提交;最后,还可以使用插件方式,自动推送方式给百度提交数据 3.1.3 网页抓取 3.1.3.1 访问速度 关于移动页面的访问速度,百度搜索资源平台已于 2017 年 10 月推出过闪电算法,针对页面首页的打开速度给予策略支持。闪电算法中指出,移动搜索页面首屏加载时间将影响搜索排名。移动网页首屏加载时间在 2 秒之内的,在移动搜索下将获得提升页面评价优待,获得流量倾斜;同时,在移动搜索页面首屏加载非常慢( 3 秒及以上)的网页将会被打压。 对于页面访问速度的提速,这里也给到几点建议: 资源加载: √ 将同类型资源在服务器端压缩合并,减少网络请求次数和资源体积。 √ 引用通用资源,充分利用浏览器缓存。 √ 使用CDN加速,将用户的请求定向到最合适的缓存服务器上。 √ 非首屏图片类加载,将网络带宽留给首屏请求。 页面渲染: √ 将CSS样式写在头部样式表中,减少由CSS文件网络请求造成的渲染阻塞。 √ 将JavaScript放到文档末尾,或使用异步方式加载,避免JS执行阻塞渲染。 √ 对非文字元素(如图片,视频)指定宽高,避免浏览器重排重绘。 希望广大站长持续关注页面加载速度体验,视网站自身情况,参照建议自行优化页面,或使用通用的加速解决方案(如MIP),不断优化页面首屏加载时间。 了解MIP-移动网页加速器可参考:《如何用MIP快速搭建体验友好的移动页面》 3.1.3.2 返回码 HTTP状态码是用以表示网页服务器HTTP响应状态的 3 位数字代码。各位站长在平时维护网站过程中,可能会在站长工具后台抓取异常里面或者服务器日志里看到各种各样的响应状态码,有些甚至会影响网站的SEO效果,例如重点强调网页 404 设置,百度搜索资源平台(原百度站长平台)中部分工具如死链提交,需要网站把内容死链后进行提交,这里要求设置必须是404。 下面为大家整理了一些常见的HTTP状态码: 301:(永久移动)请求的网页已被永久移动到新位置。服务器返回此响应(作为对GET或HEAD请求的响应)时,会自动将请求者转到新位置。 302:(临时移动)服务器目前正从不同位置的网页响应请求,但请求者应继续使用原有位置来进行以后的请求。此代码与响应GET和HEAD请求的 301 代码类似,会自动将请求者转到不同的位置。 这里强调 301 与 302 的区别: 301/ 302 的关键区别在于:这个资源是否存在/有效 301 指资源还在,只是换了一个位置,返回的是新位置的内容。 302 指资源暂时失效,返回的是一个临时的代替页(例如镜像资源、首页、 404 页面)上。注意如果永久失效应当使用404。 有时站长认为百度对 302 不友好,可能是误用了 302 处理仍然有效的资源。 400:(错误请求)服务器不理解请求的语法。 403:(已禁止)服务器已经理解请求,但是拒绝执行它。 404:(未找到)服务器找不到请求的网页。 这里不得不提的一点,很多站长想自定义 404 页面,需要做到确保蜘蛛访问时返回状态码为404,若因为 404 页面跳转时设置不当,返回了 200 状态码,则容易被搜索引擎认为网站上出现了大量重复页面,从而对网站评价造成影响。 500:(服务器内部错误)服务器遇到错误,无法完成请求。 502:(错误网关)服务器作为网关或代理,从上游服务器收到了无效的响应。 503:(服务不可用)目前无法使用服务器(由于超载或进行停机维护)。通常,这只是一种暂时的状态。 504:(网关超时)服务器作为网关或代理,未及时从上游服务器接收请求。 3.1.3.3 robots robots工具的详细工具使用说明,细节参考4.3.4robots工具章节,关于robots的使用,仅强调以下两点: √ 百度蜘蛛目前在robots里是不支持中文的,故网站robots文件编写不建议使用中文字符 √ robots文件支持UrlEncode编码这种写法,如%E7%89%B9%E6%AE%8A:%E6%B5%8F%E8%A7%88/%E7%94%9F%E6%AD%BB%E7%8B%99%E5%87%BB:%E7%99%BD%E9%93%B6%E5%8A%A0%E7%89%B9%E6%9E%97 什么是死链及死链的标准 (责任编辑:admin) |