下面以举例网站服务器日志的定义: 1、记录服务器接收客户端处理请求,并记录服务器对这条请求处理结果以.log结尾的文件。 2、服务器日志是服务器自动生成的,一般以日期命名。 3、可以用记事本直接打开,最好用EditPlus打开。防止电脑死机。 网站日志类型: 一、Apache日志——Linux系统服务器日志 二、iis日志——Windows系统服务器日志 不管是哪种日志,主要看懂以下四点: 被访问的文件地址—— cs-uri-stem 搜索引擎蜘蛛或者用户浏览器—— cs(User-Agent) 访问者的IP—— c-ip 访问状态码—— sc-status 网站日志的获取流程(以莆田蓝韵公司空间为例:服务器操作系统是Windows) 第一步:登录空间后台——控制面板——WebLog日志下载 第二步:把下载的日志用EditPlus打开, 删除一些没用的,如下图所示,整理好,保存为.txt文档(之所以保存为txt文档,是为下一步做准备,因为excel表格导入数据只能是txt文档,别的格式不支持) 第三步:用excel表格导入,表格选中在第一行第一列位置,然后按照以下步骤一步步完成就可以了。 第四步:一张完美整洁的日志就导入进来了,这样再看是不是很舒服很清晰呢 第五步:把一些不需要的删除,只需保留cs-uri-stem URI资源、c-ip 客户端IP地址、cs(User-Agent) 用户代理、sc-status 协议状态这4项就可以了 如下图所示,一目了然! 网站日志英文注释: date 日期 time 时间 s-sitename 服务名 s-ip 服务器IP地址 cs-method 方法 cs-uri-stem URI资源 cs-uri-query URI查询 s-port 服务器端口 cs-username 用户名 c-ip 客户端IP地址 cs(User-Agent) 用户代理sc-status 协议状态 200表示成功 301永久重定向 403表示没有权限 404表示找不到该页面 500内部服务器错误 503服务器超时 sc-substatus 协议子状态 sc-win32-status Win32状态 sc-bytes 发送的字节数 cs-bytes 接收的字节数 time-taken 所用时间 网站日志分析 以下图为例 通过分析:一款俄罗斯的蜘蛛通过IP为141.8.142.145地址爬取了robots.txt这个文件,抓取成功,返回200正常。 竞争对手关键词分析 ①、分析URL连接,是否是用主域名还是内页在做? ②、关键词分布位置,是分词得到的结果还是完全匹配? ③、看关键词在标题的位置,是否在首位并重复出现,网站是否在围绕着个词在做? ④、看竞争对手首页外连,网站收录情况 例如link: , ,domain: ⑤、看网站规模,包括网站的域名年龄,收录量,更新机制及百度快照时间。 ⑥、看网站运营机构,是个人站长还是公司优化团队。 ⑦、看网站内链和外链,外连是否强大,内链是否文章是否做好锚文本。 8、网站xml网站地图,行业中数据量比较大,需要将sitemap分为日志和数据分析。格式 如果网站长时间收录有问题,那么我们可以对比网站日志中的搜索引擎蜘蛛行为,了解网站是哪方面出了问题;如果网站被封,或者被K,我们也都可以通过观察网站日志情况来了解原因出在什么地方。 (责任编辑:admin) |