鲨鱼:浅谈日志语法和HTTP状态码

时间:2010-08-18

在seo的过程中查看IIS日志是一件很重要的事,特别是当页面做了比较大的改动时,通过日志的检测,可以发现很多很有趣的问题。现在空间都提供日志查询的功能,而日志一般存放在网站根目录下的log、wwwlog、logfiles等类似的目录下,通过下载类似的文件解压了就可以用记事本就查看了。

下面我截取一段代码进行分析。

2010-07-24 02:20:57 W3SVC133 221.231.137.66 GET – 80 – 123.125.66.111 Baiduspider+(+) 200 0 64 0

2010-07-24 02:20:57 蜘蛛的访问时间

221.231.137.66 访问的IP地址

W3SVC133 机器码

GET 请求方式

/Index.html 请求的url

80 服务器端口号

123.125.66.111 服务器的IP

baiduspider 百度蜘蛛

200 0 64 0 200表示请求成功, 64意味着百度对于该页面的爬行并未完全读取完毕,在爬行的过程中放弃了,属于一个错误代码,而最后一个数据为0,则表示抓取的网页大小字节为0。

200 0 64 状态码的构成是:sc-status(协议状态,200在这里指连接成功) sc-substatus(协议子状态) sc-win32-status(Win32状态码,64是指定的网络名不可用

看第二个列子:

2010-07-24 12:37:39 W3SVC133 221.231.137.66 GET - 80 – 203.208.60.79 Mozilla/5.0+(compatible;+Googlebot/2.1;++) 200 0 0 6503

/501.html 请求的url

compatible 指兼容性

Googlebot 谷歌机器人

200 0 0 6503 请求成功并下载了6503字节数据。

一般我们只要看百度和google的蜘蛛就可以,其他的方法一样,就不在举例了。下面我列举下常见的HTTP状态码:

1xx(临时响应);2xx(成功);3xx(已重定向);4xx(请求错误);5xx(服务器错误);

200 – 服务器成功返回网页

301 - 永久性资源重定向

302 - 暂时性资源重定向

304 - 上次GET后,页面为发生变化

403 - 服务器已经请求,但还没执行

404 - 请求错误或请求失败

505 - HTTP 版本不受支持

不用太多,以上的HTTP状态码能看懂就好了,其他的状态码比较不常见,所以不要记了,用到的时候自己在搜索引擎里找下就可以了。

本文地址: , 转载请保留.A5首发

相关文章

A5创业网 版权所有

返回顶部