作为一个专业的优化队伍,广州搜浪时常提醒着团队需要查看网站日志,以便知道近期蜘蛛的动向以及网站的一些细节,那么一个网站的日志需要如何查看呢?
首先我们得先知道所谓的网站日志是什么,所谓的网站日志,就是网站所在服务器接受用户的各种请求的时候进行的处理状况的记录,无论是正常处理或者是出了各种错误,都会在网站日志中记录下来,其文件结尾以.log为扩展名。
那么我们看一份日志,怎么样通过优化的眼光来有针对性的查看网站日志?广州搜浪网络总结了一些日志的有用的信息以供参考。
220.181.108.68--这是用户的IP地址,相信大家都能轻易看懂。不同的网站其用户群会有比较明显的区别,比如广州搜浪网络肯定大多数访问者是来自广州的,而有的网站其用户没有什么明显的地域区别。用户IP配合下面的关键词等信息可以让你更加有效的分析网站的用户体验做得够不够好。
[25/May/2012:20:22:35 +0800]--这里讲的是发生该处理请求的具体时间。这里的时间是2011年5月25日20点21分56秒,后面的+0800则指的是时区,即所在地方相对应英国伦敦格林尼治时间,+0800代表的是东八区的时间。
GET——这是服务器的处理动作,一共只有两种:GET和POST。在网站日志中绝大部分都是GET,只有在进行CGI处理的时候才会出现POST,否则绝大多数时间服务器的响应都是GET,也就是用户从服务器上获取了页面或者别的文件。
HTTP/1.1——这个代表用户访问该页面的时候,是通过HTTP1.1协议进行传输的,也就是超文本传输1.1版本协议。这个我们不必理会,因为网站日志中除了你可能用FTP之外,普通用户基本都是通过HTTP协议来进行访问的(个别提供FTP下载的网站除外)。
200 12447——代表的是用户访问页面的时候返回的状态码。通常状态码有以下几种:200,301,302,304,404,500等。
200代表用户成功的获取到了所请求的文件,如果是搜索引擎,则证明蜘蛛在这次爬行中顺利的发现了一些新的内容。
301则代表用户所访问的某个页面url已经做了301重定向(*性)处理,
302则是暂时性重定向,如果你的网站日志中有过多的302代码,那么你需要注意了,是不是把301做错了做成了302?赶紧修改,搜索引擎不喜欢302重定向。
404则代表所访问的页面已经不存在了,或者说访问的url根本就是个错误的。
500则是服务器的错误。状态码是比较多的,
以上就是一些对于网站日志的一些分析,当然实际上很多时候广州搜浪也并没有要求过量的查看网站日志,有很多的工具都可以代替我们这么繁琐的查看代码,可以很简单的得出结论,不过当网站真的有问题的时候那就需要人工进行代码分析了,这便是我们这里所说的需要使用以上一些分析的时候了。

