写在前面:搜到科技实验小组研究员童欣给大家讲解【详细分析IIS网站日志】,具体分为以下几个步骤,请大家认真阅读;如有问题可以去我博客童欣SEO博客_上海SEO:WWW.SOUSUOSEO.COM
这里需要对服务器环境类型做进一步的说明。
由于服务器平台比较多,每使用不同的服务器记录的日志格式也不相同。经常使用的WEB服务器环境有以下几种,将逐一的进行解析说明。
1、Nginx服务器
linux虚拟主机的Nginx0.8服务器环境
2、Apache服务器
Linux虚拟主机的Apache服务器环境
3、IIS服务器
WIN虚拟主机的IIS6服务器环境
日志文件的名称格式是:ex+年份的末两位数字+月份+日期。
( 如2002年8月10日的WWW日志文件是ex020810.log )
IIS的日志文件都是文本文件,可以使用任何编辑器或相关软件打开,例如记事本程序,AWStats工具。
开头四行都是日志的说明信息
#Software 生成软件
#Version 版本
#Date 日志发生日期
#Fields 字段,显示记录信息的格式,可由IIS自定义。
日志的主体是一条一条的请求信息,请求信息的格式是由#Fields定义的,每个字段都有空格隔开。
字段解释
data 日期
time 时间
cs-method 请求方法
cs-uri-stem 请求文件
cs-uri-query 请求参数
cs-username 客户端用户名
c-ip 客户端IP
cs-version 客户端协议版本
cs(User-Agent) 客户端浏览器
cs(Referer) 引用页
4、其它主机空间日志
下面列举说明日志文件的部分内容(每个日志文件都有如下的头4行):
#Software: Microsoft Internet Information Services 6.0
#Version: 1.0
#Date: 2007-09-21 02:38:17
#Fields: date time s-sitename s-ip cs-method cs-uri-stem cs-uri-query s-port cs-username c-ip cs(User-Agent) sc-status sc-substatus sc-win32-status
2007-09-21 01:10:51 10.152.8.17 - 10.152.8.2 80
GET /seek/images/ip.gif - 200 Mozilla/5.0+(X11;+U;+Linux+2.4.2-2+i686;+en-US;+0.7)
上面各行分别清楚地记下了远程客户端的:
连接时间 2007-09-21 01:10:51
IP地址 10.152.8.17 - 10.152.8.2
端 口 80
请求动作 GET /seek/images/ip.gif - 200
返回结果 - 200 (用数字表示,如页面不存在则以404返回)
浏览器类型 Mozilla/5.0+
系统等相关信息 X11;+U;+Linux+2.4.2-2+i686;+en-US;+0.7
案例: 220.181.108.121 - - [06/Apr/2011:21:38:11 +0800] "GET /tag/\xe7\xac\xac\xe4\xb8\x80\xe5\x95\x86\xe5\x8a\xa1\xe7\xbd\x91 HTTP/1.1" 200 18228 "-" "Baiduspider+(+http://www.baidu.com/search/spider.htm)此段日志是4月6号创建,也是1-10号日志中都存在的,也就是说明百度蜘蛛抓取了tag,并且进行了数据库处理成功抓取。这个代码的重要性也提示了大家百度对于TAG的重要性,也就是现在很多大站仍旧处于对TAG部分的处理,现在很多BLOG对TAG都有所处理,其中wordpressZ好;
总结:IIS日志是我们分析网站的重要参考数据,我们要经常对其进行分析总结经验,这样可以让我们对网站的一些问题了如指掌。才能做到一切在掌握之中!
文章由自童欣SEO博客_上海SEO(www.webseo.com.cn)站长分享!
同时感谢中国搜到科技提供技术支持(bbs.云优化seo.com)
上一篇技术文章:新手基础篇【如何查看服务器日志】(一)
下一篇技术文章:新手上路【巧用日志分析工具】