当前位置: 技术问答>linux和unix
[求助]Shell编写apache日志分析脚本
来源: 互联网 发布时间:2017-02-04
本文导语: 本帖最后由 Galya 于 2012-02-20 13:31:00 编辑 日志格式如下: 127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] "GET /port/user.php?uid=54129&cla=baidu&key=e5d38743014f88f953269399282c86f5 HTTP/1.1" 200 4 "-" "-" 35622 127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] ...
127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] "GET /port/user.php?uid=54129&cla=baidu&key=e5d38743014f88f953269399282c86f5 HTTP/1.1" 200 4 "-" "-" 35622
127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] "GET /test.php HTTP/1.1" 200 4 "-" "-" 35622
127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] "GET /port/user.php?uid=12312&cla=google&key=e5d38743014f88f953269399282c86f5 HTTP/1.1" 200 4 "-" "-" 35622
127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] "GET /port/port.php?uid=15642&key=e5d38743014f88f953269399282c86f5 HTTP/1.1" 200 4 "-" "-" 35622
127.0.0.1 - - [14/Feb/2012:00:02:32 +0800] "GET /test.php HTTP/1.1" 200 4 "-" "-" 35622
需求如下:
user.php的分析结果文件名从这里来……aaa.php?cla=bbb……
>>> aaa.bbb.log。
port.php的分析结果输出就直接是port.log
内容格式如下:
IP date response
127.0.0.1 14/Feb/2012:00:02:32 35622
只要user.php和port.php的访问日志。
默认情况下筛选userport的所有日志。
另外,可以在执行脚本时指定user或port,以及某一天的日期进行筛选。
=========================
以下是我大概写的片断,菜鸟,请见谅。
若有更好的也请前辈位帮忙改写一下,谢谢!
……
path=/apache/access/log/
host=$1
case $type in
"user")
cat $file | grep $type | awk '/GET/&&/user.php?uid=/{split($7,a,"[/|.|?|=|&]");print $1,substr($4,2),$NF > a[3]"."a[8]".log"}'
;;
"port")
cat $file | grep $type | awk -F " " '{print $1,substr($4,2),$NF}' >> $path$type.log # 这里的$path起作用了
;;
esac
……
还有一个小问题,一直试不出来:
1、想把输出的文件指定到$path下,如:
/apache/access/log/user.baidu.log
2、把$host(192.168.1.1)的内容添加到输出文件的内容里面,就是在awk筛选出来的结果前加入$host的内容,如:
192.168.1.1 111.111.111.111 14/Feb/2012:00:02:32 35622
我直接把$path和$host放到awk里面,但是执行不了提示错误,实在没办法了。
请指点一下我该怎么改写,谢谢!
|
[16:59:50] tty:[2] jobs:[0] cwd:[~/shell]
[liangdong@jx-csblog01.jx.baidu.com shell]$ echo -e "a.b.cnd.e.cn" | awk -F '.' '{print $1"."$2 >> $3".log"}'
[17:01:25] tty:[2] jobs:[0] cwd:[~/shell]
[liangdong@jx-csblog01.jx.baidu.com shell]$ ll
total 16
-rw-rw-r-- 1 liangdong liangdong 80 Feb 16 13:08 a.txt
-rw-rw-r-- 1 liangdong liangdong 30 Feb 16 13:11 b.txt
-rw-rw-r-- 1 liangdong liangdong 8 Feb 20 17:01 c.log
-rwxrw-r-- 1 liangdong liangdong 14 Feb 20 16:23 test.sh
[17:01:26] tty:[2] jobs:[0] cwd:[~/shell]
[liangdong@jx-csblog01.jx.baidu.com shell]$ cat c.log
a.b
d.e
OK的呀.
|
awk里的变量不需要$,没有其他错误.
|
[root@jx-csblog01.jx.baidu.com ~]# awk -v "path=/root" -v "host=localhost" 'BEGIN{print path","host}'
/root,localhost
这个意思么.
/root,localhost
这个意思么.