博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
重写之后的脚本。希望还好
阅读量:6403 次
发布时间:2019-06-23

本文共 3858 字,大约阅读时间需要 12 分钟。

#!/bin/sh################################################                                             ##  author:lishujun                            ##  date:2013-4-17                             ##  use:$./testread.sh 20130425                ##                                             ################################################### load Library ###. common#init_date $1#init_dbcommon_init_stat_date $1stat_date=$statDate### define global variable ###logFile='./logs/'$stat_date'/wap_access_log.'$stat_date'*'dataFile='./data/access_detail_'$stat_date'_small'domain='pp.cn,sou.pp.cn,c0.pp.cn,c1.pp.cn,c2.pp.cn,c3.pp.cn'#domain=$2#domain='shuqi.com,pp.cn,shuqiread.com'ucFlags='fr,ct,ac'### functions ###cleanDataFile(){        echo clean data files...        rm $dataFile}makeDataFile(){        #./kcat.sh  $logFile | awk \        /www/scripts/stat/kcat.sh  $logFile | awk \                -v domain=$domain \                -v ucFlags=$ucFlags \                -v dataFile=$dataFile \        '        function extractField(s)        {                gsub(/\[/,"",s)                gsub(/\]/,"",s)                return s        }        function extractFad(url)        {                #if(match(url,/\[FAD:/) > 0)                if(match(url,/\[FAD:[0-9]+\]/) > 0)                {                        return substr(url,RSTART+5,RLENGTH-6)                }                return "-"        }        function parseUrl(url,params)        {                params["domain"] = "-"                if(match(url,/[:\/]/)>0)                {                        params["domain"] = substr(url,1,RSTART-1)                }                params["path"] = "-"                if(match(url,/\/[^\?$]*[\?$]/)>0)                {                        params["path"] = substr(url,RSTART,RLENGTH-1)                }                params["fr"] = "-"                if(match(url,/[&?]fr=[^&$]+/)!=0)                {                        params["fr"]=substr(url,RSTART+4,RLENGTH-4)                }                params["ct"] = "-"                if(match(url,/[&?]ct=[^&$]+/)!=0)                {                        params["ct"]=substr(url,RSTART+4,RLENGTH-4)                }                params["ac"] = "-"                if(match(url,/[&?]ac=[^&$]+/)!=0)                {                        params["ac"]=substr(url,RSTART+4,RLENGTH-4)                }        }        BEGIN{                split(domain,domainList,",")        }        {                #print $0                userid = extractField($4)                url = extractField($6)                session = extractField($9)                fad = extractFad($0)                if(int(userid) < 1)                {                        userid = session                }                for(i in domainList)                {                        len = length(domainList[i])                        if(substr(url,0,len) == domainList[i])                        {                                parseUrl(url,urlParams)                                line = userid" "urlParams["domain"]" "urlParams["path"]" "urlParams["fr"]" "urlParams["ct"]" "urlParams["ac"]" "fad                                #print line                                if(line in list)                                {                                        list[line]++                                }                                else                                {                                        list[line] = 1                                        print line >> dataFile                                }                                break                        }                }        }        '}main(){        echo `date ` start...        cleanDataFile        makeDataFile        echo `date` done}#call main functionmain

 

 

转载于:https://www.cnblogs.com/code-style/archive/2013/04/30/3052316.html

你可能感兴趣的文章
职业生涯上的点点滴滴
查看>>
Linux下添加新硬盘,分区及挂载
查看>>
一起来将vscode变成私人定制笔记本
查看>>
Flutter 云音乐
查看>>
RecyclerView实现多type页面
查看>>
个人的web商城网站
查看>>
debian fcitx
查看>>
排中律与实无穷问题的性质分析
查看>>
08/23 学习总结
查看>>
关于Ubuntu下安装phpmyadmin后mysqli丢失的解决
查看>>
物理层
查看>>
linux多网卡路由设置
查看>>
win7环境下的栈溢出与实战
查看>>
查看ios字体库方法
查看>>
八大监听器
查看>>
self.navigationController退出到指定页面,或者一次性pop出n个页面
查看>>
Quartz实现数据库动态配置定时任务
查看>>
iptables 端口转发以及双向通信
查看>>
备战一线互联网公司Java工程师面试题 (1)
查看>>
ThinkPHP中自动验证失败
查看>>