Linux一句话命令技巧
说明:通过一句话快速理解bash/sed/awk等小工具的组合,能快速处理日常工作.
本文为转载,原文地址:
一、网站连接状态篇:
1.查看TCP连接状态
netstat -nat |awk ‘{print $6}’|sort|uniq -c|sort -rn
netstat -n | awk ‘/^tcp/ {++S[$NF]};END {for(a in S) print a, S[a]}’ 或
netstat -n | awk ‘/^tcp/ {++state[$NF]}; END {for(key in state) print key,”\t”,state[key]}’
netstat -n | awk ‘/^tcp/ {++arr[$NF]};END {for(k in arr) print k,”\t”,arr[k]}’
netstat -n |awk ‘/^tcp/ {print $NF}’|sort|uniq -c|sort -rn
netstat -ant | awk ‘{print $NF}’ | grep -v ‘[a-z]’ | sort | uniq -c
(以上每一行实现的效果基本相同,在此列出不同的写法,方便对脚本写法的更深理解)
2.查找请求数前20个IP(常用于查找***来源):
netstat -anlp|grep 80|grep tcp|awk ‘{print $5}’|awk -F: ‘{print $1}’|sort|uniq -c|sort -nr|head -n20
netstat -ant |awk ‘/:80/{split($5,ip,”:”);++A[ip[1]]}END{for(i in A) print A[i],i}’ |sort -rn|head –n20
3.用tcpdump嗅探80端口的访问看看谁最高
tcpdump -i eth0 -tnn dst port 80 -c 1000 | awk -F”.” ‘{print $1″.”$2″.”$3″.”$4}’ | sort | uniq -c | sort -nr |head –20
4.查找较多time_wait连接
netstat -n|grep TIME_WAIT|awk ‘{print $5}’|sort|uniq -c|sort -rn|head –n20
5.找查较多的SYN连接
netstat -an | grep SYN | awk ‘{print $5}’ | awk -F: ‘{print $1}’ | sort | uniq -c | sort -nr | more
6.根据端口列进程
netstat -ntlp | grep 80 | awk ‘{print $7}’ | cut -d/ -f1
7.查看有多少个PHP-CGI进程活动
netstat -anp | grep php-cgi | grep ^tcp | wc -l
8.查看PHP-CGI占用内存的总数:
total=0; for i in `ps -C php-cgi -o rss=`; do total=$(($total+$i)); done; echo “PHP-CGI Memory usage: $total kb”
二、网站日志分析篇
以apache access.log实例篇:
1.获得访问前10位的ip地址
cat access.log|awk ‘{print $1}’|sort|uniq -c|sort -nr|head -10
cat access.log|awk ‘{counts[$(11)]+=1}; END {for(url in counts) print counts[url], url}’
2.访问次数最多的文件或页面,取前20
cat access.log|awk ‘{print $11}’|sort|uniq -c|sort -nr|head -20
3.列出传输最大的几个exe文件(分析下载站的时候常用)
cat access.log |awk ‘($7~/\.exe/){print $10 ” ” $1 ” ” $4 ” ” $7}’|sort -nr|head -20
4.列出输出大于200000byte(约200kb)的exe文件以及对应文件发生次数
cat access.log |awk ‘($10 > 200000 && $7~/\.exe/){print $7}’|sort -n|uniq -c|sort -nr|head -100
5.如果日志最后一列记录的是页面文件传输时间,则有列出到客户端最耗时的页面
cat access.log |awk ‘($7~/\.php/){print $NF ” ” $1 ” ” $4 ” ” $7}’|sort -nr|head -100
6.列出最最耗时的页面(超过60秒的)的以及对应页面发生次数
cat access.log |awk ‘($NF > 60 && $7~/\.php/){print $7}’|sort -n|uniq -c|sort -nr|head -100
7.列出传输时间超过 30 秒的文件
cat access.log |awk ‘($NF > 30){print $7}’|sort -n|uniq -c|sort -nr|head -20
8.统计网站流量(G)
cat access.log |awk ‘{sum+=$10} END {print sum/1024/1024/1024}’
9.统计404的连接
awk ‘($9 ~/404/)’ access.log | awk ‘{print $9,$7}’ | sort
10. 统计http status
cat access.log |awk ‘{counts[$(9)]+=1}; END {for(code in counts) print code, counts[code]}’
cat access.log |awk ‘{print $9}’|sort|uniq -c|sort -rn
11.蜘蛛分析
查看是哪些蜘蛛在抓取内容。
/usr/sbin/tcpdump -i eth0 -l -s 0 -w – dst port 80 | strings | grep -i user-agent | grep -i -E ‘bot|crawler|slurp|spider’
以Squid access.log实例篇。
1.按域统计流量
zcat squid_access.log.tar.gz| awk ‘{print $10,$7}’ |awk ‘BEGIN{FS=”[ /]”}{trfc[$4]+=$1}END{for(domain in trfc){printf “%s\t%d\n”,domain,trfc[domain]}}’
效率更高的perl版本请到此下载:http://docs.linuxtone.org/soft/tools/tr.pl
2.CDN常用测试命令:
1)测试网站是否压缩:
curl -I http://xxxxxx -H Accept-Encoding:gzip,defalte
curl -I –compressed http://xxxxx
wget -S –header=”accept-encoding: gzip” http://xxxxx
2)测试某个源服务是否正常:
如:要测试http://xxxxx/kf.html 是否正常其对应的真实源服务ip(61.160.248.176).
curl –connect-timeout 5 -k -D- -o/dev/null -H “host: www.game5.com” http://xxxxxx/kf.html
curl –connect-timeout 5 -w -k -D- -o/dev/null -H “host: xianyu.game5.com” http://xxxxxx/upload/2010/08/12/shoujieqisucanglong.jpg
三、数据库篇
1.查看数据库执行的sql
/usr/sbin/tcpdump -i eth0 -s 0 -l -w – dst port 3306 | strings | egrep -i ‘SELECT|UPDATE|DELETE|INSERT|SET|COMMIT|ROLLBACK|CREATE|DROP|ALTER|CALL’
tcpdump_mysql.sh
<pre>#!/bin/bash
tcpdump -i eth0 -s 0 -l -w – dst port 3306 | strings | perl -e ‘
while(<>) { chomp; next if /^[^ ]+[ ]*$/;
if(/^(SELECT|UPDATE|DELETE|INSERT|SET|COMMIT|ROLLBACK|CREATE|DROP|ALTER|CALL)/i) {
if (defined $q) { print “$q\n”; }
$q=$_;
} else {
$_ =~ s/^[ \t]+//; $q.=” $_”;
}
}’</pre>
四.系统状态分析
1.查看网络流量
sar -n ‘DEV’ 1 10000000|awk ‘BEGIN{printf “DEVICE\tIN\t\tOUT\n”}”/eth0/ {printf $3″ “;printf $6*8/1024/1024″Mbps “;print $7*8/1024/1024″Mbps”}’
2.查看占用磁盘IO最多的进程。
wget -c http://linux.web.psi.ch/dist/scientific/5/gfa/all/dstat-0.6.7-1.rf.noarch.rpm
dstat -M topio -d -M topbio
3.iostat -x 1 10
如果 %util 接近 100%,说明产生的I/O请求太多,I/O系统已经满负荷,该磁盘可能存在瓶颈。
idle小于70% IO压力就较大了,一般读取速度有较多的wait.
svctm < await (因为同时等待的请求的等待时间被重复计算了), svctm的大小一般和磁盘性能有关:CPU/内存的负荷也会对其有影响,请求过多也会间接导致 svctm 的增加。 await: await的大小一般取决于服务时间(svctm) 以及 I/O 队列的长度和 I/O 请求的发出模式。 如果 svctm 比较接近 await,说明I/O 几乎没有等待时间; 如果 await 远大于 svctm,说明 I/O队列太长,应用得到的响应时间变慢, 如果响应时间超过了用户可以容许的范围,这时可以考虑更换更快的磁盘,调整内核 elevator算法,优化应用,或者升级 CPU。 队列长度(avgqu-sz)也可作为衡量系统 I/O 负荷的指标,但由于 avgqu-sz 是按照单位时间的平均值,所以不能反映瞬间的 I/O 洪水。 vmstat 1 5 r经常大于 3-4 ,且id经常少于50,表cpu的负荷很重。 pi,po 长期不等于0,表示内存不足。 disk 经常不等于0, 且在 b中的队列大于2-3, 表示 io性能不好。 Procs r: 运行的进程比较多,系统很繁忙 Io bo: 磁盘写的数据量稍大 Cpu us: 持续大于50-60,服务高峰期可以接受 Cpu wa: 稍微有些高 Cpu id:持续小于50,服务高峰期可以接受
4.分析CPU的几个命令: mpstat -P ALL sar -u -P ALL 2 5 sar -u 2 10 iostat -xtc 2
5.系统日志 # cat /var/log/rflogview/*errors 检查是否有异常错误记录 也可以搜寻一些异常关键字,例如: # grep -i error /var/log/messages # grep -i fail /var/log/messages # egrep -i ‘error|warn’ /var/log/messages 查看系统异常 核心日志 # dmesg 检查是否有异常错误记录
6.关于ARP 清除所有arp缓存 arp -n|awk ‘/^[1-9]/ {print “arp -d “$1}’|sh 绑定已知机器的arp地址 cat /proc/net/arp | awk ‘{print $1 ” ” $4}’ |sort -t. -n +3 -4 > /etc/ethers
五、硬件篇:
内存识别:
#内存大小
# dmidecode|grep -P -A5 “Memory\s+Device”|grep Size|grep -v Range
Size: 2048 MB
Size: No Module Installed
#最大内存容量
# dmidecode|grep -P ‘Maximum\s+Capacity’
Maximum Capacity: 4 GB
#内存频率
# dmidecode|grep -A16 “Memory Device”|grep Speed
Speed: 800 MHz (1.2 ns)
Speed: Unknown
CPU 识别:
①物理cpu个数:
# cat /proc/cpuinfo | grep “physical id” | sort | uniq | wc -l
②每个物理cpu中core的个数(即核数)
# cat /proc/cpuinfo | grep “cpu cores” | uniq
cpu cores : 4
③每个物理cpu中逻辑cpu(可能是core、threads或both)的个数
# cat /proc/cpuinfo | grep “siblings” | uniq
siblings : 8
查看CPU主频:
# cat /proc/cpuinfo |grep MHz|uniq
逻辑CPU,CPU型号
# cat /proc/cpuinfo | grep name | cut -f2 -d: | uniq -c
#当前CPU运行模式,32,64位
getconf LONG_BIT
# cat /proc/cpuinfo | grep flags | grep ‘ lm ‘ | wc -l
8
(结果大于0, 说明支持64bit计算. lm指long mode, 支持lm则是64bit)
五、技巧篇
1.查找并删除0字节文件:
find -type f -size 0 -exec rm -rf {} \;
2.查看进程
(按内存从大到小排序)
ps -e -o “%C : %p : %z : %a”|sort -k5 -nr|more
(按cpu利用率从大到小排列)
ps -e -o “%C : %p : %z : %a”|sort -nr|more
3.打印Cache里的URL
grep -r -a jpg /data/cache/* | strings | grep “http:” | awk -F’http:’ ‘{print “http:”$2;}’
4.sed替换
sed -i ‘/Root/s/no/yes/’ /etc/ssh/sshd_config sed在这个文里Root的一行,匹配Root一行,将no替换成yes.
5.如何杀掉进程
ps aux|grep 进程名|grep -v grep|awk ‘{print $2}’|xargs kill -9
killall -9 nginx
6.NGINX操作常用命令:
检查语法:
/usr/local/nginx/sbin/nginx -t
杀掉进程重启:
killall -HUP nginx (重栽配置文件)
7.显示运行3级别开启的服务
ls /etc/rc3.d/S* |cut -c 15-
8.如何在编写SHELL显示多个信息,用EOF
cat << EOF +————————————————————–+ | === Welcome to Tunoff services === | +————————————————————–+ EOF 9.利用for循环快速给mysql建立链接连接: cd /usr/local/mysql/bin for i in * do ln /usr/local/mysql/bin/$i /usr/bin/$i done 10.取IP地址(可以了解,sed,awk,cut截取字符方面的应用) ifconfig eth0|sed -n ‘2p’|awk ‘{print $2}’|cut -c 6-30 ifconfig eth0 |grep “inet addr:” |awk ‘{print $2}’|cut -c 6- ifconfig eth0 | grep ‘inet addr:’| grep -v ‘127.0.0.1’ | cut -d: -f2 | awk ‘{ print $1}’ ifconfig eth0 | sed -n ‘/inet /{s/.*addr://;s/ .*//;p}’ ifconfig eth0 | grep “inet addr:”|awk ‘{print substr($2,6,30)}’ ifconfig | grep -Eo \([0-9]\{1,3\}[\.]\)\{3\}[0-9] |sed -n ‘1p’ perl正则实现获取IP地址的方法: ifconfig -a | perl -ne ‘if ( m/^\s*inet (?:addr:)?([\d.]+).*?cast/ ) { print qq($1\n); exit 0; }’ 11.统计一下服务器下面所有的jpg的文件的大小。 find / -name “*.jpg” -exec wc -c {} \;|awk ‘{print $1}’|awk ‘{a+=$1}END{print a}’ 统计目录下文件的大小: du $1 –max-depth=1 | sort -n|awk ‘{printf “%7.2fM —-> %s\n”,$1/1024,$2}’|sed ‘s:/.*/\([^/]\{1,\}\)$:\1:g’
统计一个目录中的目录个数
ls -l | awk ‘/^d/’ | wc -l
统计一个目录中的文件个数
ls -l | awk ‘/^-/’ | wc -l
统计一个目录中的全部文件数
find ./ -type f -print | wc -l
统计一个目录中的全部子目录数
find ./ -type d -print | wc -l
列出当前文件夹目录的大小:
du -b –max-depth 1 | sort -nr | perl -pe ‘s{([0-9]+)}{sprintf”%.1f%s”, $1>=2**30? ($1/2**30, “G”): $1>=2**20? ($1/2**20, “M”):$1>=2**10? ($1/2**10, “K”): ($1, “”)}e’
shaw答案 :du -hs $(du -sk ./`ls -F |grep /` |sort -nr |awk ‘{print $NF}’)
也可 以实现,不过不是特别完美。但好记。
12.sed查找并替换内容:
sed -i “s/varnish/LTCache/g” `grep “Via” -rl /usr/local/src/varnish-2.0.4`
sed -i “s/X-Varnish/X-LTCache/g” `grep “X-Varnish” -rl /usr/local/src/varnish-2.0.4`
13. 去掉第一列的行代号。
awk ‘{for(i=2;i<=NF;i++) if(i!=NF){printf $i” “}else{print $i} }’ list
14.消除vim中的^M的几种方法
1)dos2uninx filename
2)sed -e ‘s/^M//’ filename
3)vim中 :s/^M//gc
4)col -bx < dosfile > newfile
5)tr -s “\r\n” “\n” < file > newfile
15.在当前目录及子目录下搜索所有后缀为 .php 的文件,并且将 字符串 baidu.com 替换成 linuxtone.org
find -name *.php |xargs perl -pi -e ‘s|baidu.com|linuxtone.org|g';
sed -i “s/baidu.com/opendoc.com.cn/g” `grep baidu.com -rl ./`
16. 统计文件中词语出现的频次:
awk ‘{arr[$1]+=1 } END{for(i in arr){print arr[i]}}’ 文件名 | sort –rn