shell三剑客grep sed awk ======================== awk、grep、sed是linux操作文件的三大利器,合称文本三剑客。grep适合单纯的文件查找或者匹配文本,sed更适合编辑匹配到的文本,awk适合格式化文本,对文本进行复杂的格式处理 grep ---- grep用于过滤搜索特定字符,可使用正则表达式配合使用.搜索成功返回0,不成功返回1,文件不存在则返回2 命令格式 :: grep [option] pattern file 命令参数如下 - -A<显示行数>: 除了显示符合匹配样式的那一行之外,并显示该行之后的内容 - -B<显示行数>: 除了显示符合匹配样式的那一行之外,并显示该行之前的内容 - -C<显示行数>: 除了显示符合匹配样式的那一行之外,并显示该行前后的内容 - -c: 统计匹配的行数 - -e: 实现多个选项间的逻辑or关系 - -E: 扩展的正则表达式 - -f FILE: 从file获取pattern匹配 - -F: 相当于fgrep - -i --igonre-case : 忽略大小写的区别 - -n: 显示匹配的行号 - -o: 仅显示匹配到的字符串 - -q: 静默模式,不输出任何信息 - -s: 不显示错误信息 - -v: 显示不被pattern匹配到的行 - -w: 匹配整个单词 sed ---- sed是一种流编辑器,它一次处理一行内容,处理时把当前处理的行存储在临时缓冲区中,称为"模式空间",接着用sed命令处理缓冲区中的内容,处理完成后,把缓冲区中的内容送往屏幕, 然后读入下一行,执行下一个循环。文件内容并没有改变,除非你使用重定向存储输出或者-i sed命令解释 ^^^^^^^^^^^ 命令格式 :: se [options] '[地址定界] command' file(s) **常用选项options** - -n:不输出模式空间内容到屏幕,即不自动打印,只打印匹配到的行 - -e:多点编辑,对每行处理时,可以有多个script - -f:把script写到文件当中,在执行sed时-f指定文件路径,如果是多个script,换行写 - -r:支持扩展的正则表达式 - -i:直接将处理结果写入文件 - i.bak:在将处理的结果写入文件之前备份一份 **地址定界** - 不给地址:对全文进行处理 - 单地址: 1. #:指定的行 #. /pattern/:被此模式能够匹配到的每一行 - 地址范围: 1. #,# #. #,+# #. /pat1/,/pat2/ #. ,/pat1/ - ~:步进 1. sed -n '1~2p' #只打印奇数行(1~2从第一行,一次加2行) 2. sed -n '2~2p' #只打印偶数行 **编辑命令commmand** - d:删除模式空间匹配的行,并立即启用下一轮循环 - p:打印当前模式空间内容,追加到默认输出之后 - a:在指定行后面追加文本,支持使用\n实现多行追加 - i:在前面插入文件,支持使用\n实现多行追加 - c:替换行为单行或者多行文本,支持使用\n实现多行追加 - w:保存模式匹配到的行到指定文件 - r:读取指定文件的文本到模式空间中匹配到的行后 - =:为模式空间中的行打印行号 - !:为模式空间中匹配行取反处理 - s///:查找替换,支持使用其他分隔符,如s@@@,s### sed用法演示 ^^^^^^^^^^^ **常用选项options演示** :: cat demo aaa bbb AABBCCDD sed "/aaa/p" demo #匹配到的行会打印一遍,没有匹配到的行也会打印 aaa aaa bbb AABBCCDD sed -n "/aaa/p" demo #-n不显示没匹配的行 aaa sed -e "s/a/A/" -e "s/b/B/" demo #-e多点编辑 Aaa Bbb AABBCCDD cat sedscript.txt s/A/a/g sed -f sedscript.txt demo aaa bbb aaBBCCDD **地址界定演示** :: sed -n "p" demo #不指定行,打印全文 aaa bbb AABBCCDD sed "2s/b/B/g" demo #替换第2行的b->B aaa BBB AABBCCDD sed -n "1,2p" demo #打印1-2行 aaa bbb sed -n "/aaa/,/DD/p" demo aaa bbb AABBCCDD sed -n "2,/DD/p" demo bbb AABBCCDD sed "1~2s/[aA]/E/g" demo #将奇数行的a或A替换为E EEE bbb EEBBCCDD **编辑命令command演示** :: sed "2d" demo #删除第2行 aaa AABBCCDD sed -n "2p" demo #打印第二行 sed "2a123" demo #在第二行后面加123 aaa bbb 123 AABBCCDD sed "1i123" demo #在第一行前面加123 sed "3c123\n456" #替换第三行的内容 aaa bbb 123 456 sed -n "3w/root/demo3" demo #保存第三行的内容到demo3文件中 sed "1r/root/demo3" demo #读取demo3的内容到第1行后 sed -n "=" demo #打印行号 1 2 3 sed -n "2!p" #打印除了第2行的内容 sed 's@[a-z]@\u&@g' demo #将全文的小写字母替换为大写字母 sed高级编辑命令 ^^^^^^^^^^^^^^^ - 格式 - h:把模式空间中的内容覆盖至保持空间中 - H:把模式空间中的内容追加至保持空间中 - g:从保持空间取出数据覆盖至模式空间中 - G:从保持空间取出数据追加至模式空间中 - x:把模式空间中的内容与保持空间中的内容进行互换 - n:读取匹配到的行的下一行覆盖至模式空间 - N:读取匹配到的行的下一行追加至模式空间 - d:删除模式空间中的行 - D:当前模式空间开端至\n的内容(不再传至标准输出),放弃之后的命令,但是对剩余模式空间重新执行sed **案例** :: cat num.txt One Two Three sed '1!G;h;$!d' num Three Two One 示意图如下所示: .. image:: res/sed.png .. note:: 保持空间是模式空间一个临时存放数据的缓冲区,协助模式空间进行数据处理 **演示** :: seq 99 | sed -n "n;p" #打印偶数行 2 4 6 8 seq 9 | sed "1!G;h;$!d" #倒序显示 seq 9 | sed 'H;n;d' #显示奇数行 seq 9 | sed "N:D" #显示最后一行 seq 9 | sed "G" #每行之间加空行 seq 9 | sed "g" #把每行内容替换为空行 awk ---- awk是一种编程语言,用于在linux/unix下对文本和数据进行处理,数据可以来自标准输入(stdin)、一个或者多个文件或其他命令的输出。它支持用户自定义函数和动态正则表达式等先进功能, 可以在命令行使用也可以作为脚本使用 语法 :: awk [options] 'program' var=value file... awk [options] -f programfile var=value file... awk [options] 'BEGIN{ action;... } pattern{ action;... } END{ actions;.. }' file... **常用命令选项** - -F fs:fs指定输入分隔符,fs可以是字符串或正则表达式 - -v var=value:赋值一个用户定义变量,将外部变量传递给awk - -f scriptfile:从脚本文件中读取awk命令 awk变量 ^^^^^^^ 变量:内置变量和自定义变量,每个变量前加-v命令选项 内置变量 """""""" 1) 格式 - FS:输入字段分隔符,默认为空白字符 - OFS:输出字段分隔符,默认为空白字符 - RS:输入记录分隔符,指定输入时的换行符,原换行符仍有效 - ORS:输出记录分隔符,输出时用指定符号代替换行符 - NF:字段数量,共有多少字段,$NF引用最后一列 - NR:行号,后可跟多个文件,第二个文件行号继续从第一个文件最后行号开始 - FNR:各文件分别计数,行号 - FILENAME:当前文件名 - ARGC:命令行参数个数 - ARGV:数组,保存的是命令行所给定的各参数,查看参数 演示 :: cat awkdemo hello:world linux:redhat:lalala:hahaha along:love:youou awk -v FS=':' '{print $1,$2}' awkdemo #FS指定输入分隔符 awk -v FS=':' OFS="----" '{print $1,$2}' awkdemo #OFS指定输出分隔符 awk -v RS=':' '{print $1,$2}' awkdemo awk -F: '{print NF}' awkdemo awk -F: '{print $(NF-1)' awkdemo #显示倒数第2列 awk END'{print NR} awkdemo #统计行号 自定义变量 """""""""" 自定义变量区分大小写 :: -v var=value awk v name="ywg" -F: 'print name":"$0' awkdemo pintf命令 ^^^^^^^^^ 格式: :: pritnf "FORMAT", item1,item2,... 1) 必须指定FORMAT 2) 不会自动换行,需要显示给出换行控制符,\n 3) FORMAT中需要分别为后面每个item指定格式符 格式符:与item一一对应 - %c:显示字符的ADCII码 - %d,%i:显示十进制整数 - %e,%E:显示科学计数法数值 - %f:显示为浮点数,小数, %5.1f带整数、小数,整数5位小数1位 - %g,%G:以科学计数法或浮点形式显示数值 - %s:显示字符串 - %u:无符号整数 - %%:显示%自身 :: awk -F: '{printf "%20s----%u\n",$1,$3}' /etc/passwd awk -F: '{printf "%-20s----%-u\n",$1,$3}' /etc/passwd #使用-进行左对齐 操作符 ^^^^^^ 格式 - 算数操作符 1. x+y,x-y,x*y,x/y,x^y,x%y #. -x:转换为负数 #. +x:转换为数值 - 字符串操作符:没有符号的操作符,字符串连接 - 赋值操作符: 1. =,+=,-=,*=,/=,%=,^= #. ++,-- - 比较操作符 ==,!=,>,>=,<= - 模式匹配符:~:左边和右边是否匹配包含 !~:是否不匹配 - 逻辑操作符:&& || ! - 函数调用:function_name(argu1,argu2,...) 演示 模式匹配 :: df -h | awk -F: '$0 ~ /^\/dev/' #查询以/dev开头的磁盘信息 df -h | awk '$0 ~ /^\/dev/{print $(NF-1)"----"$1}' #只显示磁盘情况和磁盘名 df -h | awk '/^\/dev/{print $(NF-1)"---"$1}' | awk -F% '$1 > 40' 逻辑操作符 :: awk -F: '$3>0 && $3<=1000 {print $1,$3}' /etc/passwd awk -F: '!($0 ~ /bash$/) {print $1,$3}' /etc/passwd awk pattern匹配部分 ^^^^^^^^^^^^^^^^^^^ 根据pattern条件,过滤匹配的行,再做处理 1. 如果未指定:空模式,匹配每一行 #. /regular expression/: 仅处理能够模式匹配到的行,正则,需要用//括起来 #. relational expression: 关系表达式,结果为真才会被处理 真:结果为非0值,非空字符串 假:结果为空字符串或0值 #. line ranges:行范围 startline(起始行),endline(结束行):/part1/,/part2/ 不支持直接给出数字,可以有多段,中间可以有间隔 #. BEGIN/END 模式 BEGIN{}: 仅在开始处理文件中的文本之前执行一次 END{}: 仅在文本处理完成之后执行 演示 :: awk -F: '/^h/,/^a/{print $1}' awkdemo.txt awk -F: 'BEGIN{print "第一列"}{print $1} END{print "结束"}' awkdemo.txt awk高阶用法 ^^^^^^^^^^^ **控制语句之if else判断** :: if(condition){statement;...}[else statement] #双分支 if(condition1){statement1;...}else if(condition2)else{statement3} #多分支 使用场景:对awk取得的整行或某个字段做条件判断 :: awk -F: '{if($3>10 && $3<1000)print $1,$3}' /etc/passwd awk -F: '{if($NF=="/bin/bash") print $1,$NF}' /etc/passwd awk -F: '{if($3>==1000) {printf "commmon user: %s\n",$1} else{printf "root or sysuser: %s\n",$1}}' /etc/passwd **控制语句之while循环** :: while(condition){statement;...} 注:条件为真,进入循环;条件为假,退出循环 :: awk -F: '/^along/{i=1;while(i<=NF){print $i,length($i);i++}}' awkdemo.txt **控制语句之do while循环** :: do {statement;..}while(condition) 注:无论真假,至少会执行一次 :: awk 'BEGIN{sum=0;i=1;do{sum+=i;i++}while(i<1000);print sum}' **控制语句之for循环** :: for(expr1;expr2;expr3) {statement;...} 特殊用法:遍历数组中的元素 :: for(var in array) {for-body} :: awk -F: '{for(i=1;i<=NF;i++) {print $i,length($i)}}' awkdemo.txt 字符串处理 ^^^^^^^^^^^ rand()返回0到1之间一个随机数,需要一个种子srand(),没有种子,一直输出0.237788 :: awk 'BEGIN{srand(); print rand()}' awk 'BEGIN{srand()} {printf int(rand()*100%50)}' #取0-50的随机数 字符串处理: - length([s]):返回指定字符串的长度 - sub(r,s,[t]):对t字符串进行搜索r表示的模式匹配的内容,并将第一个匹配的内容替换为s - gsub(r,s,[t]):对t字符串进行搜索r表示的模式匹配的内容,并将全部匹配的内容替换为s - split(s,array,[r]):以r为分割符切割字符串s并将切割后的结果保存至array所表示的数组中,第一个索引值为1第二个为2 :: echo "2008:08:08 08:08:08" | awk 'sub(/:/,"-",$1)' echo "2008:08:08 08:08:08" | awk 'gsub(/:/,"-",$1)' echo "2008:08:08 08:08:08" | awk '{split($0,i,":")}END{for(n in i){print n,i[n]}}' awk自定义函数 ^^^^^^^^^^^^^ 格式:和bash区别:定义函数中需要加参数,return 返回值不是$?,是相当于echo输出 :: function name (parm1, parm2, ...) { statements return expression } :: cat fun.awk function max(v1,v2) { v1>v2?var=v1:var=v2 return var } BEGIN{a=3;b=2;printf max(a,b)} awk -f fun.awk awk可以借助system调用shell命令 :: awk BEGIN'{system("hostname")}' awk程序也可以写成脚本,直接调用或执行 :: cat f1.awk #!/bin/awk -f {if($3 >= 1000)print $1,$3} chmod +x f1.awk ./f1.awk -F: /etc/passwd 向awk脚本传递参数 :: awkfile var=value var2=value2 ... inputfile .. note:: 在BEGIN过程中不可用,直到首行输入完成以后变量才可使用,可以通过-v参数让awk在BEGIN之前得到变量的值,命令行中每指定一个变量都需要一个-v