linux正则表明式,linux运营正则表明式技能分享

第1章 正则表明式

Day16,

linux运转正则表明式实战录制来看地址

QQ交流群 384467551

12.26&12.27

1.1 正则表明式

追寻文本内容,快捷过滤

第1章 扩大正则表明式

linux运转正则表明式实战

正则表明式

1.2 正则表明式分类

1.1   前叁个字符一连现身了1次或1次以上

egrep  "0 " oldboy.txt  1次或1次以上 >=1

egrep  "0*" oldboy.txt  0次或0次以上 >=0

1.怎么样是正则表明式?
简短的说,正则表明式便是生龙活虎套处理大批量的字符串而定义的平整和格局。
例如:假设 @代表12345 
经过正则表明式这几个特殊符号,我们能够非常的慢的过滤、替换须要的内容。
linux正则常常以行为单位拍卖的。

第1章 使grep/egrep 过滤出的事物加上颜色

cat >>/etc/profile<<EOF

alias grep='grep --color=auto'

alias egrep='egrep --color=auto'

EOF

 

source /etc/profile

alias grep egrep

1.2.1 幼功正则

^    以…...开头的行 ^m

$    以…...结尾的行 m$

^$   空行(什么符号都没有)

.     任意一个字符,不会匹配空行

     (撬棍)转义字符

*     前一个字符连续出现0次或0次以上

.*     所有字符,包括空行

[]     相当于一个符号,每次匹配1个字符

[abc]  找出包含a或b或c

[^]    排除,排除[]里的每一个字符

[^abc] 找出除了a或除了b或除了c外

 

 

1.1.1 找到文本中的0

[[email protected] ~]# egrep  "0 " oldboy.txt

my qq num is 49000448.

not 4900000448.

[[email protected] ~]# egrep -o  "0 " oldboy.txt

000

00000

 

2.为何要学习正则表达式?
再专业中,大家做linux运营专门的学业,时刻直面着一大波的日记,程序,命令的出口。
热切的急需过滤大家要求的意气风发有的情节,甚至是叁个字符串。

第2章 正则表明式分类

1.2.2 扩张正则

      前一个字符连续出现1次或1次以上

|      或者

()     表示一个整体   sed反向引用/后向引用

{}       0{n,m} 数字0连续出现了至少n次,最多m次

?      前一个字符连续出现0次或1次   前一个字符有或没有

 

1.1.2 收取文件中的大写字母

[[email protected] ~]# grep -o "[A-Z]" oldboy.txt

I

I

I

O

L

D

B

O

Y

3.接头四个误区注意事项:
a.正则表明式的接受非常司空眼惯,存在于种种语言中,PE帕杰罗L,PHP,JAVA等。
咱俩明天给我们讲授的正是linux的正则表明式,系统运转专门的学问中常用的正则表明式
常用的正则表明式的吩咐为grep(egrep),sed,awk。
linux的三杀手很牛,要想三剑客玩得更加好,那就必然离不开正表达式。

2.1 功底正则表明式:basic    regular expression  BRE

    ^  $  .  *  []  [^]   

    

1.3 功底正则与扩充正则的分别

1.1.3 收取一而重现身的大写字母

[[email protected] ~]# egrep -o "[A-Z] " oldboy.txt

I

I

I

OLDBOY

b.linux正则表达式和大家命令行中任何的下令使用的通配符是有本质区别的。

2.2 增添正则表达式:extended regular expression  ERE

    |     ()  {}  ?

 

1.3.1 符号分化

基础正则: ^   $   ^$   .    .*    []    [^]

扩展正则:     |   ()   {}   ?

 

1.1.4 彰显全数的单词

[[email protected] ~]# egrep -o "[A-Za-z] " oldboy.txt

I

am

oldboy

teacher

4.实验的3个注意事项:
a.linux正则平日以行为单位管理的。
b.alias grep='grep --color=auto'
c.注意字符集,LC_ALL=C,不是必得

2.3 正则与通配符分裂:

          功效                    协助的下令

通配符:   查找文件名              Linux大多数发令都援救  以.txt结尾的文件       

 

正则:     在文书中过滤内容        sed,grep,awk  Python Java

 

1.3.2 协助的通令分裂

基础正则:grep  sed  awk

扩展正则:egrep(grep  -E)    sed –r      awk

 

1.2  | 或者

表示找个中的四个或然是其余贰个。

[[email protected] ~]# egrep "oldboy|oldbey" oldboy.txt  -o

oldboy

oldboy

oldbey

找/etc/services 中的三个端口

[[email protected] ~]# egrep "3306|1521" /etc/services

mysql           3306/tcp                        # MySQL

mysql           3306/udp                        # MySQL

ncube-lm        1521/tcp                # nCube License Manager

ncube-lm        1521/udp                # nCube License Manager

       找在那之中的A只怕B或然C。

[[email protected] ~]# egrep "A|B|C" oldboy.txt

my god ,i am not oldbey,but OLDBOY!

       找到12要么56替换到空。

[[email protected] ~]# echo 123456|sed -r 's#12|56##g'

34

5.linux正则表明式细节
基于grep来讲的。
基础正则表明式:BRE(basic regular expression卡塔尔
1卡塔尔国^word 代表搜索以word最早的内容。
2)word$ 表示寻觅以word结尾的内容。
3)^$    表示空行,不是空格。
4卡塔尔(英语:State of Qatar).      代表且只可以表示专擅叁个字符。(当前目录,加载文件)
5)      转义字符,让抱有出奇地位意义的字符,脱掉马甲,还原原型。
          例如:.只表示小数点,还原原始小数点的含义。
6)*      重复0个或多少个前面包车型客车四个字符。不意味全体了。
7).*     相配全数的字符。^.* 任意三个字符起始。
8)[abc]  相称字符集结内任意二个字符[a-z]
9)[^abc] ^再中括号里面表示非,不含有a或b或c。
10){n,m} 重复n到m次,前多个字符。
    {n,} 起码N次,多了不限。
    {n}  N次
    {,m} 至多m次,少了不限。
   注意:grep 要对{转义} {},egrep(grep -E)无需转义
根底的正则就讲罢了。
6.grep限令参数小结
-v 覆灭相配的剧情
-E 扶持扩张的正则表明式
-i 忽视大小写
-o 只输出相称的原委
--color=auto 相称的剧情突显颜色。
-n 再行首突显行号

2.4 利用正则表达式注意事项

  1.正则表达式根据行为单位拍卖

  2.正则神坑-中文符号

   ‘’ “” () 。 * …… ¥ | {}  【】

    ''   ""   ()  .  *  ^    $ | {}   []

3.区分抑扬顿挫写

 

环境 

cat oldboy.txt

I am oldboy teacher!

I teach linux.

 

I like badminton ball ,billiard ball and chinese chess!

my blog is

our size is

my qq is 49000448

 

not 4900000448.

my god ,i am not oldbey,but OLDBOY!

1.4 ^ 以....开始的行 ^m

 

[root@zeq /oldboy]# grep '^m'  oldboy.txt

my blog is http://oldboy.blog.51cto.com

my qq is 49000448

my god ,i am not oldbey,but OLDBOY!

 

1.3 (卡塔尔(英语:State of Qatar) 小括号 反向援引

小括号内部的剧情是多少个完完全全,也就是是两个字符 

7.取IP地址演练正则:

第3章 底工正则(BRE)

1.5 $ 以….结尾的行  $

 

cat -A 显示文件中所有符号  每行结尾都会有个$

[root@zeq /oldboy]# grep  ' $'  oldboy.txt

my blog is http://oldboy.blog.51cto.com

our size is http://blog.oldboyedu.com

 

1.3.1 表示三个总体

[[email protected] ~]# egrep "oldb(o|e)y" oldboy.txt

I am oldboy teacher!

my blog is

my god ,i am not oldbey,but OLDBOY!

sed基本语法:
s替换
g全局
-i 改革文件
-n 撤消默许输出
 p 打字与印刷内容
-r 帮助扩展正则

3.0.1 ^   以……初始的行

      grep  ‘^m’ /oldboy.txt         以m早先的行

1.6 . 大肆四个字符,不会协作空行

[root@zeq /oldboy]# grep  '.' oldboy.txt

grep –o                                          grep命令执行过程

[root@oldboyedu50-lnb /oldboy]# grep -o '.' oldboy.txt

 

1.3.2 反向援引

       sed -r 使用扩充正则

[[email protected] ~]# echo 123456|sed -r 's#..(..)..#1#g'

34

       点表示任性四个字符,2代表第二个括号。

[[email protected] ~]# echo 123456|sed -r 's#(.).(..).(.)#2#g'

34

考题:
ifconfig eth0:
         inet addr:10.0.0.7  Bcast:10.0.0.255  Mask:255.255.255.0
目标:10.0.0.7
过滤观念:
目的在此之前的情节“         inet addr:” 就用 ^.*addr:
对象结尾的剧情"  Bcast:10.0.0.255  Mask:255.255.255.0"   就用Bc.*$
指令实战:
非常间接sed取行*:
[root@oldboylinux oldboy]# ifconfig eth0|sed -n '2s#^.*addr:##gp'|sed 's#  Bc.*$##g'
10.0.0.7
[root@oldboylinux oldboy]# ifconfig eth0|sed -n '2s#^.*addr:(.*)  Bc.*$#1#gp'
10.0.0.7
[root@B ~]# ifconfig eth0|sed -rn '2s#^.*addr:(.*)  Bc.*$#1#gp'
10.0.0.8
[root@oldboylinux oldboy]# ifconfig eth0|sed -n '2s#^.*addr:([0-9]{,3}.[0-9]{,3}.[0-9]{,3}.[0-9]{,3})  Bc.*$#1#gp'
10.0.0.7

3.0.2 $   以……结尾的行         

grep  ‘m$’ /oldboy.txt

1.7 前二个字符一连现身1次或1次以上

[root@zeq /oldboy]# egrep '0 ' oldboy.txt

my qq is 49000448

not 4900000448.

 

1.4 {} 大括号(花括号)

0{n,m} 数字0一连现身了起码n次,最多m次

[[email protected] ~]# egrep "[a-z]{3,6}" oldboy.txt

I am oldboy teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is
our site is
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but OLDBOY!

 

[[email protected] ~]# egrep "[a-zA-Z]{3,6}" oldboy.txt

I am oldboy teacher!
I teach linux.
I like badminton ball ,billiard ball and chinese chess!
my blog is
our site is
my qq num is 49000448.
not 4900000448.
my god ,i am not oldbey,but OLDBOY!
[[email protected] ~]#

考题:
请用ifconfig,输出ip及广播地址
sed  -n 's#(dddd)(ffff)#12#gp' 相像适合grep。
命令:
[root@B ~]# ifconfig eth0|sed -nr 's#^.*dr:(.*) [a-zA-Z].*t:(.*)  Ma.*$#12#gp'   
10.0.0.8 10.0.0.255

神坑:::::有的行结尾不时候会多少个空格

   cat   -A   展现出文件中的特殊标志    行尾   $标识

 

1.8 | 或者

[root@zeq /oldboy]# egrep 'oldboy|linux'   oldboy.txt

I am oldboy teacher!

I teach linux.

my blog is http://oldboy.blog.51cto.com

our size is http://blog.oldboyedu.com

 

1.4.1 大括号的比不上措施

 0{3,6}   >=3 <=6

 0{3}     ==3

 0{3,}    >=3

 0{,6}    >=0 <=6

触类旁通的正则表达式:grep -E 以致egrep
最终有时机再享受呢!
下边是后补的,讲座没时间讲了。
8.恢弘的正则表达式:ERE
1卡塔尔(قطر‎ 重复多少个或叁个以上前边的字符。
2卡塔尔(英语:State of Qatar)? 重复0个或三个0前方的字符。
3卡塔尔国|用或的方法查找七个契合的字符串
4)() 找出 “用户组”字符串。
别的贰个打听的知识:posix方括号字符集(挺鸡肋的精晓就得)
       [:alnum:]             [:lower:]          [:xdigit:]
       [:alpha:]             [:print:]            [:blank:]
       [:blank:]             [:punct:]
       [:cntrl:]             [:space:]
       [:graph:]             [::upper:]
5)man bash
   man grep

3.0.3 ^$  空行  什么都并未有(富含空格也远非)

grep -v '^$' oldboy.txt    消弭文件中的空行

grep  -n   显示行号  

1.9 - (卡塔尔国 表示多个完好  反向引用/后向援引

1.5  ?

前贰个字符一连出现了 0次或1次

3.0.4  .  任意三个字符     不会合作空行

grep  ‘.’ oldboy.txt    

grep  -o      呈现命令实践进程,展现grep命令每一遍找到了怎么

 图片 1  空格也实行二次命令

 

1.9.1 表示二个完完全全

[root@zeq /oldboy]# egrep 'oldb(o|e)y'  oldboy.txt

I am oldboy teacher!

my blog is http://oldboy.blog.51cto.com

our size is http://blog.oldboyedu.com

my god ,i am not oldbey,but OLDBOY!

 

1.5.1 环境

[[email protected] ~]# cat a.log

good

gd

god

goood

3.0.5 * 前叁个字符一而再接二连三现身了0次或0次以上

grep ‘0*’  oldboy.txt

图片 2 

坑:过滤的对象现身了0次的时候,会来得整个文件的开始和结果

 

1.9.2 反向援引/后向引用

[root@oldboyedu50-lnb /oldboy]# echo 123456|sed -r 's#(.*)#<1>#g'

<123456>                                                    1 表示第一个括号

 

1.5.2 o延续现身0次或1次

[[email protected] ~]# egrep "gd|god" a.log

gd
god

[[email protected] ~]# egrep "go?d" a.log

gd
god

3.0.6 .*    全数 任何标识  包括空行

贪婪性    (  .  *  .*    ?  )  

1. .*具有符号 任何标识 接二连三现身的字符  有些许匹配多少

2. 正则表明 全体符号 或 接二连三现身 博览会现出贪婪性

3. 相称到结尾叁个相符的标准化---------(贪婪性)  

图片 3 

找寻以m领头并以m结尾的行     ---- 並且

[root@oldboy oldboy]# grep '^m.*m$' oldboy.txt

my blog is

 

 

1.10 {} 0{n,m} 数字0一而再出现了足足n次,最多m次

[root@oldboyedu50-lnb /oldboy]# egrep '0{3,4}' oldboy.txt

my qq is 49000448

not 4900000448.



[root@oldboyedu50-lnb /oldboy]# cat id.txt

金 211324198705244720

万 500224197105168312

任 1231231231oldboy

任 3oldboy

任 lidao97303136098

任 alex2197303136098

任 350182197303oldgir

吕 211282199209113038

孔 150000198309176071

邹 371001197412221284

贺 130185200011215926

杜 362522198711278101

向 14052219961008852X





[root@oldboyedu50-lnb /oldboy]# egrep '[0-9X]{18}' id.txt

金 211324198705244720

万 500224197105168312

吕 211282199209113038

孔 150000198309176071

邹 371001197412221284

贺 130185200011215926

杜 362522198711278101

   XXXXXXXXXXXXXXXXXX

向 14052219961008852X



[root@oldboyedu50-lnb /oldboy]# egrep '[0-9]{17}[0-9X]' id.txt

金 211324198705244720

万 500224197105168312

吕 211282199209113038

孔 150000198309176071

邹 371001197412221284

贺 130185200011215926

杜 362522198711278101

向 14052219961008852X

 

1.6 正则表明式分类

3.0.7   撬棍   转义字符   脱掉马甲打回原形

搜索文件中以.结尾的行

[root@oldboy log]# grep '.$' /oldboy/oldboy.txt

I teach linux.

not 4900000448.

tr命令       1.不能够平素更改文件内容

                2.大器晚成对风华正茂替换

   特点         3.不能够直接读取文件内容 接 <

n    =====回车

例:把公文中的空格替换为回车    

[root@oldboy oldboy]# tr 'n' ' ' oldboy.txt       回车替换为空格

tr: extra operand `oldboy.txt'             tr不能够平素读取文件    

Try `tr --help' for more information.      必须加<输入重定向符号

[root@oldboy oldboy]# tr 'n' ' ' <oldboy.txt 

I am oldboy teacher! I teach linux.  I like badminton ball ,billiard ball and chinese chess! my blog is our size is my qq is 49000448  not 4900000448. my god ,i am not oldbey,but OLDBOY!

报错:tr命令不可能直接读取文件   必需加<      不能更改文件内容

替换:把123替换为abc                sed 阉割版

[root@oldboy oldboy]# echo 123123|tr '123' 'abc'

abcabc

意气风发对生机勃勃交流

[root@oldboy oldboy]# echo 12332|tr '123' 'abc'

abccb

第2章 取出eth0网卡的ip地址

1.6.1 根底正则

^       以……开头

$       以……结尾

^$     空行

.*      所有

[abc]   表示abc

[a-z]   表示a到z

[A-Z]   表示A-Z

[^abc]  代表免除abc

3.0.8 [ ]    [abc] 寻觅含有a或b或c的行   []字符内未有特别意义

                                单个字符分割,以”或”连接

寻找以小写字母初叶并以.或!结尾的行

[root@oldboy oldboy]# grep '^[a-z].*[.!]$' oldboy.txt

not 4900000448.

my god ,i am not oldbey,but OLDBOY!

 

2.1 方法1

[root@zeq /oldboy]# ip a s eth0 |awk 'NR==3'|awk  -F"[ /] "  '{print $3}'

10.0.0.200

[root@oldboyedu50-lnb /oldboy]#

 

1.6.2 扩充正则表明式

     一连现身 1次或1次以上

|       或者

(卡塔尔(قطر‎      小括号内部的内容是二个总体,也就是是几个字符

{}      0{n,m} 数字0延续现身了最少n次,最多m次

?       前多个字符三番五次现身了 0次或1次

 

3.0.9 [^]   解除,也等于是三个标记(每便相配二个字符)  消除a或b或c   

搜索文件中不是以m或n初阶的行

[root@oldboy oldboy]# grep '^[^mn]' oldboy.txt

I am oldboy teacher!

I teach linux.

I like badminton ball ,billiard ball and chinese chess!

our size is

 grep/egrep ‘[a-Z]’

2.2 收取ifconfig eth0 ip地址和子网掩码

[root@zeq /oldboy]# ifconfig eth0 |awk 'NR==2' |awk -F"[ :] "  '{print $4,$NF}'

10.0.0.200 255.255.255.0

 

第2章 取出eth0网卡的ip地址

第4章 增加正则(ERE)

2.1 思路

1)先固定 抽取第二行

2)取出ip地址

4.0.1    前一个字符三番两遍现身一回或频仍

grep -E ===egrep

[root@oldboy log]# egrep '0 ' /oldboy/oldboy.txt

my qq is 49000448

not 4900000448.

 

小结:

1.前贰个字符接二连三现身1次或叁回以上

2. 一般与[]开展协作

 

 

例题:

lidao.×××

cat id.txt

汤 610702199107053598

邹 371481199403259478

莫 52020319810613433X

韩 460106199111137270

荣 530124197504135438

荣 oldboy

荣 babygirl

荣 530124197504135438

阮 360702197902169951

翁 331002198504132813

任 621223198708245176

姜 370602198507189574

霍 320904198403048179

怎么判别顾客的×××号码是还是不是科学?

特殊符号援救大家处理文件====正则表明式

在文书中过滤出您想要的或不想要的内容

解答:   egrep '[0-9X] '  id.txt

[root@oldboy log]# egrep '[0-9X] ' /oldboy/id.txt

汤 610702199107053598

邹 371481199403259478

 

2.1.1 看eth0的内容

[[email protected] ~]# ifconfig eth0

eth0      Link encap:Ethernet  HWaddr 00:0C:29:A8:E4:14 

          inet addr:10.0.0.201  Bcast:10.0.0.255  Mask:255.255.255.0

          inet6 addr: fe80::20c:29ff:fea8:e414/64 Scope:Link

          UP BROADCAST RUNNING MULTICAST  MTU:1500  Metric:1

          RX packets:86884 errors:0 dropped:0 overruns:0 frame:0

          TX packets:74978 errors:0 dropped:0 overruns:0 carrier:0

          collisions:0 txqueuelen:1000

          RX bytes:14324203 (13.6 MiB)  TX bytes:26220378 (25.0 MiB)

4.0.2  |   或者

搜索3306或1521端口服务

[root@oldboy log]# egrep '3306|1521' /etc/services

mysql           3306/tcp                        # MySQL

mysql           3306/udp                        # MySQL

ncube-lm        1521/tcp                # nCube License Manager

ncube-lm        1521/udp                # nCube License Manager

 

2.2 方法生龙活虎 sed 掐头去尾

用sed命令,将内部无需出示的,稳步替换。

[[email protected] ~]#  ifconfig eth0|sed -n '2p'|sed 's#^.*dr:##g'|sed 's# .*$##g'

10.0.0.201

4.0.3 ()   表示三个整机   反/后向援引

搜索文件中包罗oldboy或oldbey的行

[root@oldboy log]# egrep 'oldb(o|e)y' /oldboy/oldboy.txt

I am oldboy teacher!

my blog is

our size is http://blog.oldboyedu.com

my god ,i am not oldbey,but OLDBOY!

 

2.3 方法二sed 反向引用 

反向替换,使用()把ip地址体贴起来,1趋势选用,展现出来ip。

[[email protected] ~]# ifconfig eth0|sed -nr '2s#^.*dr:(.*)  Bc.*$#1#gp'

10.0.0.201

       简写

第1章 扩张正则表明式 1.1 前一个字符三番五次现身了 1 次或 1 次以上 egrep "0 " oldboy.txt 1 次或 1 次以上 =1 egrep "0*" oldboy.txt 0 次或 0 次以...

4.0.4 ( 卡塔尔 反向援用/后向援用----sed    先爱慕在接受

sed  -r   识别扩大正则

使出口结果为 12<34>56         这几个就叫后向援引

[root@oldboy oldboy]# echo 123456 |sed -r 's#(12)(34)(56)#1<2>3#g'

12<34>56                          2对应前边第多少个

12.27

4.0.5 {}   0{n,m} 前八个字符起码三回九转现身了n次,最多延续现身了m次

0{n,m}  前三个字符最少三番五次现身n次,最多一而重现身了m次

0{n}   前叁个字符三番五次现身n次

0{n,}   前一个字符最少再而三现身n次

0{,m}  前一个字符最多三番五次现身了m次

例:查找文本中0起码现身3次最多出新4次的行

[root@oldboy oldboy]# egrep '0{3,4}' oldboy.txt  

my qq is 49000448

not 4900000448.

例:查找文本中0出现3次的行

[root@oldboy oldboy]# egrep '0{3}' oldboy.txt  

my qq is 49000448

not 4900000448.

 

 

寻觅0三回九转现身了贰遍的行(适逢其会一回卡塔尔国

[root@oldboy oldboy]# egrep '^.*[^0]0{3}[^0].*$' oldboy.txt 

my qq is 49000448

 

荒谬:加号在花括号前方,花括号失效

图片 4 

 

4.0.6 ?前四个字符出现零次或一次

[root@oldboy oldboy]# cat good.txt

good

gd

god

goood

[root@oldboy oldboy]# egrep 'go?d' good.txt

gd

god

 

4.1 ERE小结

1.  一般与[]举行协作 把各个三番五次的东西抽取来

2. |   或

3. (卡塔尔(英语:State of Qatar)  二个全部   后向援引---sed

4. {}   0{n,m} 前一个字符最少一连现身了n次,最多一而再接二连三出现了m次

5. ?  前五个字符现身了零次或贰回

 

4.2 根底正则与扩展正则的区分

幼功正则:   grep/sed/awk

壮大正则:  egrep/sed -r/awk

 

4.3 grep/sed 可以加转义符号识别扩充正则

[root@oldboy oldboy]# grep 'go d' good.txt

good

god                    只可以转义对单个字符   鸡肋

goood

补充:了解

图片 5 

4.4 正则计算

1. grep/egrep      -o和颜料是grep独有

2. 一步步表明

4.5 正则学习资料

man  grep

info  sed/awk/grep

 

 

 

 

 

 

 

 

 

 

 

 

本文由星彩网app下载发布于星彩网app下载,转载请注明出处:linux正则表明式,linux运营正则表明式技能分享

TAG标签: 星彩网app下载
Ctrl+D 将本页面保存为书签,全面了解最新资讯,方便快捷。