正则就是用一些具有特殊含义的符号组合到一起(称为正则表达式)来描述字符或者字符串的方法。或者说:正则就是用来描述一类事物的规则。(在Python中)它内嵌在Python中,并通过 re 模块实现。

import re
-
\w与\W
- \w匹配字母数字及下划线
re.findall('\w','hello world 2022_04/24') ['h', 'e', 'l', 'l', 'o', 'w', 'o', 'r', 'l', 'd', '2', '0', '2', '2', '_', '0', '4', '2', '4']- \W匹配非字母数字下划线
re.findall('\W','hello world 2022_04/22') [' ', ' ', '/'] -
\s与\S
- \s匹配任意空白字符,等价于[\t,\n,\r,\f]
re.findall('\s','hello world 2022_04/22') [' ', ' ']- \S匹配任意非空字符
re.findall('\S','hello world 2022_04-24') ['h', 'e', 'l', 'l', 'o', 'w', 'o', 'r', 'l', 'd', '2', '0', '2', '2', '_', '0', '4', '-', '2', '4'] -
\d与\D
- \d匹配任意数字
re.findall('\d','hello world 2022_04-24') ['2', '0', '2', '2', '0', '4', '2', '4']- \D匹配任意非数字
re.findall('\D','hello world 2022_04-24') ['h', 'e', 'l', 'l', 'o', ' ', 'w', 'o', 'r', 'l', 'd', ' ', '_', '-'] -
\A与\Z
- \A匹配字符串开始
re.findall('\Ah','hello world 2022_04-24') ['h']- \Z匹配字符串结束,如果存在换行,只匹配到换行前的结束字符串
re.findall('24\Z','hello world 2022_04-24') ['24'] -
^与$等价于\A与\Z
- ^
re.findall('^he','hello world 2022_04-24') ['he']- $
re.findall('24$','hello world 2022_04-24') ['24'] -
重复匹配:| . | * | ? | .* | .*? | + | {n,m} |
.中间只匹配一个字符,可以为空
re.findall('o.w','leeleeeeeleeo worleee ') ['o w']*左侧字符0或无数个
re.findall('ll*','leeleeeeeleeo worleee ') ['l', 'l', 'l', 'l']?左侧字符0个或1个
re.findall('el?','leeleeeeeleeo worleee ') ['e', 'el', 'e', 'e', 'e', 'e', 'el', 'e', 'e', 'e', 'e', 'e']+左侧字符1个或无穷个
re.findall('ll+','leeleeeeeleeo worleee ') []{n,m}左侧字符最少重复n次,最多m次
re.findall('le{2,4}','leeleeeeeleeo worleee ') ['lee', 'leeee', 'lee', 'leee'].*默认全部匹配
re.findall('l.*l','leeleeeeeleeo worleee ') ['leeleeeeeleeo worl'].*?
re.findall('l.*?l','leeleeeeeleeo worleee ') ['leel', 'leeo worl']