正则表达式

发布时间 2023-08-18 14:21:19作者: 夜owl

正则表达式

概述

正则表达式是一种用于匹配和处理文本模式的工具。它可以在文本中搜索、替换、分割和提取符合特定模式的字符串。

使用正则表达式时,您可以根据需要构建适合的模式,然后将模式应用到目标文本中进行匹配和处理。正则表达式在文本处理、数据验证、文本分析等方面有着广泛的应用。

常用的工具

很多工具都自带正则表达式搜索,比如notepad++,vscode,如图所示,所有学习正则表达式很有用
Alt text

另外python也常用到

常用元字符和符号

这里列举常用的,没有列举以后用到的时候也会汇总这里

.

:匹配任意单个字符,除了换行符。

*

:匹配前面的字符零次或多次。

+

:匹配前面的字符一次或多次。

?

:匹配前面的字符零次或一次。

^

:匹配字符串的开头。

$

:匹配字符串的结尾。

\d

:匹配任意数字。

\w

:匹配任意字母、数字或下划线。

\s

:匹配任意空白字符(空格、制表符、换行符等)。

[...]

:匹配方括号中列举的任意一个字符。

[^...]

:匹配除了方括号中列举的字符以外的任意一个字符。

( )

:捕获分组,用于提取匹配的子字符串或应用其他操作。

常用的操作

替换换行

正则可以识别换行符,然后就可以进行操作。如图
Alt text

识别字符段

\{[^}]*width="([^}]*)"[^}]*\}

这个正则表达式的具体含义如下:

  • \{:匹配左大括号 {
  • [^}]*:匹配除右大括号 } 之外的任意字符。
  • width=:匹配 width= 字符串。
  • ([^}]*):使用括号捕获分组,匹配除右大括号 } 之外的任意字符,即 width 的值。
  • [^}]*:匹配除右大括号 } 之外的任意字符。
  • \}:匹配右大括号 }