# python中的正则表达式

# 正则表达式
1. 特点
    - 方便进行检索修改的文本操作。
    - 支持语言众多
    - 使用灵活多样

> python中的正则表达式的操作主要在(re)模块内，下面介绍正则表达式的常用格式，以及re包的具体使用．

- `.`     : 匹配任意字符
- `^`     : 指明从头开始匹配，如果是多行模式，将从每行的头部开始匹配
- `$`     : 指明匹配内容的结束格式，也适用于多行
- `*`     : 匹配0个或多个
- `+`     : 匹配1个或多个
- `?`     : 匹配0个或1个
- `{m}`   : 指定匹配次数，a{3},匹配3个a
- `{m,n}` : 指定匹配个数区间，a{3,5},匹配3-5个a
- `[]`    : 匹配字符集合
- `|`     : 或

- `()`    : 用于组匹配，
- `(?aiLmsux)`：用于re模块的flags标识。
    - re.A : 只匹配ascii
    - re.I : 忽略大小写
    - re.L : local dependent
    - re.M : 多行模式
    - re.S : 点匹配适用于多行 re.DOTALL
    - re.U : unicode匹配
    - re.X : 优化表达式的书写方式，可以添加注释和换行及空格 re.VERBOSE

- `\A` : 匹配字符串开始
- `\b` : 匹配（非）单词边界位置
- `\B` : 
- `\d` : [0-9]
- `\D` : [^0-9]
- `\s` : [ \t\n\r\f\v]
- `\S` : [^ \t\n\r\f\v]
- `\w` : [a-zA-Z0-9]
- `\W` : [^a-zA-Z0-9]
- `\Z` : 匹配字符串结尾

> 在匹配的过程，默认都是贪婪匹配，即尽可能多的匹配符合要求的结果．比如`*`有多个的情况下匹配多个，`+`有多个的情况下会匹配多个，`?`有一个的情况下会匹配一个，`{m,n}`有ｎ个则匹配ｎ个．

> 如果想采用非贪婪匹配，只需在匹配量词后加上`?`,

> 贪婪模式：贪婪模式的量词包括：`?`,`*`,`+`,`{m,n}`

> 非贪婪模式(懒惰模式)：只需在匹配优先量词后加上?，如：`??`,`*?`,`+?`,`{m,n}?`


## 小结
- 用r来标识字符串，可以使字符串内的转意字符失效．r'\n'
- 匹配单个字符：`. \d \D \w \W \s \S [...] [^...]`
- 匹配重复性：`* ? {N} {m, n}`
- 匹配位置：`^ $ \A \Z \b \B`
- 其他：`| () \`

# re
---


```python
regex = compile(pattern, flags=0) # 生成正则表达式对象

escape(pattern) # 将所有非字母数字变成转义格式
findall(pattern, string, flags=0)# 查找正则表达式匹配的内容，以列表的形式返回。
finditer(pattern, string, flags=0) # 返回一个匹配内容的迭代器
fullmatch() # 绝对匹配

match(pattern, string, flags=0) # 从头开始位置匹配
purge() # 清除缓存
search(pattern, string, flags=0) # 匹配符合条件的结果
split(pattern, string, maxsplit=0, flags=0) # 用匹配内容，分割字符串

sub(pattern, repl, string, count=0, flags=0) # 匹配并替换 
subn(pattern, repl, string, count=0, flags=0) # 同sub，不同的是返回格式为(new_string, number)
template()
```