---
title:  Python 正则表达式
tags:  Python,cmd,develop,editable,install|安装,setup,命令行
grammar_cjkRuby: true
renderNumberedHeading: true
---

# Python 正则表达式

## 数量词

```
\d{6}    出现6次数字
\d{4,6}    数字出现4-6次
\d{4,}    数字出现4-65536次
\d{0,6}    数字出现0-6次
* 相当于{0,}
+ 相当于 {1,}
? 相当于 {0,1}
```

数量词默认用法是贪婪,如果在数量词后面加’?’,进行非贪婪

In [79]:
print(re.findall(r'\d{3,5}?','qw-e21231ewq'))
print(re.findall(r'\d{3,5}','qw-e21231ewq'))

['212']
['21231']


## 概括字符集

```
\d 相当于 [0-9]    digit
\w 相当于 [0-9a-zA-Z]    word还可以匹配下划线
\s space 制表符,回车符,换行符
```

\D,\W,\S分别与\d,\w,\s相反

. 可以匹配任意字符除了换行符\n

In [19]:
# import re
p = re.compile(r"(?<! )" + "x y" + r"(?! )")
p.search("x y")

<re.Match object; span=(0, 3), match='x y'>

## 环视 (look around)

环视顾名思义，左右看看，满足条件才匹配。相当于给正则表达式添加了简单的条件判断的能力，只有满足条件才匹配。

| 环视 | 含义 |
| -- | -- |
| (?=...) | 肯定顺序环视，子表达式能匹配右侧的文本 |
| (?!...) | 否定顺序环视，子表达式不能匹配右侧的文本 |
| (?<=...) | 肯定逆序环视，子表达式能匹配左侧的文本 |
| (?<!...) | 否定逆序环视，子表达式不能匹配左侧的文本 |

环视匹配的最终结果就是一个位置，匹配到的内容不保存到最终的匹配结果。这就好像要找某一单位，它位于人民大街和自由大路交叉口，人民大街东侧，自由大路南侧。我们根据这些线索确定这个单位，结果并不包含这些线索。环视的作用相当于对所在位置加了一个附加条件，只有满足这个条件，环视子表达式才能匹配成功。

In [93]:
import re 

print(re.findall(r"(?<=B)AAA","BAAA"))
print(re.findall(r"(?<!B)AAA","CAAA")) #这里使用(?<!B)、(?<!=B)均可
print(re.findall(r"AAA(?=B)","AAAB"))
print(re.findall(r"AAA(?!B)","AAAC")) #这里使用(?!B)、(?!=B)均可

['AAA']
['AAA']
['AAA']
['AAA']


## 分组

来自 [Python 正则表达式 | 菜鸟教程](https://www.runoob.com/python/python-reg-expressions.html)

In [1]:
import re
s = '1102231990xxxxxxxx'
res = re.search('(?P<province>\d{3})(?P<city>\d{3})(?P<born_year>\d{4})',s)
print(res.groupdict())

{'province': '110', 'city': '223', 'born_year': '1990'}


# References

- [正则表达式中的“环视”（lookaround）学习笔记_acflair的专栏-CSDN博客](https://blog.csdn.net/acflair/article/details/82975674)
- [Python3 正则表达式 - 简书](https://www.jianshu.com/p/f1a6f96e3e94)
- [Python 正则表达式 | 菜鸟教程](https://www.runoob.com/python/python-reg-expressions.html)