# 创建 Regex 对象

In [9]:
import re

# 创建 Regex 对象，向 compile 中传入原始字段串（r'...'形式）
phoneNumRegex = re.compile(r'\d\d\d-\d\d\d-\d\d\d\d')

# 匹配 Regex 对象
# 查询结果保存在变量 mo中，如果匹配到结果返回 Match 对象，否则为空值 None
mo = phoneNumRegex.search('My number is 415-555-4242.')

# Match 对象的 group方法返回匹配结果
mo.group()

'415-555-4242'

# 原始字符串 raw string

字符串`'\n'`表示换行字符，如果不使用原始字符串话就需要用`'\\n'`来表示`'\n'`，因为`'\'`表示转义字符，如果想要表示倒斜杠`（\）`就在倒斜杠前加个转义符，即：`'\\'`

可以理解为在原始字符串中，倒斜杠`\`不具有转义的功能，它只是一个纯粹的字符

# 操作符优先级

| 排列 |         原子与操作符优先级      |（从高到低）|
|---|-----------------------------------|------------------------|
| 1 | 转义符号 (Escaping Symbol)               | `\` |
| 2 | 分组、捕获 (Grouping or Capturing)                          | `(...)` `(?:...)` `(?=...)` `(?!...)` `(?<=...)` `(?<!...)`     |
| 3 | 数量 (Quantifiers)      | `a*` `a+` `a?` `a{n, m}` |
| 4 | 序列与定位（Sequence and Anchor）| `abc` `^` `$` `\b` `\B`               |
| 5 | 或（Alternation）| <code>a&#124;b&#124;c</code>                   |
| 6 | 原子 (Atoms)                 | `a` `[^abc]` `\t` `\r` `\n` `\d` `\D` `\s` `\S` `\w` `\W` `.` |

# 分组操作符

分组操作符决定 `group()`方法的返回结果

group() 与 group(0) 作用相同返回匹配结果

group(1) 返回第一个分组匹配结果，group(n) 返回第 n 个分组匹配的结果

`groups()`方法返回所有分组组合而成的元组

## 贪心匹配 vs 非贪心匹配



In [7]:
#贪心模式

import re
haRegex = re.compile(r'(Ha){3,5}')
mo = haRegex.search('HaHaHaHaHa')
mo.group()

'HaHaHaHaHa'

为什么匹配的是'HaHaHaHaHa'，而不是'HaHaHa'?

因为正则表达式默认是`‘贪心’`的，尽可能匹配最长的字符串。

`‘非贪心’`模式就要在花括号后面跟着一个端问号。

In [6]:
# 非贪心模式

import re
nongreedyHaRegex = re.compile(r'(Ha){3,5}?')
mo = nongreedyHaRegex.search('HaHaHaHaHa')
mo.group()

'HaHaHa'

# search() vs findall()

search()返回 Match 对象，可以使用 group()和 groups()方法

findall()返回字符串列表或元组列表

> 1. 字符串列表：没有分组的正则表达式
> 2. 元组列表：有分组的正则表达式，每个分组对应元组中的相应的字符串
