# 分组的匹配方法

## 1. 用管道匹配多个分组

> | 称为“管道”。匹配许多表达式中的 "一个"
>  r'Batman|Tina Fey'将匹配 'Batman' 或 'Tina Fey'

In [11]:
import re
# 只会匹配一个
heroRegex = re.compile (r'Batman|Tina Fey')     # 返回 regex 对象

In [12]:
mo1 = heroRegex.search('Batman and Tina Fey.')
mo1.group()

'Batman'

In [13]:
mo2 = heroRegex.search('Batman and Tina Fey.')
mo2.group()

'Batman'

### 来一个小 demo

> 匹配'Batman'、'Batmobile'、'Batcopter'和'Batbat'中任意一个

In [14]:
import re
# 匹配'Batman'、'Batmobile'、'Batcopter'和'Batbat'中任意一个
# 利用 () 实现 Bat 打头，后面选择
batRegex = re.compile(r'Bat(man|mobile|copter|bat)')
momo = batRegex.search('Oh man! Batmobile lost a wheel')
momo.group()

'Batmobile'

### 同时要注意由于这么写 () 也是一个小分组，他会匹配一个自己的


In [15]:
import re
# 匹配'Batman'、'Batmobile'、'Batcopter'和'Batbat'中任意一个
batRegex = re.compile(r'Bat(man|mobile|copter|bat) Bat(man|mobile|copter|bat)')
momo = batRegex.search('Batman Batmobile lost a wheel')
momo.group(2)

'mobile'

## 2. 用问号实现可选匹配

? 之前的那个分组是可选的

In [16]:
batRegex = re.compile(r'Bat(wo)?man')
momo1 = batRegex.search('The Adventures of Batman')
momo1.group()

'Batman'

In [17]:
batRegex = re.compile(r'Bat(wo)?man')
momo2 = batRegex.search('The Adventures of Batwoman')
momo2.group()

'Batwoman'

### demo

> 让正则表达式寻找包含区号或不包含区号的 电话号码

In [18]:
import re
# \d\d\d-：可有可无
phoneRegex = re.compile(r'(\d\d\d-)?\d\d\d-\d\d\d\d')
mo1 = phoneRegex.search('My number is 415-555-4242')
mo2 = phoneRegex.search('My number is 555-4242')

print(mo1.group())
print(mo2.group())

415-555-4242
555-4242


## 3. 用星号匹配零次或多次

In [19]:
import re
batRegex = re.compile(r'Bat(wo)*man')   # 星号匹配模式

# 0 次
starmarch = batRegex.search("The Adventure of Batman")
starmarch.group()

'Batman'

In [20]:
# 匹配一次
starmarch = batRegex.search("The Adventure of Batwoman")
starmarch.group()

'Batwoman'

In [21]:
# 匹配多次
starmarch = batRegex.search("The Adventure of Batwowowowowowowowowowowowowoman")
starmarch.group()

'Batwowowowowowowowowowowowowoman'

## 4. 用加号匹配一次或多次

In [22]:
import re
batRegex = re.compile(r'Bat(wo)+man')   # 加号匹配模式

In [34]:
# 匹配 0 次，匹配不到东西的
demo1 = batRegex.search("The Adventure of Batman")
demo1 == None

True

In [25]:
# 匹配一次
demo1 = batRegex.search("The Adventure of Batwoman")
demo1.group()

'Batwoman'

In [26]:
# 匹配多次
demo1 = batRegex.search("The Adventure of Batwowowowowowowowoman")
demo1.group()

'Batwowowowowowowowoman'

## 5. 使用话括号指定匹配次数

> (Ha){3,}将匹配 3 次或更多次实例，(Ha){,5}将匹配 0 到 5 次实例

In [27]:
import re
haRegex = re.compile(r'(Ha){3}')

In [29]:
mo1 = haRegex.search('HaHaHa')
mo1.group()

'HaHaHa'

In [33]:
import re
# 起码匹配三个以上，所以search 匹配不到 March 对象
haRegex = re.compile(r'(Ha){3}')
molike2 = haRegex.search('Ha')
molike2 == None

True