# 定义实现最短匹配的正则表达式
- 问题：正则表达式对文本模式做匹配，但默认是贪心算法，即识别出来的是最长匹配，我们想要实现最短的可能匹配
- 解决：使用？

In [1]:
import re

In [2]:
text1 = r'\* comment1 *\ '
str_pat = re.compile(r'\\\*(.*)\*\\')
str_pat.findall(text1)

[' comment1 ']

In [3]:
text2 = '\* comment1 *\ code \* comment2 *\ '
str_pat.findall(text2)

[' comment1 *\\ code \\* comment2 ']

以上例子中(.*)默认采用的是贪心策略，在text2中默认匹配了最长的两个注释符号之间的内容

在.*后面加？表示非贪心匹配

In [4]:
str_pat = re.compile(r'\\\*(.*?)\*\\')
str_pat.findall(text2)

[' comment1 ', ' comment2 ']

总结？的用法（非贪心）


| 语法 | 用法 |
| :- | :- |
| ? | 重复0次或一次，表示可选的分组 |
| *？ | 重复任意多次，但尽可能少重复 |
| +？ | 重复1次或更多次，但尽可能少重复 |
| ？？ | 重复0次或1次，但尽可能少重复 |
| {n,}? | 重复n次或更多次，但尽可能少重复 | 
| {n,m}? | 重复n到m次，但尽可能少重复 |


数量词的贪心和非贪心模式：<span class="mark">python中数量词默认是贪心的</span><span class="mark">，总是尝试匹配尽可能多的字符</span>。而利用$？$表示的非贪心的匹配总是尝试匹配最少的字符。