# re
正则表达式操作。
在执行替换时，替换字串的类型也必须与所用的模式和搜索字串的类型一致。不能将 Unicode 字符串与字节串模式进行匹配，反之亦然。
正则使用反斜杠\,与 js 相反，js 使用正斜杠/。
避免匹配项中存在\这样冲突的转移字符，建议使用 r前缀包裹字符串，就不用考虑转义问题了。使用方式与 js 中类似。

### 标志 (flags)
* re.IGNORECASE：忽略大小写
* re.MULTILINE：多行匹配
* re.DOTALL：允许 . 匹配换行符
* re.UNICODE：启用 Unicode 匹配（Python 3 默认启用）
* re.VERBOSE：允许使用空格和注释

### re.compile(pattern, flags=0)
将正则表达式的样式编译为一个 正则表达式对象 （正则对象），
可以用于匹配，通过这个对象的方法 match(), search() 以及其他。

如果需要多次使用这个正则表达式的话，使用 re.compile() 和保存这个正则对象以便复用，可以让程序更加高效。

In [2]:
import re

pattern = r'^(\d{3})-(\d{3,8})$'
string = '010-12345'

# compile编译后会被缓存。
re_telephone = re.compile(pattern)
re_telephone.match(string).groups()

# 等价使用match
result = re.match(pattern, string).groups()
print(result)

('010', '12345')


### re.match(pattern, string, flags=0)
从字符串的起始位置匹配

In [16]:
result2 = re.match(r'hello', 'hello world hello')

print(result2.group())

hello


### re.search(pattern, string, flags=0)
在字符串中搜索正则表达式的匹配项

In [18]:
result2 = re.search(r'hello', '12 hello world hello')

print(result2.group())

hello


### re.findall(pattern, string, flags=0)
返回 pattern 在 string 中的所有非重叠匹配，以字符串列表或字符串元组列表的形式。

In [14]:

result2 = re.findall(r'hello', '12 hello world hello')

print(result2)

['hello', 'hello']


### re.split(pattern, string, maxsplit=0, flags=0)
用 pattern 分开 string 。 如果在 pattern 中捕获到括号，那么所有的组里的文字也会包含在列表里。如果 maxsplit 非零， 最多进行 maxsplit 次分隔， 剩下的字符全部返回到列表的最后一个元素。

In [2]:
re.split(r'\W+', 'Words, words, words.')

['Words', 'words', 'words', '']

### re.sub(pattern, repl, string, count=0, flags=0)
替换匹配的子字符串。类似 js 中的 replace

* repl：替换的字符串，或者是一个函数。
* string：需要替换的原始字符串

match.group(): 返回匹配到的字符串
match.groups(): 返回匹配到的字符串组成的元组
match.groupdict(): 返回匹配到的字符串组成的字典
match.start(): 返回匹配到的字符串的开始位置
match.end(): 返回匹配到的字符串的结束位置
match.span(): 返回匹配到的字符串的开始和结束位置组成的元组
match.expand(template): 返回替换后的字符串

In [53]:
text = 'hello world className="class"'

def replace(match):
  prefix  = match.group(1)
  return f"""{prefix}="abc\""""

re.sub(r'(className)="([^"]*)"',replace,text)

className


'hello world className="abc"'