# RE模块
```python
re.findall(pattern,string)
功能: 获取所有正则表达式匹配的内容
参数：pattern   正则表达式
     string    目标字符串
返回：列表，  得到所有复合条件的内容

```

```python
元字符的使用

1. 普通字符

元字符： a  b C  张 
匹配规则： 每个字符匹配对应的字符

In [10]: re.findall('ab','abcdef')
Out[10]: ['ab']


2. 或

元字符： | 
匹配规则： 匹配 | 两侧任意一个正则表达式规则

In [13]: re.findall('ab|ef','abcdefhi')
Out[13]: ['ab', 'ef']

3. 匹配单个字符

元字符：  .
匹配规则： 匹配除\n外任意一个字符

In [16]: re.findall('f.o','foo,fao,f和o')
Out[16]: ['foo', 'fao', 'f和o']


4. 匹配字符串开始位置

元字符： ^
匹配规则： 匹配目标字符串的开头位置

In [20]: re.findall("^Hello","Hello Jame, Hello Kitty")
Out[20]: ['Hello']

5. 匹配字符串的结尾位置

元字符 ： $
匹配规则：匹配字符串结尾位置

In [23]: re.findall("Hello$","Hello,Jame, Hello")
Out[23]: ['Hello']


6.  匹配重复

元字符 ： *
匹配规则： 匹配前面的字符出现0次或者多次

In [29]: re.findall("fo*","fooabcd")
Out[29]: ['foo']

注意： fo*  匹配f为o出现0次，而fo表示出现1次

7. 匹配重复

元字符： +
匹配规则： 匹配前面的字符出现 1次或多次

In [33]: re.findall("fo+","fooooooabcdfo")
Out[33]: ['foooooo', 'fo']

8. 匹配重复

元字符： ？
匹配规则： 匹配前面出现的字符0次或1次

In [41]: re.findall("ab?","acdefabb")
Out[41]: ['a', 'ab']

9. 匹配重复

元字符： {n}
匹配规则： 匹配前面的字符出现指定次数

In [43]: re.findall("ab{3}","acdefabbb")
Out[43]: ['abbb']

10. 匹配重复

元字符： {m,n}
匹配规则： 匹配前面出现的字符m-n次

In [46]: re.findall("ab{3,5}","abcdefabbb,abbbbbb")
Out[46]: ['abbb', 'abbbbb']


11. 匹配字符集

元字符： [字符集]
匹配规则： 匹配字符集中任意一个字符

[abc123] --> 字符集中字符
[a-z]  [A-Z]  [0-9]  --> 取字符区间内所有值
[_#%123a-z]  可以混合使用

In [53]: re.findall("[A-Z]+[a-z]*","Hello Jame,Beijing CBD")
Out[53]: ['Hello', 'Jame', 'Beijing', 'CBD']

12. 匹配字符集

元字符：[^...]
匹配规则： 匹配除了字符集中的任意一个字符

In [55]: re.findall("[^, ]+","Hello Jame,This is a test_1")
Out[55]: ['Hello', 'Jame', 'This', 'is', 'a', 'test_1']


13.  匹配任意（非）数字字符

元字符 ： \d   \D
匹配规则： \d 匹配任意数字字符    [0-9]
           \D 匹配任意非数字字符  [^0-9]

In [56]: re.findall("1\d{10}","tel:15813670316")
Out[56]: ['15813670316']


14. 匹配任意（非）普通字符

元字符： \w   \W
匹配规则： \w  匹配任意普通字符  [_a-zA-Z0-9]
           \w  匹配任意非普通字符

注意： 普通字符指 数字 字母 下划线 和 普通utf8字符

In [59]: re.findall("\w+","PORT#1908 44% 下降")
Out[59]: ['PORT', '1908', '44', '下降']


15. 匹配任意（非）空字符

元字符： \s  \S
匹配规则： \s 匹配任意空字符  [ \r\n\t\v\f]
           \S 匹配任意非空字符

In [62]: re.findall("hello\s+world","hello    world")
Out[62]: ['hello    world']

16. 匹配字符串开头结尾位置

元字符 ： \A   \Z
匹配规则： \A 匹配字符串开头  ^
           \Z 匹配字符串结尾  $

In [68]: re.findall("\A\d+-\d+\Z","1000-1500")
Out[68]: ['1000-1500']

17. 匹配（非）单词边界

元字符： \b  \B
匹配规则： \b   匹配单词边界位置
           \B   匹配非单词边界位置

注意： 数字字母下划线，普通utf8字符和其他字符的交界位置为单词边界

```

## 正则表达式的分组

```python
正则表达式分组

    使用()可以为正则表达式内部建立若干分组，子组为正则表达式的一部分。

    子组特点：
    1. 一个正则表达式内部可以有多个分组
    2. 分组后正则表达式仍然一个整体去匹配目标字符串，不会使用分组单独匹配
    3. 分组一般由外到内，由左到右计数，不会重叠
    
    子组的作用：
       
       1. 将分组作为一个整体，改变元字符的操作对象
          
          re.search(r"(ab)+\d+","ababab1234").group()
          Out[105]: 'ababab1234'


	  re.search(r"\w+@\w+\.(cn|com)","abc@123.com").group()
          Out[110]: 'abc@123.com'
       
       2. 可以通过函数单独提取子组的对应匹配内容

          re.search(r"(http|https|ftp|file)://\S+","http://www.baidu.com").group(1)
          Out[112]: 'http'
       
       3. 可以通过命名注释子组含义，让结构分明
          
	  * 子组分为捕获组合非捕获组，捕获组即定义了名称的子组

	  格式： (?P<name>patter)

          re.search(r"(?P<piglet>ab)cde","abcdefght").group()
          Out[113]: 'abcde'


```

## re模块的使用

```python
regex = compile(patten,flags = 0)
功能： 生成正则表达式对象
参数： pattern  正则表达式
       flags  功能标志位，丰富正则表达式的匹配功能
返回值： 返回正则对象

re.findall(pattern,string,flags)
功能: 从目标字符串匹配所有正则内容
参数：pattern  正则
      string   目标字符串
      flags    功能标志
返回值： 返回匹配到的内容列表
         如果正则表达式有子组则只获取子组对应内容

regex.findall(string,pos,endpos)
功能: 从目标字符串匹配所有正则内容
参数：string  目标字符串
      pos  对目标字符串截取的起始位置，默认开头
      endpos 对目标字符串截取的结束位置，默认结尾
返回值： 返回匹配到的内容列表
         如果正则表达式有子组则只获取子组对应内容

re.split(pattern,string,flags)
功能： 使用正则表达式匹配内容切割字符串
参数： pattern  正则
       string   目标字符串
返回： 列表  切割后的内容

re.sub(pattern,replaceStr,string,max,flags)
功能: 使用字符串替换正则匹配内容
参数：pattern  正则
      replaceStr  替换的字符串
      string 目标字符串
      max  最多替换几处，默认全部替换
返回值 ： 返回替换后的字符串

subn() : 与sub相同，多返回一个替换个数


re.finditer(pattern,string,flags)
功能: 查找正则表达式匹配内容
参数：pattern 正则
      string 目标字符串
      flags
返回：迭代对象 


re.fullmatch(pattern,string,flags)
功能：完全匹配目标字符串
参数：pattern  正则
      string  目标字符串
      flags
返回： 返回匹配到的内容，失败返回None

re.match(pattern,string,flags)
功能：匹配目标字符串开始位置
参数：pattern  正则
      string  目标字符串
      flags
返回： 返回匹配到的内容，失败返回None


re.search(pattern,string,flags)
功能：匹配目标字符第一处匹配内容
参数：pattern  正则
      string  目标字符串
      flags
返回： 返回匹配到的内容，失败返回None

```