# Python 正则表达式案例

## 1.单个字符匹配

In [1]:
import re

In [4]:
# 使用\d对数字进行匹配
result = re.match(r"班级：\d","班级：1")

In [5]:
result.group()

'班级：1'

In [6]:
result = re.match(r"班级：\d","班级：2")
result.group()

'班级：2'

In [7]:
result = re.match(r"班级：\d","班级：6")
result.group()  # 获取匹配的结果

'班级：6'

- 通过以上实验：\d只能匹配0-9中的任意一个

In [9]:
re.match(r"班级：[1234567]","班级：5").group()

'班级：5'

In [11]:
re.match(r"班级：[1234567]","班级：2").group()

'班级：2'

In [16]:
re.match(r"班级：[1234567]","班级：8")
# 没有结果返回

In [14]:
# 使用'-'来表示连续字符
re.match(r"班级：[1-5]","班级：8")  
# 没有返回结果

In [15]:
re.match(r"班级：[1-5]","班级：4")  
# 有结果返回

<_sre.SRE_Match object; span=(0, 4), match='班级：4'>

In [17]:
re.match(r"班级：[1-47-9]","班级：4")  
# 有返回结果

<_sre.SRE_Match object; span=(0, 4), match='班级：4'>

In [18]:
# 在[] 中只取1 2 3 4 7 8 9
re.match(r"班级：[1-47-9]","班级：5")  
# 没哟返回结果

In [19]:
# 对字符进行匹配
re.match(r"班级：[1-47-9abcd]","班级：a")

<_sre.SRE_Match object; span=(0, 4), match='班级：a'>

In [20]:
# 匹配的范围0-9和所有的英文字母，包括大小写
re.match(r"班级：[0-9a-zA-Z]","班级：H")

<_sre.SRE_Match object; span=(0, 4), match='班级：H'>

- 通过以上的实验：使用[...]可以匹配[]中的数据

In [21]:
# 使用\w匹配单个数字和单个英文字符（包括大小写）还有中文
re.match(r"班级：\w","班级：G")

<_sre.SRE_Match object; span=(0, 4), match='班级：G'>

In [22]:
re.match(r"班级：\w","班级：6")

<_sre.SRE_Match object; span=(0, 4), match='班级：6'>

In [23]:
# \w匹配中文
re.match(r"班级：\w","班级：二")

<_sre.SRE_Match object; span=(0, 4), match='班级：二'>

## 2.多个字符匹配

In [24]:
import re

In [25]:
# 使用{}匹配多个,1,2表示能匹配到1位到2位
re.match(r"班级：\d{1,2}","班级：2")

<_sre.SRE_Match object; span=(0, 4), match='班级：2'>

In [26]:
re.match(r"班级：\d{1,2}","班级：22")

<_sre.SRE_Match object; span=(0, 5), match='班级：22'>

In [27]:
# 使用{}匹配多个,1,4表示能匹配到1位到4位
re.match(r"班级：\d{1,4}","班级：2")

<_sre.SRE_Match object; span=(0, 4), match='班级：2'>

In [28]:
re.match(r"班级：\d{1,4}","班级：234")

<_sre.SRE_Match object; span=(0, 6), match='班级：234'>

In [29]:
re.match(r"班级：\d{1,4}","班级：2345")

<_sre.SRE_Match object; span=(0, 7), match='班级：2345'>

In [43]:
# 使用{}匹配多个,匹配手机号码,只能有11位数字
re.match(r"手机号码:\d{11}","手机号码:15354286712").group()

'手机号码:15354286712'

In [46]:
# 使用{}匹配多个,匹配带区号的电话号码，？使用
re.match(r"电话号码:076-?\d{7}","电话号码:076-7561235").group()

'电话号码:076-7561235'

In [47]:
# 使用{}匹配多个,匹配带区号的电话号码
re.match(r"电话号码:076-?\d{7}","电话号码:0767561235").group()

'电话号码:0767561235'

## 3.分子匹配

In [48]:
# 邮箱匹配
import re

ret = re.match("\w{4,20}@163\.com", "test@163.com")
print(ret.group())  # test@163.com

ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@126.com")
print(ret.group())  # test@126.com

ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@qq.com")
print(ret.group())  # test@qq.com

ret = re.match("\w{4,20}@(163|126|qq)\.com", "test@gmail.com")
if ret:
    print(ret.group())
else:
    print("不是163、126、qq邮箱")  # 不是163、126、qq邮箱

test@163.com
test@126.com
test@qq.com
不是163、126、qq邮箱


- ()与group使用
- group(num)num取到的值为()中的值。

In [52]:
result = re.match("([^-]*)-(\d+)","076-4561541")

In [53]:
result.group()

'076-4561541'

In [54]:
result.group(1)

'076'

In [55]:
result.group(2)

'4561541'

- '\number'使用

In [57]:
#需求：匹配出<html><h1>www.itcast.cn</h1></html>

labels = ["<html><h1>www.itcast.cn</h1></html>", "<html><h1>www.itcast.cn</h2></html>"]

for label in labels:
    # 这里的\2 和\1表示（）2和（）1 的内容
    ret = re.match(r"<(\w*)><(\w*)>.*</\2></\1>", label)
    if ret:
        print("%s 是符合要求的标签" % ret.group())
    else:
        print("%s 不符合要求" % label)

<html><h1>www.itcast.cn</h1></html> 是符合要求的标签
<html><h1>www.itcast.cn</h2></html> 不符合要求
