### '^' 用法

In [30]:
import re

text = "start middle end"

# 匹配以 "start" 开头的字符串
match_start = re.search(r'^start', text)
print(match_start.group() if match_start else "No match found")  # Output: start

# 匹配不是数字的任何字符
non_digits = re.findall(r'[^0-9]', text)
print("Non-digits:", non_digits)  # Output: ['s', 't', 'a', 'r', 't', ' ', 'm', 'i', 'd', 'd', 'l', 'e', ' ', 'e', 'n', 'd']

print(type(non_digits))

start
Non-digits: ['s', 't', 'a', 'r', 't', ' ', 'm', 'i', 'd', 'd', 'l', 'e', ' ', 'e', 'n', 'd']
<class 'list'>


In [1]:
import re
# 用法1: 限定开头

emails = '''
  awhahlf@163.com
affafafafaaaaaaaaaaaaaaaa@163.com
afa_@163.com
225afafaf@163.com
aaaa____@qq.com
aaaa____@163.com
'''

# 生成正则表达式，一个是带 ^ ，一个不带
pattern1 = r"[a-zA-Z][\w_]{5,17}@163.com"
pattern2 = r"^[a-zA-Z][\w_]{5,17}@163.com"

# #生成三个正则对象，第一个是 正常写入的正则表达式，第二个是带 人 限定的表达式，第三个是带 人 限定的表达式且支持换行匹配
single_line1 = re.compile(pattern1)
single_line2 = re.compile(pattern2)
multiline = re.compile(pattern2, re.MULTILINE) # re.MULTILINE 是正则表达式中的一个标志， 使上面的 emails 变成多行模式

# 使用三个已经生成好的匹配字符
ret1 = re.search(single_line1, emails)
ret2 = re.search(single_line2, emails)
ret3 = re.search(multiline, emails)

#第一种不带人匹配发现立即匹配到，第二行的邮箱
print(ret1.group())
# 输出: afafaf@163.com

#第二种带 匹配发现没有匹配到，我们看到匹配限定，不换行第一行匹配
print(ret2)
# 输出: None

# 第二种带匹配发现没有匹配到，我们看到匹配限定支持换行使用了re.MULTILINE，换行匹配查到了afa_@163.com# re.MULTILINE支持换行后接字符，不能再接空格字符等
print(ret3.group())
# 输出: aaaa____@163.com


awhahlf@163.com
None
aaaa____@163.com


In [2]:
import re

tel1 = 'awhahlf@163.com, affafafafaaaaaaaaaaaaaaaa@163.com, afa_@163.com'
tel2 = ' awhahlf@163.com, affafafafaaaaaaaaaaaaaaaa@163.com, afa_@163.com'

# 第一行不存在空格，我们使用相同的表达式，匹配到了第一行，第一个字符
ret = re.search("^[a-zA-Z][\w_]{5,17}@163\.com", tel1)
print(ret.group())
# 输出: awhahlf@163.com

# 但是当我们第一行存在空格，我们使用相同的表达式，匹配不到对应的内容，返回来一个空
ret = re.search("^[a-zA-Z][\w_]{5,17}@163\.com", tel2)
print(ret)
# 输出: None

awhahlf@163.com
None


In [3]:
# 用法二 : 取反
# 导包
import re

# 需要筛选的字符
tel = '123789'
# 使用字符,直接取反，可以很直接的看到
ret = re.search("[^0-9]", tel)
print(ret)
# 输出: None

# 但是将 ^ 从中括号中拿出来就是取出对应的开头匹配的值
ret = re.search("^[0-9]", tel)
print(ret.group())
# 输出: 1

None
1


### '$' 用法

In [31]:
import re

text = "Hello World"

# 匹配以 "World" 结尾的字符串
match = re.search(r"World$", text)

if match:
    print("Match found at the end of the string:", match.group())
else:
    print("No match found")


Match found at the end of the string: World


In [32]:
import re

text = "abc123"

# 匹配以数字结尾的字符串
match = re.search(r"\d$", text)

if match:
    print("Match found at the end of the string:", match.group())
else:
    print("No match found")


Match found at the end of the string: 3


In [4]:
# '$' 用法

# 导包
import re
# 我们将匹配后缀信息，此时我们没有进行限定结尾
ret = re.match("[a-zA-Z][\w_]{5,17}@163\.com", "xiaoWang@163.com")
print(ret.group())
# 输出: 'xiaoWang@163.com'

# 继续匹配后缀为163.comheihei，这个如果是后缀增加，那我们在筛选的时候就会存在一些问题，因为实际上域名就已经不对了。
ret = re.match("[a-zA-Z][\w_]{5,17}@163\.com", "xiaoWang@163.comheihei")
print(ret.group())
# 输出:'xiaoWang@163.com'

# 通过$来确定末尾
ret = re.match("[a-zA-Z][\w_]{5,17}@163\.com$", "xiaoWang@163.comheihei")
ret.group()
# 输出: AttributeError: 'NoneType' object has no attribute 'group'


xiaoWang@163.com
xiaoWang@163.com


AttributeError: 'NoneType' object has no attribute 'group'

In [12]:
import re
emails2 = '''
  awhahlf@163.com
affafafafaaaaaaaaaaaaaaaa@163.com
afa_@163.com
225afafaf@163.com
aaaa____@qq.com
aaaa____@163.comabc
bbb___@163.com
'''

# 这里出错了： 忽略了163.com后面的abc
print(re.search("^[a-zA-Z][\w_]{5,17}@163.com", emails2,re.MULTILINE).group())
# 输出: aaaa____@163.com

# pattern = r'\b[a-zA-Z]\w{5,17}@163\.com\b'
# match = re.search(pattern, emails2, re.MULTILINE)
# print(match.group())



# 下面是添加 '$' 后的结果
print(re.search("^[a-zA-Z][\w_]{5,17}@163.com$", emails2,re.MULTILINE).group())
# 输出: bbb___163.com

aaaa____@163.com
bbb___@163.com


### '\b' 用法

In [14]:
# 导入模块
import re

# 匹配 bver开头结尾的单词，当然这里面在字符前面还包含了 '.*'号  .*将任何字符（换行符除外）匹配零次或多次
print(re.match(r".*\bver\b", "ho ver abc").group())
# 输出: 'ho ver'

# bver开头结尾的单词，但是这里单词为 verabc 不符合筛选错误
print(re.match(r".*\bver\b", "ho verabc").group())
# 输出:  AttributeError: 'NoneType' object has no attribute 'group'

# bver开头结尾的单词，但是这里单词为 hover 不符合筛选错误
print(re.match(r".*\bver\b", "hover abc").group())
# 输出:  AttributeError: 'NoneType' object has no attribute 'group'

ho ver


AttributeError: 'NoneType' object has no attribute 'group'

In [22]:
import re

print(re.search(r'.*\bTiWaTe\b', 'I love TiWaTe too').group())
# 输出: I love TiWaTe

result = re.search(r'.*\bTiWaTe\b', 'I love TiWaTedalu too')

if result:
    print(result.group())
else:
    print("No match found")


I love TiWaTe
No match found


### '\B' 用法


In [27]:
# '\B' 用法
# 导包
import re

# 相同的内容，使用\B进行取反操作， 匹配 ver 非包含开头结尾的单词，当然这里面在字符前面还包含了 '.*'号
# 如果未加'.*'号也会报错，注意思路取值是筛选单词与边界相关。
print(re.match(r".*\Bver\B", "hoverabc").group())
# 输出 : hover

# print(re.match(r".*\Bver\B", "ho verabc").group())
# 输出 : AttributeError: 'NoneType' object has no attribute 'group'

# 相同的内容，使用\B进行取反操作， 匹配 ver 开头结尾的单词
# print( re.match(r".*\Bver\B", "hover abc").group())
# 输出 : AttributeError: 'NoneType' object has no attribute 'group'

# 相同的内容，使用\B进行取反操作， 匹配 ver 开头结尾的单词
# print(re.match(r".*\Bver\B", "ho ver abc").group())
# 输出: AttributeError: 'NoneType' object has no attribute 'group'


hover


In [28]:
import re

text = "password word wordsmith"

# Using \b to match whole words
print(re.findall(r'\bword\b', text))  # Output: ['word']

# Using \B to match 'word' within another word
print(re.findall(r'\Bword\B', text))  # Output: []


['word']
[]
