# re
\d 數字  
\D 非數字  
\w 英數  
\W 非英數  
\s 空白字元  
\S 非空白字元  
\b 單字範圍 (介於 \w 與 \W)  
\B 非單字範圍  

## re.match() 開頭是否符合

In [2]:
import re
result = re.match('You', 'Young Frankenstein')
result

<re.Match object; span=(0, 3), match='You'>

In [9]:
import re
youpattern = re.compile('You')
if result := youpattern.match('Young Frankenstein'):
    print(result.group())

You


In [13]:
# no match is None
result = re.match('xxx', 'Young Frankenstein')
print(result)

None


In [17]:
result = re.match('\d*', '123456ABC7890')
print(result)
print(result.group())

<re.Match object; span=(0, 6), match='123456'>
123456


In [46]:
result = re.match('\d+', 'ABC123456ABC7890')
print(result)

None


## re.search() 找到第一個符合的

In [43]:
result = re.search('\d+', 'ABC123456ABC7890')
print(result)
print(result.group())

<re.Match object; span=(3, 9), match='123456'>
123456


## re.findall()

In [44]:
result = re.findall('\d+', 'ABC123456ABC7890')
print(result)

['123456', '7890']


## re.split()

In [47]:
result = re.split('n', 'Young Frankenstein')
print(result)

['You', 'g Fra', 'ke', 'stei', '']


## re.sub()

In [48]:
result = re.sub('n', '?', 'Young Frankenstein')
print(result)

You?g Fra?ke?stei?


## 使用說明符
```
(expr) expr  ()group 
expr1 | expr2  expr1或expr2
.   除了\n以外任何字元
^   來源字串開頭
$   來源字串結尾
prev?   0或1個 prev
prev*   0或多個 prev，儘可能地多
prev*?  0或多個 prev，儘可能地少
prev+   1或多個 prev，儘可能地多
prev+?  1或多個 prev，儘可能地少
prev{m} m個連續prev
prev{m, n} m~n個連續prev，儘可能地多
prev{m, n}? m~n個連續prev，儘可能地少
[abc]   a or b or c (與a|b|c一樣)
[^abc]  非(a or b or c)
prev(?=next)  prev, 若接下來是next
prev(?!next)  prev, 若接下來不是next
(?<=prev)next  next, 若前面是prev
(?<!prev)next  next, 若前面不是prev
(?P<name>expr)  group 實例放在name群組中
```

In [59]:
import re

source = '''I wish I may, I wish I might
Have a dish of fish tonight.
'''

print(re.findall('wish', source))
print(re.findall('wish|fish', source))
print(re.findall('^wish', source))
print(re.findall('^I wish', source))
print(re.findall('fish$', source))
print(re.findall('fish tonight.$', source))
print(re.findall('[wf]ish', source))
print(re.findall('[wsh]+', source))
print(re.findall('ght\W', source))
print(re.findall('I (?=wish)', source))
print(re.findall('(?<=I) wish', source))
print(re.findall(r'\bfish', source)) # 轉義字元記得用r''停用轉義字元

['wish', 'wish']
['wish', 'wish', 'fish']
[]
['I wish']
[]
['fish tonight.']
['wish', 'wish', 'fish']
['w', 'sh', 'w', 'sh', 'h', 'sh', 'sh', 'h']
['ght\n', 'ght.']
['I ', 'I ']
[' wish', ' wish']
['fish']


In [62]:
# match() or serach() 找出匹配group
m = re.search(r'(. dish\b).*(\bfish)', source)
print(m)
print(m.group())
print(m.groups())

<re.Match object; span=(34, 48), match='a dish of fish'>
a dish of fish
('a dish', 'fish')


In [64]:
m = re.search(r'(?P<DISH>. dish\b).*(?P<FISH>\bfish)', source)
print(m.group())
print(m.groups())
print(m.group('DISH'))
print(m.group('FISH'))

a dish of fish
('a dish', 'fish')
a dish
fish
