In [6]:
import re

print(re.search('a+', 'abcaabbccaaabbbccc'))
print(re.match('a+', 'abcaabbccaaabbbccc'))
print(re.search('a{2,}', 'abcaabbccaaabbbccc'))
print(re.match('a{2,}', 'abcaabbccaaabbbccc'))

<re.Match object; span=(0, 1), match='a'>
<re.Match object; span=(0, 1), match='a'>
<re.Match object; span=(3, 5), match='aa'>
None


### reモジュールのフラグ(定数)

<table>
    <thead>
        <tr>
            <th>定数名</th>
            <th>説明</th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <td><m-b>A</m-b>、<m-b>ASCII</m-b></td>
            <td>\s、\wなどのマッチング処理で、UnicodeでなくASCII文字のみを使用する</td>
        </tr>
        <tr>
            <td><m-b>I</m-b>、<m-b>IGNORECASE</m-b></td>
            <td>大文字小文字を区別しない</td>
        </tr>
        <tr>
            <td><m-b>M</m-b>、<m-b>MULTILINE</m-b></td>
            <td>複数行のテキストに対し、^と$が各行の先頭と末尾にマッチする</td>
        </tr>
        <tr>
            <td><m-b>S</m-b>、<m-b>DOTALL</m-b></td>
            <td>.が改行文字も含めてマッチする</td>
        </tr>
    </tbody>
</table>

In [40]:
import re

print(re.search('\w+', 'あいうえお'))
print(re.search('\w+', 'あいうえお', flags=re.ASCII))

print(re.search('abc', 'AAAbCCC'))
print(re.search('abc', 'AAAbCCC', flags=re.IGNORECASE))

target = '''\
aaa
aaaa
aaaaa\
'''
print(re.compile('^aaaa$').search(target))
print(re.compile('^aaa$', re.MULTILINE).search(target))

target='''\
HOGE
fuga
Piyo
'''
print(re.compile('hoge.+piyo', re.IGNORECASE).search(target))
print(re.compile('hoge.+piyo', re.DOTALL | re.IGNORECASE).search(target))

<re.Match object; span=(0, 5), match='あいうえお'>
None
None
<re.Match object; span=(2, 5), match='AbC'>
None
<re.Match object; span=(0, 3), match='aaa'>
None
<re.Match object; span=(0, 14), match='HOGE\nfuga\nPiyo'>


### 正規表現オブジェクトのメソッド

<table>
    <thead>
        <tr>
            <th>メソッド</th>
            <th>戻り値</th>
            <th>説明</th>
        </tr>
    </thead>
    <tbody>
        <tr>
            <td><m-b>search(string[, pos[, endpos]])</m-b></td>
            <td><m-b>re.Match | None</m-b></td>
            <td>
                指定した文字列が正規表現にマッチするか返す<br>
                pos、endposはマッチ処理の対象となる位置を指定する。
            </td>
        </tr>
        <tr>
            <td><m-b>match(string[, pos[, endpos]])</m-b></td>
            <td><m-b>re.Match | None</m-b></td>
            <td>
                指定した文字列が正規表現にマッチするか返す<br>
                search()と異なり、先頭からマッチするかを返す。
            </td>
        </tr>
        <tr>
            <td><m-b>fullmatch(string[, pos[, endpos]])</m-b></td>
            <td><m-b>re.Match | None</m-b></td>
            <td>指定した文字列全体がマッチするか返す</td>
        </tr>
        <tr>
            <td><m-b>split(string, maxsplit=0)</m-b></td>
            <td><m-b>list[str]</m-b></td>
            <td>指定した文字列をマッチする文字列で分割する</td>
        </tr>
        <tr>
            <td><m-b>sub(repl, string, count=0)</m-b></td>
            <td><m-b>str</m-b></td>
            <td>指定した文字列の中で正規表現にマッチする文字列を置き換える</td>
        </tr>
        <tr>
            <td><m-b>findall(string[, pos[, endpos]])</m-b></td>
            <td><m-b>list[str]</m-b></td>
            <td>指定した文字列中の正規表現にマッチした文字列すべてをリストで返す</td>
        </tr>
        <tr>
            <td><m-b>finditer</m-b></td>
            <td><m-b>callable_iterator</m-b></td>
            <td>指定した文字列中の正規表現にマッチした文字列すべてをイテレータで返す</td>
        </tr>
    </tbody>
</table>

In [68]:
import re

ptn = re.compile('\d+[^\d]\d+')

print(ptn.fullmatch('123+456'))
print(ptn.fullmatch('123+456+789'))

print(ptn.split('x12+34,56-78x'))
print(ptn.split('x12+34,56-78x+90x'))

print(ptn.sub('xxx', '10.0.172.11'))
print(ptn.sub('xxx', '10.0.172.11', count=1))

print(ptn.findall('10.0.172.11'))
print(ptn.finditer('10.0.172.11'))
print([m for m in ptn.finditer('10.0.172.11')])

<re.Match object; span=(0, 7), match='123+456'>
None
['x', ',', 'x']
['x', ',', 'x+90x']
xxx.xxx
xxx.172.11
['10.0', '172.11']
<callable_iterator object at 0x0000021764D95D80>
[<re.Match object; span=(0, 4), match='10.0'>, <re.Match object; span=(5, 11), match='172.11'>]


In [87]:
# マッチオブジェクトのメソッド
import re

ptn1 = re.compile('(\w+?)[abcd](\w+)')
for m in ptn1.finditer('python Java php JavaScript swift go React'):
    print(m.group())
    print(m.group(1))
    print(m.group(2))
    print(m.groups())
    print(m.groupdict())
    print()

ptn2 = re.compile('(?P<first>\w+?)[abcd](?P<second>\w+)')
for m in ptn2.finditer('python Java php JavaScript swift go React'):
    print(m.group())
    print(m.group(1))
    print(m.group(2))
    print(m.group('first'))
    print(m.group('second'))
    print(m.groups())
    print(m.groupdict())
    print()

Java
J
va
('J', 'va')
{}

JavaScript
J
vaScript
('J', 'vaScript')
{}

React
Re
ct
('Re', 'ct')
{}

Java
J
va
J
va
('J', 'va')
{'first': 'J', 'second': 'va'}

JavaScript
J
vaScript
J
vaScript
('J', 'vaScript')
{'first': 'J', 'second': 'vaScript'}

React
Re
ct
Re
ct
('Re', 'ct')
{'first': 'Re', 'second': 'ct'}

