## 正規表現の簡単な使い方


### 検索用データのダウンロード

In [27]:
with open("./dummy_txt/dummy.txt", encoding="utf-8") as f:
    text = f.read()

print(text)

名前,ふりがな,メールアドレス,性別,年齢,誕生日,血液型,都道府県,電話番号
土橋 美幸,つちはし みゆき,tsuchihashi_miyuki@example.com,女,27,1992/12/25,O型,千葉県,046-863-1184
斎藤 綾女,さいとう あやめ,saitou_ayame@example.com,女,39,1981/8/8,B型,茨城県,022-741-5722
宮沢 愛子,みやざわ あいこ,miyazawa_aiko@example.com,女,57,1962/11/12,A型,三重県,031-630-9402
外山 亮,そとやま りょう,sotoyama_ryou@example.com,男,38,1982/6/4,AB型,北海道,093-790-9904
村松 照生,むらまつ てるお,muramatsu_teruo@example.com,男,36,1984/6/6,A型,高知県,052-207-6595
近藤 剛基,こんどう よしき,kondou_yoshiki@example.com,男,71,1948/9/27,O型,兵庫県,083-462-5184
西本 そら,にしもと そら,nishimoto_sora@example.com,女,25,1995/5/8,A型,岐阜県,099-112-5418
浅田 染五郎,あさだ そめごろう,asada_somegorou@example.com,男,33,1987/8/5,O型,東京都,091-686-6226
安永 花,やすなが はな,yasunaga_hana@example.com,女,67,1952/9/10,A型,岩手県,016-573-6314
矢田 洋,やだ よう,yada_you@example.com,男,71,1949/7/4,A型,鹿児島県,092-370-1148
小松 法嗣,こまつ ほうし,komatsu_houshi@example.com,男,50,1970/4/4,A型,新潟県,085-936-5065
仲田 明宏,なかた あきひろ,nakata_akihiro@example.com,男,66,1953/9/10,O型,東京都,055-435-1392
佐古 美智子,さこ みちこ,sako_michiko@example.com,女,27,1993/7/

### 「任意の1文字（この1文字は何でも良い）」という指定

In [28]:
import re
re.findall(r".", text)

['名',
 '前',
 ',',
 'ふ',
 'り',
 'が',
 'な',
 ',',
 'メ',
 'ー',
 'ル',
 'ア',
 'ド',
 'レ',
 'ス',
 ',',
 '性',
 '別',
 ',',
 '年',
 '齢',
 ',',
 '誕',
 '生',
 '日',
 ',',
 '血',
 '液',
 '型',
 ',',
 '都',
 '道',
 '府',
 '県',
 ',',
 '電',
 '話',
 '番',
 '号',
 '土',
 '橋',
 ' ',
 '美',
 '幸',
 ',',
 'つ',
 'ち',
 'は',
 'し',
 ' ',
 'み',
 'ゆ',
 'き',
 ',',
 't',
 's',
 'u',
 'c',
 'h',
 'i',
 'h',
 'a',
 's',
 'h',
 'i',
 '_',
 'm',
 'i',
 'y',
 'u',
 'k',
 'i',
 '@',
 'e',
 'x',
 'a',
 'm',
 'p',
 'l',
 'e',
 '.',
 'c',
 'o',
 'm',
 ',',
 '女',
 ',',
 '2',
 '7',
 ',',
 '1',
 '9',
 '9',
 '2',
 '/',
 '1',
 '2',
 '/',
 '2',
 '5',
 ',',
 'O',
 '型',
 ',',
 '千',
 '葉',
 '県',
 ',',
 '0',
 '4',
 '6',
 '-',
 '8',
 '6',
 '3',
 '-',
 '1',
 '1',
 '8',
 '4',
 '斎',
 '藤',
 ' ',
 '綾',
 '女',
 ',',
 'さ',
 'い',
 'と',
 'う',
 ' ',
 'あ',
 'や',
 'め',
 ',',
 's',
 'a',
 'i',
 't',
 'o',
 'u',
 '_',
 'a',
 'y',
 'a',
 'm',
 'e',
 '@',
 'e',
 'x',
 'a',
 'm',
 'p',
 'l',
 'e',
 '.',
 'c',
 'o',
 'm',
 ',',
 '女',
 ',',
 '3',
 '9',
 ',',
 '1',
 '9'

In [29]:
re.findall(r"山.県", text)

['山口県', '山形県', '山梨県']

### ドットは連続で入力可能

In [30]:
re.findall(r"和..県", text)

['和歌山県']

### 「行頭と行末にある文字」という指定

#### 行頭の場合

In [31]:
re.findall(r"福.", text)

['福原', '福井', '福岡', '福島', '福岡', '福岡', '福井', '福岡']

In [32]:
re.findall(r"^福.", text, re.MULTILINE)

['福原']

#### 行末の場合

In [33]:
re.findall(r"5976$", text, re.MULTILINE)

['5976']

### 「任意の○文字」という指定

#### 文字数が固定の場合

In [34]:
re.findall(r"和.{2}県", text, re.MULTILINE)

['和歌山県']

#### 文字数が不定の場合

In [35]:
re.findall(r"^北.? .{2}", text, re.MULTILINE)

['北 信彦', '北中 そら']

### 「この1文字が指定した文字のどれか」という指定

In [36]:
re.findall(r"[0-9]{3}-[0-9]{3}-[0-9]{4}", text)

['046-863-1184',
 '022-741-5722',
 '031-630-9402',
 '093-790-9904',
 '052-207-6595',
 '083-462-5184',
 '099-112-5418',
 '091-686-6226',
 '016-573-6314',
 '092-370-1148',
 '085-936-5065',
 '055-435-1392',
 '082-743-2948',
 '036-711-7714',
 '083-556-4164',
 '064-625-9792',
 '025-143-2582',
 '053-779-1632',
 '035-623-5976',
 '071-977-8336',
 '097-823-1758',
 '028-944-7462',
 '023-148-9390',
 '022-453-6326',
 '061-746-3664',
 '099-314-6781',
 '029-710-2090',
 '066-347-6519',
 '087-189-2817',
 '069-294-4436',
 '096-990-5535',
 '060-854-6427',
 '033-842-2376',
 '017-940-4802',
 '028-365-4211',
 '078-769-1845',
 '031-980-7143',
 '093-362-7464',
 '096-694-6334',
 '091-327-5123',
 '057-924-8301',
 '093-639-4835',
 '018-751-6917',
 '062-134-8798',
 '095-856-2951',
 '091-839-3809',
 '088-996-6947',
 '041-267-5841',
 '052-987-2639',
 '011-679-9758',
 '012-858-4317',
 '024-790-9989',
 '097-940-9217',
 '038-768-3894',
 '066-925-3072',
 '018-871-2413',
 '057-245-3613',
 '096-997-4363',
 '036-654-7575

### 「この1文字が指定した文字以外のどれか」という指定

In [37]:
re.findall(r"[^a-zA-Z0-9]", text)

['名',
 '前',
 ',',
 'ふ',
 'り',
 'が',
 'な',
 ',',
 'メ',
 'ー',
 'ル',
 'ア',
 'ド',
 'レ',
 'ス',
 ',',
 '性',
 '別',
 ',',
 '年',
 '齢',
 ',',
 '誕',
 '生',
 '日',
 ',',
 '血',
 '液',
 '型',
 ',',
 '都',
 '道',
 '府',
 '県',
 ',',
 '電',
 '話',
 '番',
 '号',
 '\n',
 '土',
 '橋',
 ' ',
 '美',
 '幸',
 ',',
 'つ',
 'ち',
 'は',
 'し',
 ' ',
 'み',
 'ゆ',
 'き',
 ',',
 '_',
 '@',
 '.',
 ',',
 '女',
 ',',
 ',',
 '/',
 '/',
 ',',
 '型',
 ',',
 '千',
 '葉',
 '県',
 ',',
 '-',
 '-',
 '\n',
 '斎',
 '藤',
 ' ',
 '綾',
 '女',
 ',',
 'さ',
 'い',
 'と',
 'う',
 ' ',
 'あ',
 'や',
 'め',
 ',',
 '_',
 '@',
 '.',
 ',',
 '女',
 ',',
 ',',
 '/',
 '/',
 ',',
 '型',
 ',',
 '茨',
 '城',
 '県',
 ',',
 '-',
 '-',
 '\n',
 '宮',
 '沢',
 ' ',
 '愛',
 '子',
 ',',
 'み',
 'や',
 'ざ',
 'わ',
 ' ',
 'あ',
 'い',
 'こ',
 ',',
 '_',
 '@',
 '.',
 ',',
 '女',
 ',',
 ',',
 '/',
 '/',
 ',',
 '型',
 ',',
 '三',
 '重',
 '県',
 ',',
 '-',
 '-',
 '\n',
 '外',
 '山',
 ' ',
 '亮',
 ',',
 'そ',
 'と',
 'や',
 'ま',
 ' ',
 'り',
 'ょ',
 'う',
 ',',
 '_',
 '@',
 '.',
 ',',
 '男',
 ',',
 ',',
 '/',
 '/',
 ',',


### 「指定した単語のどれか」という指定

In [38]:
re.findall(r"(埼玉|新潟|香川)県", text, re.MULTILINE)

['新潟', '香川', '埼玉', '埼玉', '新潟', '埼玉', '新潟', '新潟', '新潟']

## 正規表現の応用

### 複数のメタキャラクタの利用

In [39]:
dates = """\
昭和53年10月31日
平成10年06月10日
令和02年01月21日
2020年07月24日
令和元年05月03日
2019年4月1日
'19年09月14日
"""

In [40]:
re.findall(r"..\d\d年\d\d月\d\d日", dates)

['昭和53年10月31日', '平成10年06月10日', '令和02年01月21日', '2020年07月24日']

### 任意の長さの文字列を表現

In [41]:
re.findall(r".+\d*年\d+月\d+日", dates)

['昭和53年10月31日',
 '平成10年06月10日',
 '令和02年01月21日',
 '2020年07月24日',
 '令和元年05月03日',
 '2019年4月1日',
 "'19年09月14日"]

### 固定の長さの文字列を表現

In [42]:
re.findall(r"\d{4}年\d{1,2}月\d{1,2}日", dates)

['2020年07月24日', '2019年4月1日']

### 先読み／後読み

#### 先読み（肯定先読み）

In [43]:
re.findall(r"山(?=形)", text)

['山']

#### 否定先読み

In [44]:
re.findall(r"山(?!形)", text)

['山', '山', '山', '山', '山', '山', '山', '山', '山', '山', '山']

#### 後読み（肯定後読み）

In [45]:
re.findall(r"(?<=東)京都", text)

['京都', '京都', '京都', '京都', '京都', '京都', '京都', '京都', '京都', '京都']

#### 否定後読み

In [46]:
re.findall(r"(?<!東)京都", text)

['京都']

#### 先読み／後読みの使いどころ

In [47]:
re.findall(r"福(?=岡)", text)

['福', '福', '福', '福']

In [48]:
text_replaced = re.sub(r"福(?=岡)", r"静", text)
print(text_replaced)

名前,ふりがな,メールアドレス,性別,年齢,誕生日,血液型,都道府県,電話番号
土橋 美幸,つちはし みゆき,tsuchihashi_miyuki@example.com,女,27,1992/12/25,O型,千葉県,046-863-1184
斎藤 綾女,さいとう あやめ,saitou_ayame@example.com,女,39,1981/8/8,B型,茨城県,022-741-5722
宮沢 愛子,みやざわ あいこ,miyazawa_aiko@example.com,女,57,1962/11/12,A型,三重県,031-630-9402
外山 亮,そとやま りょう,sotoyama_ryou@example.com,男,38,1982/6/4,AB型,北海道,093-790-9904
村松 照生,むらまつ てるお,muramatsu_teruo@example.com,男,36,1984/6/6,A型,高知県,052-207-6595
近藤 剛基,こんどう よしき,kondou_yoshiki@example.com,男,71,1948/9/27,O型,兵庫県,083-462-5184
西本 そら,にしもと そら,nishimoto_sora@example.com,女,25,1995/5/8,A型,岐阜県,099-112-5418
浅田 染五郎,あさだ そめごろう,asada_somegorou@example.com,男,33,1987/8/5,O型,東京都,091-686-6226
安永 花,やすなが はな,yasunaga_hana@example.com,女,67,1952/9/10,A型,岩手県,016-573-6314
矢田 洋,やだ よう,yada_you@example.com,男,71,1949/7/4,A型,鹿児島県,092-370-1148
小松 法嗣,こまつ ほうし,komatsu_houshi@example.com,男,50,1970/4/4,A型,新潟県,085-936-5065
仲田 明宏,なかた あきひろ,nakata_akihiro@example.com,男,66,1953/9/10,O型,東京都,055-435-1392
佐古 美智子,さこ みちこ,sako_michiko@example.com,女,27,1993/7/

### 部分置換

In [49]:
re.findall(r"(埼玉|新潟|香川)県", text)

['新潟', '香川', '埼玉', '埼玉', '新潟', '埼玉', '新潟', '新潟', '新潟']

In [50]:
text_replaced = re.sub(r"(埼玉|新潟|香川)県", r"\1都", text)
print(text_replaced)

名前,ふりがな,メールアドレス,性別,年齢,誕生日,血液型,都道府県,電話番号
土橋 美幸,つちはし みゆき,tsuchihashi_miyuki@example.com,女,27,1992/12/25,O型,千葉県,046-863-1184
斎藤 綾女,さいとう あやめ,saitou_ayame@example.com,女,39,1981/8/8,B型,茨城県,022-741-5722
宮沢 愛子,みやざわ あいこ,miyazawa_aiko@example.com,女,57,1962/11/12,A型,三重県,031-630-9402
外山 亮,そとやま りょう,sotoyama_ryou@example.com,男,38,1982/6/4,AB型,北海道,093-790-9904
村松 照生,むらまつ てるお,muramatsu_teruo@example.com,男,36,1984/6/6,A型,高知県,052-207-6595
近藤 剛基,こんどう よしき,kondou_yoshiki@example.com,男,71,1948/9/27,O型,兵庫県,083-462-5184
西本 そら,にしもと そら,nishimoto_sora@example.com,女,25,1995/5/8,A型,岐阜県,099-112-5418
浅田 染五郎,あさだ そめごろう,asada_somegorou@example.com,男,33,1987/8/5,O型,東京都,091-686-6226
安永 花,やすなが はな,yasunaga_hana@example.com,女,67,1952/9/10,A型,岩手県,016-573-6314
矢田 洋,やだ よう,yada_you@example.com,男,71,1949/7/4,A型,鹿児島県,092-370-1148
小松 法嗣,こまつ ほうし,komatsu_houshi@example.com,男,50,1970/4/4,A型,新潟都,085-936-5065
仲田 明宏,なかた あきひろ,nakata_akihiro@example.com,男,66,1953/9/10,O型,東京都,055-435-1392
佐古 美智子,さこ みちこ,sako_michiko@example.com,女,27,1993/7/

## 正規表現で入力値チェックを行なう

In [51]:
import re

rep = r'(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,}'
password1 = 'password'
password2 = 'pass'
password3 = 'Passw0rd'

print(f'{password1}：',end='')
if re.match(rep, password1) :
    print('パターンに合致しています。')
else:
    print('パターンに合致していません。')

print(f'{password2}：',end='')
if re.match(rep, password2) :
    print('パターンに合致しています。')
else:
    print('パターンに合致していません。')

print(f'{password3}：',end='')
if re.match(rep, password3) :
    print('パターンに合致しています。')
else:
    print('パターンに合致していません。')

password：パターンに合致していません。
pass：パターンに合致していません。
Passw0rd：パターンに合致しています。
