## 正規表現の簡単な使い方


### 検索用データのダウンロード

In [None]:
with open("./dummy_txt/dummy.txt", encoding="utf-8") as f:
    text = f.read()

print(text)

### 「任意の1文字（この1文字は何でも良い）」という指定

In [None]:
import re
re.findall(r".", text)

In [None]:
re.findall(r"山.県", text)

### ドットは連続で入力可能

In [None]:
re.findall(r"和..県", text)

### 「行頭と行末にある文字」という指定

#### 行頭の場合

In [None]:
re.findall(r"福.", text)

In [None]:
re.findall(r"^福.", text, re.MULTILINE)

#### 行末の場合

In [None]:
re.findall(r"5976$", text, re.MULTILINE)

### 「任意の○文字」という指定

#### 文字数が固定の場合

In [None]:
re.findall(r"和.{2}県", text, re.MULTILINE)

#### 文字数が不定の場合

In [None]:
re.findall(r"^北.? .{2}", text, re.MULTILINE)

### 「この1文字が指定した文字のどれか」という指定

In [None]:
re.findall(r"[0-9]{3}-[0-9]{3}-[0-9]{4}", text)

### 「この1文字が指定した文字以外のどれか」という指定

In [None]:
re.findall(r"[^a-zA-Z0-9]", text)

### 「指定した単語のどれか」という指定

In [None]:
re.findall(r"(埼玉|新潟|香川)県", text, re.MULTILINE)

## 正規表現の応用

### 複数のメタキャラクタの利用

In [39]:
dates = """\
昭和53年10月31日
平成10年06月10日
令和02年01月21日
2020年07月24日
令和元年05月03日
2019年4月1日
'19年09月14日
"""

In [None]:
re.findall(r"..\d\d年\d\d月\d\d日", dates)

### 任意の長さの文字列を表現

In [None]:
re.findall(r".+\d*年\d+月\d+日", dates)

### 固定の長さの文字列を表現

In [None]:
re.findall(r"\d{4}年\d{1,2}月\d{1,2}日", dates)

### 先読み／後読み

#### 先読み（肯定先読み）

In [None]:
re.findall(r"山(?=形)", text)

#### 否定先読み

In [None]:
re.findall(r"山(?!形)", text)

#### 後読み（肯定後読み）

In [None]:
re.findall(r"(?<=東)京都", text)

#### 否定後読み

In [None]:
re.findall(r"(?<!東)京都", text)

#### 先読み／後読みの使いどころ

In [None]:
re.findall(r"福(?=岡)", text)

In [None]:
text_replaced = re.sub(r"福(?=岡)", r"静", text)
print(text_replaced)

### 部分置換

In [None]:
re.findall(r"(埼玉|新潟|香川)県", text)

In [None]:
text_replaced = re.sub(r"(埼玉|新潟|香川)県", r"\1都", text)
print(text_replaced)

## 正規表現で入力値チェックを行なう

In [None]:
import re

rep = r'(?=.*\d)(?=.*[a-z])(?=.*[A-Z]).{8,}'
password1 = 'password'
password2 = 'pass'
password3 = 'Passw0rd'

print(f'{password1}：',end='')
if re.match(rep, password1) :
    print('パターンに合致しています。')
else:
    print('パターンに合致していません。')

print(f'{password2}：',end='')
if re.match(rep, password2) :
    print('パターンに合致しています。')
else:
    print('パターンに合致していません。')

print(f'{password3}：',end='')
if re.match(rep, password3) :
    print('パターンに合致しています。')
else:
    print('パターンに合致していません。')