# 正規表現のたたき台

## 目的
- 自動敵にサンプル文字列から正規表現のたたき台をre.sub()で自動作成したい。

## 問題
- re.sub()を複数回実行すると変換済みの結果を再変換して想定通りの結果が得られない。

## 対策
- 仮変換を実施した後に、仮変換内容を変換し直すと重複した変換を回避できる。

In [1]:
# ブラケットやカッコの中の表現を抽出する正規表現を自動作成したい。
s = '[2021/4/25] The value changed from old(7) to new(8)!'

In [2]:
# 仮変内容を辞書に保管する。
d = {'\[([^\]]+)\]': '★★★ブラケット★★★',
     '\(([^\)]+)\)': '★★★カッコ★★★'}

In [3]:
# 仮変換を実行する。
import re
for k, v in d.items():
    s = re.sub(k, v, s)
print(s)

★★★ブラケット★★★ The value changed from old★★★カッコ★★★ to new★★★カッコ★★★!


In [4]:
# 最終変換を実行する。
for k, v in d.items():
    s = s.replace(v, k)
print(s)

\[([^\]]+)\] The value changed from old\(([^\)]+)\) to new\(([^\)]+)\)!


In [5]:
# 正規表現をテストする。
ptn = re.compile('\[([^\]]+)\] The value changed from old\(([^\)]+)\) to new\(([^\)]+)\)!')
m = ptn.match('[2021/4/25] The value changed from old(7) to new(8)!')
print(m.groups())

('2021/4/25', '7', '8')
