# Регулярные выражения

In [2]:
import re

html = "Курс евро на сегодня 68,7514, курс евро на завтра 67,8901"

In [3]:
match = re.search(r'Евро\D+(\d+,\d+)', html, re.IGNORECASE)
rate = match.group(1)
rate

'68,7514'

In [4]:
match = re.search(r'Евро\D+(\d+,\d+)', html)
match is None

True

In [5]:
re.search(r'Евро.*(\d+,\d+)', html, re.IGNORECASE).group(1)

'7,8901'

In [6]:
re.search(r'Евро.*?(\d+,\d+)', html, re.IGNORECASE).group(1)

'68,7514'

In [7]:
re.findall(r'Евро\D+(\d+,\d+)', html, re.IGNORECASE)

['68,7514', '67,8901']

In [9]:
re.findall(r'Евро\D+\d+,\d+', html, re.IGNORECASE)

['евро на сегодня 68,7514', 'евро на завтра 67,8901']

In [10]:
re.findall(r'Евро\D+(\d+),(\d+)', html, re.IGNORECASE)

[('68', '7514'), ('67', '8901')]

In [11]:
re.findall(r'Евро\D+((\d+),(\d+))', html, re.IGNORECASE)

[('68,7514', '68', '7514'), ('67,8901', '67', '8901')]

In [12]:
html = """
Курс евро на сегодня (15 января)
68,7514"""

re.search(r'Евро\D+(\d+,\d+)', html, re.IGNORECASE).group(1)

AttributeError: 'NoneType' object has no attribute 'group'

In [13]:
re.search(r'Евро.*?(\d+,\d+)', html, re.IGNORECASE | re.DOTALL).group(1)

'68,7514'

# 👉🏻 [regex 101 .com](https://regex101.com/)

In [14]:
text = '''
Автомобиль с номером A123BC77 подрезал автомобиль
K654HE197, спровоцировав ДТП с участием еще двух
иномарок с номерами M542OP777 и O007OO77
'''

In [15]:
pattern = r'[ABEKMHOPCTYX]\d{3}[ABEKMHOPCTYX]{2}\d{2,3}'
re.findall(pattern, text)

['A123BC77', 'K654HE197', 'M542OP777', 'O007OO77']

### Проверка на корректность

In [16]:
nicknames = ['sU3r_h4XXor', 'alёna', 'ivan ivanovich']

reg = re.compile(r'\w+')

In [17]:
for nick in nicknames:
    print('{} nickname: {}'.format(
        'valid' if reg.match(nick) else 'invalid',
        nick
    ))

valid nickname: sU3r_h4XXor
valid nickname: alёna
valid nickname: ivan ivanovich


In [18]:
reg = re.compile(r'^\w+$', re.ASCII)

for nick in nicknames:
    print('{} nickname: {}'.format(
        'valid' if reg.match(nick) else 'invalid',
        nick
    ))

valid nickname: sU3r_h4XXor
invalid nickname: alёna
invalid nickname: ivan ivanovich


In [19]:
text = (
    'Анна и Лена загорали на берегу океана, '
    'когда к ним подошли Яна и Ильнар'
)

In [20]:
re.findall(r'[А-Я]\w*на', text)

['Анна', 'Лена', 'Яна', 'Ильна']

In [21]:
re.findall(r'[А-Я]\w*на\b', text)

['Анна', 'Лена', 'Яна']

In [23]:
text = (
    'Анна и Лена загорали на берегу океана, '
    'когда к ним подошли Яна и ПОЛИНА, и Ильнар'
)

In [24]:
re.findall(r'[А-Я]\w*(?:на|НА)\b', text)

['Анна', 'Лена', 'Яна', 'ПОЛИНА']

In [28]:
text = "Как защитить металл от процесса коррозии?"

In [29]:
re.findall(r'(\w)\1', text)

['л', 'с', 'р', 'и']

In [30]:
re.sub(r'а', '?', text)

'К?к з?щитить мет?лл от процесс? коррозии?'

In [31]:
re.sub(r'(\w)\1', lambda r: r.group(0).upper(), text)

'Как защитить метаЛЛ от процеССа коРРозИИ?'

In [32]:
re.sub(r'\b(\w*(\w)\2\w*)\b', r'[\1]', text)

'Как защитить [металл] от [процесса] [коррозии]?'