In [47]:
s1 = """Добрый день!

Ниже приведены пять адресов электронной почты, которые могут пригодиться для связи:

1. joindoe@example.com
2. sarah_223@hotmail.com
3. mike.smith@mail.ru
4. anna.stefanova@gmail.com
5. peter.eckhardt@outlook.com

Будьте уверены, что все эти адреса точны и действительны для использования.

С наилучшими пожеланиями,
Ваш Мерген"""

s2 = "mike.smith@mail.ru"
s3 = "не почта"

email_regex1 = r'[\w\.]+@[\w\.]+\.[a-z]{2,20}'
email_regex2 = r'([\w\.]+)@([\w\.]+)(\.[a-z]{2,20})' # с группами (фрагментами)

In [32]:
import re


## Хотим понять, является ли строка целиком почтой

In [33]:
m1 = re.match(email_regex1, s1)
print(m1) # если совпадения нет, то получаем None

m2 = re.match(email_regex1, s2)
print(m2)

if m1 is None:
    print('s1 это не почта')

if m2:
    print(s2, 'Это почта')

None
<re.Match object; span=(0, 18), match='mike.smith@mail.ru'>
s1 это не почта
mike.smith@mail.ru Это почта


Теперь то же самое, но с группами (фрагментами)

In [39]:
m2 = re.match(email_regex2, s2)
print(m2)

if m2:
    print(s2, ' - это почта')

    print(m2.group(0)) # вся строка целиком r'([\w\.]+)@([\w\.]+)(\.[a-z]{2,20})'
    print(m2.group(1)) # первая пара скобок
    print(m2.group(2)) # вторая пара скобок
    print(m2.group(3)) # третья пара скобок

<re.Match object; span=(0, 18), match='mike.smith@mail.ru'>
mike.smith@mail.ru  - это почта
mike.smith@mail.ru
mike.smith
mail
.ru


## Хотим найти первую почту в тексте

In [41]:
m5 = re.search(email_regex1, s1)

if m5:
    print(m5)
    print(m5.group(0))

<re.Match object; span=(102, 121), match='joindoe@example.com'>
joindoe@example.com


## Хотим найти все совпадения в тексте

In [42]:
emails1 = re.findall(email_regex1, s1)

print(emails1) # просто список строк

['joindoe@example.com', 'sarah_223@hotmail.com', 'mike.smith@mail.ru', 'anna.stefanova@gmail.com', 'peter.eckhardt@outlook.com']


In [43]:
emails2 = re.findall(email_regex2, s1)

print(emails2)

[('joindoe', 'example', '.com'), ('sarah_223', 'hotmail', '.com'), ('mike.smith', 'mail', '.ru'), ('anna.stefanova', 'gmail', '.com'), ('peter.eckhardt', 'outlook', '.com')]


## Хотим заменить все имейлы в тексте на ***

In [45]:
s3_censored = re.sub(email_regex1, '***', s1) # str.replace(), но с регулярками
print(s3_censored)

Добрый день!

Ниже приведены пять адресов электронной почты, которые могут пригодиться для связи:

1. ***
2. ***
3. ***
4. ***
5. ***

Будьте уверены, что все эти адреса точны и действительны для использования.

С наилучшими пожеланиями,
Ваш Мерген


## Хотим разделить строку наподобие split, но не по конкретному символу

In [46]:
s4 = '123|name;234566,5567657.234;5656'
cells = re.split(r'[|,;]', s4)
print(cells)

['123', 'name', '234566', '5567657.234', '5656']


## Про Флаги

In [52]:
s5 = """Добрый день!

Ниже приведены пять адресов электронной почты, которые могут пригодиться для связи:

1. joindoe@example.com
2. sarah_223@hotmail.com
3. mike.smith@mail.RU
4. anna.stefanova@gmail.com
5. peter.eckhardt@outlook.com
6. User@gmail.com
7. менеджер@специалист.рф

Будьте уверены, что все эти адреса точны и действительны для использования.

С наилучшими пожеланиями,
Ваш Мерген"""

email_regex3 = r'[\w\.]+@[\w\.]+\.[\w]{2,20}'
email_regex4 = r'([a-z_\.]+)@([a-z_\.]+)(\.[a-z]{2,20})'

In [56]:
emails3 = re.findall(email_regex1, s5, flags=re.I) # re.IGNORECASE
print(emails3)

emails4 = re.findall(email_regex3, s5, flags=re.U) # re.UNICODE
print(emails4)

emails4 = re.findall(r'([a-zа-я_\.]+)@([a-zа-я_\.]+)(\.[a-zа-я]{2,20})', s5, flags=re.U) # re.UNICODE
print(emails4)

['joindoe@example.com', 'sarah_223@hotmail.com', 'mike.smith@mail.RU', 'anna.stefanova@gmail.com', 'peter.eckhardt@outlook.com', 'User@gmail.com']
['joindoe@example.com', 'sarah_223@hotmail.com', 'mike.smith@mail.RU', 'anna.stefanova@gmail.com', 'peter.eckhardt@outlook.com', 'User@gmail.com', 'менеджер@специалист.рф']
[('joindoe', 'example', '.com'), ('anna.stefanova', 'gmail', '.com'), ('peter.eckhardt', 'outlook', '.com'), ('ser', 'gmail', '.com'), ('менеджер', 'специалист', '.рф')]
