## Регулярные выражения

![image.png](attachment:image.png)

Регулярные выражения являются мощным инструментом для работы с текстовыми данными. Они позволяют искать и извлекать информацию из строк на основе заданных шаблонов. Мотивация использования регулярных выражений включает поиск, замену, валидацию и извлечение данных из текста. Такие задачи, как проверка правильности формата email-адреса, поиск всех ссылок в веб-странице или извлечение номеров телефонов из текстового документа, могут быть эффективно решены с помощью регулярных выражений.


***Регулярные выражения (RegEx)*** – это инструмент для поиска, сравнения, замены и проверки строк по заданному шаблону.  
Регулярные выражения используются для:  
* ***Поиска текста по шаблону*** (например, найти все email-адреса в документе).
* ***Проверки формата строки*** (например, соответствует ли телефонный номер формату +1 (999) 123-45-67).
* ***Замены текста*** (например, изменить все даты из формата 01-02-2025 в 01.02.2025).
* ***Разделения строк*** (например, разбить строку по нескольким пробелам или запятым).

### Где применяются регулярные выражения?
* **Обработка данных** – фильтрация, поиск и замена информации в текстах и файлах.
* **Формы ввода** – валидация email, номеров телефонов, паролей.
* **Парсинг текста** – извлечение нужных данных из веб-страниц, логов, документов.
* **Поиск в коде** – нахождение и рефакторинг кода в редакторах и IDE.


### Модуль re
Модуль re предоставляет инструменты для работы с регулярными выражениями.  
**Подключение модуля:**

In [2]:
import re

Основные функции модуля re:
* `re.search(pattern, string)` – ищет первое совпадение шаблона в строке.
* `re.match(pattern, string)` – проверяет, начинается ли строка с шаблона.
* `re.findall(pattern, string)` – возвращает список всех совпадений.
* `re.finditer(pattern, string)` – возвращает итератор с совпадениями.
* `re.sub(pattern, repl, string)` – заменяет найденные совпадения.
* `re.split(pattern, string)` – разделяет строку по шаблону.

#### Функция findall
Функция `re.findall()` ищет все совпадения шаблона в строке и возвращает их в виде списка.  
**Синтаксис:**  
`re.findall(pattern, string)`  
* pattern – регулярное выражение (шаблон поиска).
* string – строка, в которой выполняется поиск.


In [40]:
#Пример: Поиск всех чисел в строке
import re

text = "Python 3.9, Java 17, C++ 14"

numbers = re.findall(r"\d+", text)  # Поиск всех чисел
print(numbers)


['3', '9', '17', '14']


## Основные символы в регулярных выражениях
Регулярные выражения используют специальные символы для поиска букв, цифр, пробелов и других элементов текста.


#### Обозначения основных символов

![image.png](attachment:1f8993f9-136d-4a1b-b838-b73e70cbb05c.png)

In [41]:
text = "\tPython 3.12, Java 17, C++ 14!\n"


In [44]:
#print("Цифры:", re.findall(r"\d", text))
print("Двузначные цифры:", re.findall(r"\d\d", text))

Двузначные цифры: ['12', '17', '14']


In [45]:
print("НЕ цифры:", re.findall(r"\D", text))

НЕ цифры: ['\t', 'P', 'y', 't', 'h', 'o', 'n', ' ', '.', ',', ' ', 'J', 'a', 'v', 'a', ' ', ',', ' ', 'C', '+', '+', ' ', '!', '\n']


In [46]:
print("Буквы, цифры, _:", re.findall(r"\w", text))

Буквы, цифры, _: ['P', 'y', 't', 'h', 'o', 'n', '3', '1', '2', 'J', 'a', 'v', 'a', '1', '7', 'C', '1', '4']


In [47]:
print("НЕ буквы, цифры, _:", re.findall(r"\W", text))

НЕ буквы, цифры, _: ['\t', ' ', '.', ',', ' ', ' ', ',', ' ', '+', '+', ' ', '!', '\n']


In [48]:
print("Пробелы:", re.findall(r"\s", text))

Пробелы: ['\t', ' ', ' ', ' ', ' ', ' ', '\n']


In [49]:
print("НЕ пробелы:", re.findall(r"\S", text))

НЕ пробелы: ['P', 'y', 't', 'h', 'o', 'n', '3', '.', '1', '2', ',', 'J', 'a', 'v', 'a', '1', '7', ',', 'C', '+', '+', '1', '4', '!']


In [50]:
print("Все символы (кроме \\n):", re.findall(r".", text))

Все символы (кроме \n): ['\t', 'P', 'y', 't', 'h', 'o', 'n', ' ', '3', '.', '1', '2', ',', ' ', 'J', 'a', 'v', 'a', ' ', '1', '7', ',', ' ', 'C', '+', '+', ' ', '1', '4', '!']


In [None]:
#Примеры:

text = "\tPython 3.12, Java 17, C++ 14!\n"

print("Цифры:", re.findall(r"\d", text))
print("Двузначные цифры:", re.findall(r"\d\d", text))

print("НЕ цифры:", re.findall(r"\D", text))

print("Буквы, цифры, _:", re.findall(r"\w", text))

print("НЕ буквы, цифры, _:", re.findall(r"\W", text))

print("Пробелы:", re.findall(r"\s", text))

print("НЕ пробелы:", re.findall(r"\S", text))

print("Все символы (кроме \\n):", re.findall(r".", text))


#### Символ 'r' перед строкой шаблона
В регулярных выражениях **используется много специальных символов**, таких как \d, \w, \s и другие.  
Python обрабатывает \ **(обратный слэш) как управляющий символ**, из-за чего могут возникнуть ошибки.  
Чтобы избежать этого, перед строкой **рекомендуется ставить** r **("сырая" строка, raw string)**.  


In [5]:
dir = r'c:\test\test.txt'
print(dir)

c:\test\test.txt


In [55]:
#Пример: Если не использовать r:
pattern = r"\d"  # ОШИБКА: \d будет воспринято как управляющий символ
print(re.findall(pattern, "Price: 123"))


['1', '2', '3']


#### Классы символов
Классы символов ([]) используются для **поиска любого из указанных символов**.
Они позволяют задать **набор символов**, который должен встречаться в искомом фрагменте.  
Внутри [] можно использовать:
* `-` (дефис) для указания диапазона символов (например, [a-z] — все буквы от a до z).
* `^` (каретку) в начале для исключения символов (например, [^0-9] — всё, кроме цифр).


#### Обозначения классов символов

![image.png](attachment:efd54a9b-afdb-40a9-bbbd-9d59d7563ac8.png)

In [64]:
text = "Report, report, report2, report10"


# print("Буквы r или R в слове:", re.findall(r"[rR]eport", text))

# print("Все цифры:", re.findall(r"[0-9]", text))

# print("Заглавные буквы:", re.findall(r"[A-Z]", text))

# print("Строчные буквы:", re.findall(r"[a-z]", text))

# print("Все буквы:", re.findall(r"[a-zA-Z]", text))

print("Все, кроме цифр:", re.findall(r"[^0-9]", text))


Все, кроме цифр: ['R', 'e', 'p', 'o', 'r', 't', ',', ' ', 'r', 'e', 'p', 'o', 'r', 't', ',', ' ', 'r', 'e', 'p', 'o', 'r', 't', ',', ' ', 'r', 'e', 'p', 'o', 'r', 't']


### Квантификаторы
Квантификаторы в регулярных выражениях определяют количество повторений символов или групп.
Они позволяют указывать, сколько раз подряд должен встречаться символ или шаблон.


#### Обозначения квантификаторов

![image.png](attachment:2276f803-93aa-4dc5-9790-192cd93dafe3.png)
![image.png](attachment:d3402d94-60c8-4fb2-bf06-df94afa87524.png)

In [71]:
text = """
Orders: ID123, ID4567, ID89
Numbers: 123-45-67, 321-45-67
Prices: 100$, 199.50$, 99.99€, 0.49€, .99€
File names: report.txt, report2.txt, report10.txt
"""

# print("Одна или более цифр:", re.findall(r"\d+", text))

# print("Телефонные номера (формата xxx-xx-xx):", re.findall(r"\d{3}-\d{2}-\d{2}", text))

# print("Цены (числа с десятичной точкой):", re.findall(r"\d+\.\d+", text))

# print("ID-коды:", re.findall(r"ID\d{2,}", text))

# print("Имена файлов 0+ цифр:", re.findall(r"report\d*.txt", text))

# print("Имена файлов 0/1 цифр:", re.findall(r"report\d?.txt", text))

print("Имена файлов 1/2 цифр:", re.findall(r"report\d{1,2}.txt", text))


Имена файлов 1/2 цифр: ['report2.txt', 'report10.txt']


### Жадные и ленивые квантификаторы
Квантификаторы (*, +, {n,m}) по умолчанию работают **жадно** – они стараются захватить как можно **больше символов**.  
Но иногда нужно, чтобы они захватывали **минимально возможное** количество символов – в этом случае используются ленивые квантификаторы.  
Чтобы сделать квантификатор **ленивым**, нужно добавить `?` после него.


#### Обозначения жадных и ленивых квантификаторов

![image.png](attachment:90ef6513-fb67-4da0-b5bd-943dc034f113.png)

In [72]:
text = "<div>Hello</div><div>World</div>"

greedy = re.findall(r"<.*>", text)  # Жадный
lazy = re.findall(r"<.*?>", text)   # Ленивый

print(greedy)
print(lazy)


['<div>Hello</div><div>World</div>']
['<div>', '</div>', '<div>', '</div>']


```
Сопоставь шаблон с тем, что он найдёт:
\d+
[a-zA-Z0-9]+
\s+
[^a-zA-Z0-9]+
a) Несколько подряд идущих пробелов
b) Последовательность букв и цифр
c) Последовательность цифр
d) Последовательность НЕ букв и НЕ цифр
```

In [None]:
#Найди ошибку в шаблоне:

re.findall("\d+", "Value: 123")


### Cпециальные символы
**Экранирование специальных символов**  
В регулярных выражениях есть **символы, которые имеют особое значение** (. + * {} [] () | ^ $).  
Если нужно **найти их как обычные символы**, их **нужно экранировать**, добавляя \ перед символом.


In [73]:
text = "report.txt, report2.txt, report10.txt, some_txt_report, some_report_txt, reports\\report.txt, report2.txt"

print("Имена файлов с txt:", re.findall(r"\w+.txt", text))



Имена файлов с txt: ['report.txt', 'report2.txt', 'report10.txt', 'some_txt', 'some_report_txt', 'report.txt', 'report2.txt']


In [74]:
# Имена файлов с расширением .txt
print("Имена файлов с расширением .txt:", re.findall(r"\w+\.txt", text))



Имена файлов с расширением .txt: ['report.txt', 'report2.txt', 'report10.txt', 'report.txt', 'report2.txt']


In [75]:
# Имена файлов в папке
print("Имена файлов в папке:", re.findall(r"\w+\\\w+\.\w+", text))

Имена файлов в папке: ['reports\\report.txt']


### Якоря
**Якоря используются в регулярных выражениях для указания позиции совпадения в строке.  
Они не ищут символы, а определяют, где именно должен находиться искомый фрагмент.


#### Обозначения якорей


![image.png](attachment:54181302-108f-466b-a69d-53b2da098571.png)

In [80]:
text = "Hello world! Welcome to world"

# print("Слово в начале строки:", re.findall(r"^\w+", text))
# print("Слово в конце строки:", re.findall(r"\w+$", text))


text2 = "category wildcat education _cat_ catalog"

# print("Слова с 'cat' внутри:", re.findall(r"\w+cat\w+", text2))
# print("Слова с 'cat' в начале слов:", re.findall(r"\bcat\w*", text2))
# print("Слова с 'cat' в конце слов:", re.findall(r"\w*cat\b", text2))

text3 = "X123X 234 4567X X999"
print("Числа внутри строк:", re.findall(r"\B\d+\B", text3))


Числа внутри строк: ['123', '3', '567', '99']


### Альтернативы
Оператор | (ИЛИ) позволяет искать один из нескольких вариантов.


In [81]:
text = "Meeting on 2024-05-10 or 10/05/2024 at 14:30"

# Найдём даты в формате YYYY-MM-DD или DD/MM/YYYY
print("Даты:", re.findall(r"\d{4}-\d{2}-\d{2}|\d{2}/\d{2}/\d{4}", text))


Даты: ['2024-05-10', '10/05/2024']


### Группы
Группы (()) используются для объединения нескольких символов в одну логическую часть.  
Они позволяют извлекать части совпадений, применять квантификаторы к целым выражениям и работать с подстроками отдельно.



***Пример: Извлечение данных с помощью групп***  
Функция re.search() и re.match() позволяют доступ к частям совпадений через group().


In [7]:
import re

text = "Order ID: 12345, Invoice No: 67890"

# Найдём ID заказа и счёта
match = re.search(r"Order ID: (\d+), Invoice No: (\d+)", text)


if match:
    print("ID заказа:", match.group(1))
    print("Номер счёта:", match.group(2))


ID заказа: 12345
Номер счёта: 67890


***Пример: Использование негруппирующих скобок***  
Если группа нужна для логики, но не для извлечения данных, можно использовать `(?:...)`.


In [8]:
text = "USD 100, EUR 200, GBP 300"

# # Найдём суммы, не выделяя валюту
matches = re.findall(r"(?:USD|EUR|GBP) (\d+)", text)
print("Суммы:", matches)

# # Найдём суммы и валюту
# matches = re.findall(r"(USD|EUR|GBP) (\d+)", text)
# print("Суммы:", matches)


Суммы: ['100', '200', '300']


In [9]:
sum(map(int,matches))

600

In [None]:


r'\d{4}[- ]?\d{4}[- ]?\d{4}[- ]?\d{4}'

r'(\d{4}[- ]?){3}\d{4}'

### Синтаксис регулярных выражений 
Синтаксис регулярных выражений опирается на специальные символы и конструкции.

![image.png](attachment:image.png)

# Функции модуля re
### Функция `re.match`
Функция `re.match()` проверяет, начинается ли строка с заданного шаблона.
Если совпадение найдено, функция возвращает объект Match, который содержит информацию о совпадении, иначе None.
### Объект Match
Объект Match содержит информацию о найденном фрагменте, включая:
* .group() – само совпадение.
* .start() – индекс начала совпадения.
* .end() – индекс конца совпадения.
* .span() – кортеж (start, end), показывающий границы совпадения.


In [10]:

text = "ID12345 is confirmed. ID23456 is confirmed"

# Проверяем, начинается ли строка с "ID" + цифры
match = re.match(r"ID\d+", text)

if match:
    print("Объект Match:", match)
    print("Само совпадение:", match.group())
    print("Диапазон совпадения:", match.span())
else:
    print("Нет совпадения.")


Объект Match: <re.Match object; span=(0, 7), match='ID12345'>
Само совпадение: ID12345
Диапазон совпадения: (0, 7)


### Функция re.search
Функция re.search() ищет первое совпадение регулярного выражения в любой части строки и возвращает объект Match.


In [11]:
text = "Order ID: 12345, Invoice No: 67890, Ref: ABC9876"

# Найдём первое число в тексте
match = re.search(r"\d+", text)

if match:
    print("Объект Match:", match)
    print("Само совпадение:", match.group())
    print("Индекс начала:", match.start())
    print("Индекс конца:", match.end())
    print("Диапазон совпадения:", match.span())
else:
    print("Нет совпадения.")


Объект Match: <re.Match object; span=(10, 15), match='12345'>
Само совпадение: 12345
Индекс начала: 10
Индекс конца: 15
Диапазон совпадения: (10, 15)


### Флаг re.IGNORECASE
Флаг re.IGNORECASE (или сокращённо re.I) делает поиск регистронезависимым — шаблон будет находить совпадения в любом регистре, даже если написан в нижнем или верхнем.


In [12]:
text = "Python is popular."

# Найдём слово "python" без учёта регистра
match = re.search(r"python", text, re.IGNORECASE)

if match:
    print("Найдено:", match.group())


Найдено: Python


### Функция re.finditer
Функция `re.finditer()` ищет все совпадения регулярного выражения в строке и возвращает итератор объектов Match.


In [13]:
text = "Order ID: 12345, Invoice No: 67890, Ref: ABC9876"

# Найдём все числа в тексте
matches = re.finditer(r"\d+", text)

for match in matches:
    print("Объект Match:", match)
    print("Само совпадение:", match.group())
    print("Диапазон совпадения:", match.span())
    print()


Объект Match: <re.Match object; span=(10, 15), match='12345'>
Само совпадение: 12345
Диапазон совпадения: (10, 15)

Объект Match: <re.Match object; span=(29, 34), match='67890'>
Само совпадение: 67890
Диапазон совпадения: (29, 34)

Объект Match: <re.Match object; span=(44, 48), match='9876'>
Само совпадение: 9876
Диапазон совпадения: (44, 48)



### Функция re.split
Функция `re.split()` разделяет строку на части, используя регулярное выражение как разделитель.  
Она работает аналогично str.split(), но позволяет разбивать текст по сложным шаблонам, а не только по одному символу.


In [14]:
text = """Python is popular. It is used in web development, data science, 
and automation. Many developers choose Python for its simplicity."""

# Разделяем строку по запятым, пробелам и точкам
words = re.split(r"[,\s.]+", text)

print("Список слов:", words)


Список слов: ['Python', 'is', 'popular', 'It', 'is', 'used', 'in', 'web', 'development', 'data', 'science', 'and', 'automation', 'Many', 'developers', 'choose', 'Python', 'for', 'its', 'simplicity', '']


### Функция re.sub
Функция `re.sub()` заменяет все найденные совпадения на указанную строку или результат функции.  
Это полезно для форматирования текста, удаления лишних символов и исправления данных.  
*Синтаксис:*  
`re.sub(pattern, repl, string)`  

* pattern – шаблон для поиска.
* repl – строка, на которую будет заменено совпадение.
* string – исходный текст.


In [15]:
text = "apple,   banana ,  orange ,grape"

# Удаляем лишние пробелы перед и после запятых
clean_text = re.sub(r"\s*,\s*", ", ", text)

print("Отформатированный текст:", clean_text)


Отформатированный текст: apple, banana, orange, grape


# Практические задания
1. Проверка пароля
Реализуйте программу, которая должна проверить, соответствует ли введённый пароль следующим требованиям:
* Минимум 8 символов
* Есть хотя бы одна заглавная буква
* Есть хотя бы одна строчная буква
* Есть хотя бы одна цифра
  
***Пример вывода:***  
Введите пароль: Pass1234   
Пароль надёжен.  

`---`  

Введите пароль: k2n6bd7    
Пароль не соответствует требованиям.

In [17]:
password = input("Введите пароль: ")

import re

if (re.search(r"[A-Z]", password) and
    re.search(r"[a-z]", password) and
    re.search(r"\d", password) and
    len(password) >= 8):
    print("Пароль надёжен.")
else:
    print("Пароль не соответствует требованиям.")


Введите пароль:  sfdghdafge657846


Пароль не соответствует требованиям.


2. ***Извлечение IP-адресов***  
Программа должна найти все IPv4-адреса в строке.  
IPv4-адрес состоит из четырёх чисел от 0 до 255, разделённых точками.  
**Данные:**  
`text = "Server1: 192.168.1.1, Server2: 10.0.0.254, Invalid: 999.123.456.78"`  
Пример вывода:  
`192.168.1.1`  
`10.0.0.254`


In [18]:
import re

text = "Server1: 192.168.1.1, Server2: 10.0.0.254, Invalid: 999.123.456.78"

pattern = r"\b(?:[0-9]{1,3}\.){3}[0-9]{1,3}\b"
candidates = re.findall(pattern, text)

# Фильтруем корректные IP (0–255)
valid_ips = [ip for ip in candidates if all(0 <= int(part) <= 255 for part in ip.split("."))]

for ip in valid_ips:
    print(ip)


192.168.1.1
10.0.0.254


#### Еще задачи

In [None]:
# найдем идентификаторы пользователей в тексте
msg = 'Найди все идентификаторы пользователей: id4567, id4653456, id46112, id111'

In [None]:
re.findall(r'\bid\d+', msg) #поиск всех слов и представление их как список

In [None]:
dir = r'C:\Admin\text.txt'# row string
print(dir)

In [None]:
# Найдем хэштеги в твите
tweet = 'Читаю статью #wikiHow об использовании #хэштегов с #Twitter'

In [None]:
re.findall(r'#\w+', tweet)

In [None]:
#найдем все трехбуквенные слова
import re

pattern = r"\b\w{3}\b"
text = "Hello, how are you?"

result = re.findall(pattern, text)
print(result)  # ['how', 'are', ‘you’]


In [None]:
# необходимо из строки с условными датами вытащить их
registration = 'Date of start: 4-12. Date of registration: 20-21'

In [None]:
re.findall(r'\d{1,2}-\d{1,2}', registration)

In [None]:
# вытащим номера телефонов из текста
phone_numbers = 'Мария: 8888-342-23-32 Александр: 8-432-23-67'

In [None]:
phone_pattern =r'\d{1}-\d{3}-\d{2}-\d{2}'

In [None]:
re.findall(phone_pattern, phone_numbers)

In [None]:
# Свалидируем дату
date = 'jhbf 1st november 2022 08:15 text okasjdbf sdfjoi'

In [None]:
re.findall(r'\d{1,2}\w{2}\s\w+\s\d{4}\s\d{1,2}:\d{1,2}',date)

In [None]:
# Посчитаем количество лайков и репостов по всем сообщениям
messages = ['Надоел дождь! Лайков: 12, Репостов: 3', 'Замечательная физиономия! Лайков: 14, Репостов: 22']

In [None]:
msg = 'Надоел дождь! Лайков: 12, Репостов: 3'
likes_pattern=r'Лайков:\s\d+'
print(re.findall(likes_pattern,msg))

In [None]:
likes=0
repost=0
likes_pattern=r'Лайков:\s\d+'
repost_pattern=r'Репостов:\s\d+'

for msg in messages:
    if re.findall(likes_pattern,msg):
        likes+=int(re.findall(r'\d+',re.findall(likes_pattern,msg)[0])[0])# ['5']  ['Лайков: 5'] --> re.findall(likes_pattern,msg)[0]
    if re.findall(repost_pattern,msg):
        repost+=int(re.findall(r'\d+',re.findall(repost_pattern,msg)[0])[0])
likes,repost

In [None]:
# search ищет по всей строке, а match только в начале
text = """Когда начинающий аналитик «приходит» к этому, возникает вопрос: какой язык программирования учить, 
чтобы повысить эффективность работы? Популярный вариант в этой среде — Python.
И в этом курсе мы решили разобраться, почему аналитики выбирают именно его. Python"""

result = re.search(r'Python', text)
print('Нашел' if result else 'Не нашел')

In [None]:
re.search(r'Python', text)

In [None]:
result = re.match(r'Python', text)
print('Нашел' if result else 'Не нашел')

In [None]:
# re.sub(): Заменяет совпадения на указанный текст.

In [None]:
text = "Hello, World!"
new_text = re.sub(r"World", "Python", text)  # "Hello, Python!"
new_text

Регулярные выражения позволяют группировать результаты с помощью круглых скобок (...), чтобы извлекать отдельные части совпадений или использовать их для замены. 
Обратные ссылки позволяют ссылаться на группы символов, найденных ранее в выражении. 

Пример:

\1 ссылается на первую группу символов

\2 - на вторую и так далее


In [None]:
# переведем даты к другому формату при помощи групп
date = '08/30/1991'
re.sub(r'(\d\d)/(\d\d)/(\d{4})', r'\2.\1.\3', date)

In [None]:
flight = 'Boarding pass: LA4214 AER-CDB 06NOV'
regex_flight = r'([A-Z]{2})(\d{4})\s([A-Z]{3})-([A-Z]{3})\s(\d{2}[A-Z]{3})'

In [None]:
flight_result = re.findall(regex_flight, flight)
flight_result

In [None]:
# Извлечение даты из текста
text = "Дата: 2023-10-05"
date_pattern = re.compile(r"(\d{4})-(\d{2})-(\d{2})")
match = date_pattern.search(text)
if match:
    print(f"Год: {match.group(1)}, Месяц: {match.group(2)}, День: {match.group(3)}")
# Вывод: Год: 2023, Месяц: 10, День: 05

In [None]:
pattern = r"(\b\w+)\s\1"
text = "hello hello world world"

result = re.findall(pattern, text)
print(result)  # ['hello', 'world']

replaced_text = re.sub(pattern, r"\1", text)
print(replaced_text)  # hello world


In [None]:
replaced_text = re.sub(pattern, r"\1", text)  # Результат: "hello world"
replaced_text

### Полезные материалы
1. Python RegEx: практическое применение регулярок https://tproger.ru/translations/regular-expression-python/
2. Регулярные выражения в Python от простого к сложному. Подробности, примеры, картинки, упражнения https://habr.com/ru/articles/349860/ 

### Вопросы для закрепления
1. Что означают точка, плюсик и звездочка в регулярных выражениях?
2. Какие вы запомнили конструкции для групп символов?
3. В чем отличие re.match(), re.search(), re.findall()?


### Полезные сайты
Чтобы быстрее разбираться с шаблонами и экспериментировать с ними, можно использовать специальные онлайн-инструменты. Они позволяют:
* Проверять регулярные выражения в реальном времени
* Подсвечивать совпадения в строках
* Пошагово объяснять работу каждого элемента шаблона
* Использовать синтаксис разных языков (включая Python)
* Сохранять и делиться шаблонами
* Обращаться к встроенной справке и примерам  
Наиболее удобные из них:  
`regex101.com`  
`regexr.com`
