## Регулярные выражения в Python
В Python для работы с регулярными выращениям есть модуль re. Его нужно просто импортировать:


### Основы регулярных выражений

Регулярные выражения (Regex) – это строки, задающие шаблон для поиска определенных фрагментов в тексте. Помимо поиска, с помощью специальных Regex-шаблонов можно манипулировать текстовыми фрагментами – удалять и изменять подстроки частично или полностью.

Регулярные выражения состоят из набора литералов (букв и цифр) и метасимволов и выглядят примерно так:
```python
r'(https?://)?(www\.)?youtube\.(com|nl)/watch\?v=([\w-]+)(&.*?)?(?=[^-\w&=%])'
```
Используя метасимволы, можно создавать сложные шаблоны, содержащие специальные конструкции для работы с определенными последовательностями и группами символов.

Regex-выражения применяют для обработки текстовых данных, в том числе в скриптах для веб-скрапинга. Кроме того, Regex используют в составе OCR-приложений для очистки отсканированного текста.

Дополнительные конструкции позволяют сокращать регулярные выражения:

- `\d` — соответствует любой одной цифре и заменяет собой выражение `[0-9]`;  
- `\D` — исключает все цифры и заменяет `[^0-9]`;  
- `\w` — соответствует любой цифре, букве, а также знаку нижнего подчёркивания;  
- `\W` — любой символ кроме латиницы, цифр или нижнего подчёркивания;  
- `\s` — соответствует любому пробельному символу;  
- `\S` — описывает любой непробельный символ.

Для чего используются регулярные выражения:
- для определения нужного формата, например телефонного номера или email-адреса;
- для разбивки строк на подстроки;
- для поиска, замены и извлечения символов;
- для быстрого выполнения нетривиальных операций.

Синтаксис  таких выражений в основном стандартизирован, так что вам следует понять их лишь раз, чтобы использовать в любом языке программирования.


In [None]:
import re

Наиболее частые его функции:

```python
re.match()
re.search()
re.findall()
re.split()
re.sub()
re.compile()
```

### `re.search(pattern, string)`

Возвращает первое вхождение `pattern` в строку `string`

In [None]:
re.search('Н.', 'Ниф-Ниф Наф-Наф и Нуф-Нуф.')

### **`re.findall(pattern, string)`**
возвращает все вхождения `pattern` в строку `string`



In [None]:
re.findall('Н.', 'Ниф-Ниф Наф-Наф и Нуф-Нуф.')

### **`re.sub(pattern, repl, string, count=0, flags=0)`**
заменяет все вхождения `pattern` на `repl` в строке `string`

In [None]:
re.sub('Н.', '', 'Ниф-Ниф Наф-Наф и Нуф-Нуф.')

### **`re.compile(pattern, string)`**

In [None]:
re_obj = re.compile('Н.')

print(re_obj.search('Ниф-Ниф Наф-Наф и Нуф-Нуф'))
print(re_obj.findall('Ниф-Ниф Наф-Наф и Нуф-Нуф'))
print(re_obj.sub('', 'Ниф-Ниф Наф-Наф и Нуф-Нуф'))

### методы для результатов

In [None]:
re_obj = re.compile('(Ниф-Ниф)|(Наф-Наф)|(Н.ф-Н.ф)')
re_obj.findall('Ниф-Ниф Наф-Наф и Нуф-Нуф.')

In [None]:
result = re_obj.search('Ниф-Ниф Наф-Наф и Нуф-Нуф.')
result

In [None]:
result.start(), result.end(), result.span()

In [None]:
result.group()  # == result.group(0)

In [None]:
result.group(1), result.group(2), result.group(3)

In [None]:
repl = lambda x: x.group().upper()
re_obj.sub(repl, 'Ниф-Ниф Наф-Наф и Нуф-Нуф.')