## 1. Поиск ИНН юрлица
Импортируем библиотеку **re** для работы с регулярными выражениями. Записываем небольшой корпус текстов в переменную для дальнейшей работы.

In [1]:
import re

In [11]:
corpus = [
    '1. Реквизиты компании: ИНН - 1234567890.',
    '2. ООО "Ромашка", инн: 0987654321',
    '3. Иванов И.И., ИНН 123456789012, тел. +7 9991234567.'
]

**Задание**
- Запишите одно или несколько регулярных выражений для поиска ИНН компании, то есть самого номера.
- Извлеките из корпуса все ИНН в список. Если в тексте нет ИНН компании, вывести False.

**Элементы синтаксиса регулярных выражений**
- **r''** - сырая текстовая строка, внутри кавычек пишется регулярное выражение
- **\d** - любая цифра
- **\w** - любой буквенный символ, цифра или _
- **\b** - граница слова
- **|** - оператор ИЛИ
- **[]** - взять любой символ в квадратных скобках
- **()** - взять символы в группу
- **{n}, {n,m}** - взять предшествующий символ или группу n раз, или от n до m раз
- **(?<=)** - positive look-behind, позволяет указать, что до целевого регулярного выражения должен идти определенный шаблон (шаблон пишем после знака =), сам шаблон не извлекается
- **\*** - взять предшествующий символ или группу 0 или более раз
- **\+** - взять предшествующий символ 1 или более раз
- **?** - предыдущий символ или группа может отсутствовать
- **\\** - экранирование символа, чтобы движок регулярок не считал его специальным. Например чтобы найти в тексте вопросительный знак, нужно в регулярном выражении написать \\?. Без обратного слеша это специальный символ (см. выше).
- **\N** - ссылка на группу, где N - порядковый номер группы в целевом регулярном выражении. Например нужно превратить строку ФОИ в строку ФИО:
```python
re.sub(r'(\w+) (\w+) (\w+)', r'\1 \3 \2', 'Пупкин Иванович Василий')
'Пупкин Василий Иванович'
```

**Некоторые методы библиотеки re**
* **re.compile(pattern)** - компиляция регулярного выражения. Записываем регулярное выражение в переменную.
* **re.search(pattern, string)** - поиск в тексте подстроки, которая соответствует шаблону регулярного выражения.
    * **pattern** - регулярное выражение
    * **string** - текст/строка

**Примеры регулярных выражений для поиска слова ИНН**
```python
inn = re.compile(r'[Ии][Нн][Нн]')
inn = re.compile(r'ИНН|инн')
inn = re.compile(r'[Ии]н{2}|Н{2}')
inn = re.compile(r'[Ии][Нн]{2}')
```

## 2. Извлечение никнейма пользователя и домена из данных email адресов

In [3]:
emails = """
    zuck26@facebook.com  
    page33@google.com  
    jeff42@amazon.com  
    vasiliy-pupkin@yandex.ru  
    N.Ponomareva@mail.ru  
    streetguy-88@rambler.ru  
"""  

**Задание**
- Запишите одно или несколько регулярных выражений для извлечения никнейма (подстрока до @) и домена (подстрока после @)
- Извлеките никнейм и домен из корпуса в произвольную структуру данных

**Для выполнения этого задания пригодится метод .findall()**
- **re.findall(pattern, string, flags)** - извлекает все вхождения, подходящие под шаблон регулярного выражения. На выходе - список.
    - **pattern** - регулярное выражение
    - **string** - текст/строка
    - **flags** - различные параметры, применяемые к работе функции
- **flags=re.IGNORECASE** - этот параметр позволяет не учитывать регистр

**Пример**

```python
>>> re.findall(r'\d\d', 'Встреча в 17:30, а ты подключился в 17:40.')
[17, 30, 17, 40]
```

**Подсказка**

Вам может пригодиться группировка с помощью ().

## 3. Удаление пунктуации из текста

In [None]:
sentence = """
    I am a very, very; irregular_sentence. And I'm another one!
    What ($) would you do with us? 
    #schoolchallenge
"""

**Задание**
- Очистить текст от знаков препинания и специальных символов.
- \* Очистить текст от знаков препинания и специальных символов без использования метода re.sub()

**Для выполнения задания может пригодиться метод re.sub()**
- **re.sub(pattern, repl, string)** - замена регулярного выражения на подстроку в данном тексте.
    - **pattern** - регулярное выражение, которое нужно заменить
    - **repl** - подстрока, на которую заменяем
    - **string** - текст/строка

**Пример замены символов**
```python
>>> re.sub(r'8', '+7', 'Вот мой рабочий телефон: 89991111111, и домашний: 84950000000')
'Вот мой рабочий телефон: +79991111111, и домашний: +74950000000'
```

## 4. Замена формата записи даты MM/DD/YYYY на формат DD.MM.YYYY

In [6]:
text = """
    Я влюбился в тебя 03/21/2017 23:45 по московскому времени...
    Но встретились мы только 05/16/2021 20:00, спустя 4 года.
"""

**Задание**
- Перевести дату из одного формата в другой
- Необязательно проверять, что дни могут быть только в диапазоне от 1 до 31, а месяцы от 1 до 12

**Подсказка** 

Используйте ссылки на группы в регулярном выражении.