# Регулярные выражения

**Документация и ссылки:**
- Оригинальная ссылка на хабр: https://habr.com/ru/articles/349860/#Primery_regulyarnyh_vyrazheniy
- Оригинальная документация: https://docs.python.org/3/library/re.html
- Очень подробный и обстоятельный материал: https://www.regular-expressions.info/
- Разные сложные трюки и тонкости с примерами: http://www.rexegg.com/
- Онлайн отладка регулярок: https://regex101.com (не забудьте поставить галочку Python в разделе "Flavor" слева)
- Онлайн визуализация регулярок: https://www.debuggex.com/ (не забудьте выбрать Python)
- Могущественный текстовый редактор [Sublime Text 3](https://www.sublimetext.com/3), в котором очень удобный поиск по регуляркам

In [1]:
import re

## Задание №1
Слово — это последовательность из букв (русских или английских).
На вход даётся текст, посчитайте, сколько в нём слов.


**Ввод:**
```
Он --- серобуромалиновая редиска!! 
>>>:-> 
А не кот. 
www.kot.ru
```

**Вывод:**
```
9
```

In [2]:
text = """Он --- серо-буро-малиновая редиска!! 
>>>:-> 
А не кот. 
www.kot.ru
"""

first_letter_re = re.compile(r'[a-zа-я]+(?:-[a-zа-я]+)*[a-zа-я]*', re.I)
words = first_letter_re.findall(text)

print(len(words), words)

9 ['Он', 'серо-буро-малиновая', 'редиска', 'А', 'не', 'кот', 'www', 'kot', 'ru']


## Задание №2
Вовочка подготовил одно очень важное письмо, но везде указал неправильное время.
Поэтому нужно заменить все вхождения времени на строку (TBD). 
Время — это строка вида HH:MM:SS или HH:MM, в которой HH — число от 00 до 23, а MM и SS — число от 00 до 59.


**Ввод:**
```
Уважаемые! Если вы к 09:00 не вернёте чемодан, то уже в 09:00:01 я за себя не отвечаю. 
PS. С отношением 25:50 всё нормально!
```


**Вывод:**
```
Уважаемые! Если вы к (TBD) не вернёте чемодан, то уже в (TBD) я за себя не отвечаю. 
PS. С отношением 25:50 всё нормально!
```


In [3]:
text = """Уважаемые! Если вы к 09:00 не вернёте чемодан, то уже в 09:00:01 я за себя не отвечаю.
PS. С отношением 25:50 всё нормально!"""

timestamp_re = re.compile(r'(?:[0-1]\d|2[0-3]):[0-5]\d(:[0-5]\d)?')

timestamp_re.sub('(TBD)', text)

'Уважаемые! Если вы к (TBD) не вернёте чемодан, то уже в (TBD) я за себя не отвечаю.\nPS. С отношением 25:50 всё нормально!'

## Задание №3


Акростих — осмысленный текст, сложенный из начальных букв каждой строки стихотворения.
Акроним — вид аббревиатуры, образованной начальными звуками (напр. НАТО, вуз, НАСА, ТАСС), которое можно произнести слитно (в отличие от аббревиатуры, которую произносят «по буквам», например: КГБ — «ка-гэ-бэ»).


На вход даётся текст. Выведите слитно первые буквы каждого слова. Буквы необходимо выводить заглавными.

**Ввод 1:**
```
Московский государственный институт международных отношений
```


**Вывод 1:**
```
МГИМО <br>
```


**Ввод 2:**
```
микоян авиацию снабдил алкоголем, народ доволен работой авиаконструктора
```


**Вывод 2:**
```
МАСАНДРА
```

In [4]:
first_letter_re = re.compile(r'([а-я])[а-я]*[^а-я]*', re.I)

texts = [
    "Московский государственный институт международных отношений",
    "микоян авиацию снабдил алкоголем, народ доволен работой авиаконструктора",
]

for text in texts:
    print(first_letter_re.sub(r'\1', text).upper())

МГИМО
МАСАНДРА
