# Регулярные выражения

**Документация и ссылки:**
- Оригинальная ссылка на хабр: https://habr.com/ru/articles/349860/#Primery_regulyarnyh_vyrazheniy
- Оригинальная документация: https://docs.python.org/3/library/re.html
- Очень подробный и обстоятельный материал: https://www.regular-expressions.info/
- Разные сложные трюки и тонкости с примерами: http://www.rexegg.com/
- Онлайн отладка регулярок: https://regex101.com (не забудьте поставить галочку Python в разделе "Flavor" слева)
- Онлайн визуализация регулярок: https://www.debuggex.com/ (не забудьте выбрать Python)
- Могущественный текстовый редактор [Sublime Text 3](https://www.sublimetext.com/3), в котором очень удобный поиск по регуляркам

## Задание №1
Слово — это последовательность из букв (русских или английских).
На вход даётся текст, посчитайте, сколько в нём слов.


**Ввод:**
```
Он --- серобуромалиновая редиска!! 
>>>:-> 
А не кот. 
www.kot.ru
```

**Вывод:**
```
9
```

In [1]:
import re

def count_words(text):
    pattern = r'\b[а-яА-Яa-zA-Z]+\b'
    words = re.findall(pattern, text)
    return len(words)

text = input('Введите ваш текст для подсчета количества его слов: ')
print(f'Количество слов в тексте равно {count_words(text)}')


Количество слов в тексте равно 4


## Задание №2
Вовочка подготовил одно очень важное письмо, но везде указал неправильное время.
Поэтому нужно заменить все вхождения времени на строку (TBD). 
Время — это строка вида HH:MM:SS или HH:MM, в которой HH — число от 00 до 23, а MM и SS — число от 00 до 59.


**Ввод:**
```
Уважаемые! Если вы к 09:00 не вернёте чемодан, то уже в 09:00:01 я за себя не отвечаю. 
PS. С отношением 25:50 всё нормально!
```


**Вывод:**
```
Уважаемые! Если вы к (TBD) не вернёте чемодан, то уже в (TBD) я за себя не отвечаю. 
PS. С отношением 25:50 всё нормально!
```


In [None]:
import re

def replace_time_with_tbd(text):
    # Используем регулярное выражение для поиска времени HH:MM:SS или HH:MM, которое начинается с цифры от 00 до 23 и минуты и секунды от 00 до 59
    time_pattern = r'\b(0[0-9]|1[0-9]|2[0-3]):([0-5][0-9])(:([0-5][0-9]))?\b'
    
    # Заменяем все найденные совпадения времени на "(TBD)"
    result_text = re.sub(time_pattern, "(TBD)", text)
    
    return result_text

# Ваш входной текст
input_text = "Уважаемые! Если вы к 09:00 не вернёте чемодан, то уже в 09:00:01 я за себя не отвечаю. PS. С отношением 25:50 всё нормально!"

# Вызываем функцию для замены времени на "(TBD)"
output_text = replace_time_with_tbd(input_text)

# Выводим результат
print(output_text)


## Задание №3


Акростих — осмысленный текст, сложенный из начальных букв каждой строки стихотворения.
Акроним — вид аббревиатуры, образованной начальными звуками (напр. НАТО, вуз, НАСА, ТАСС), которое можно произнести слитно (в отличие от аббревиатуры, которую произносят «по буквам», например: КГБ — «ка-гэ-бэ»).


На вход даётся текст. Выведите слитно первые буквы каждого слова. Буквы необходимо выводить заглавными.

**Ввод 1:**
```
Московский государственный институт международных отношений
```


**Вывод 1:**
```
МГИМО <br>
```


**Ввод 2:**
```
микоян авиацию снабдил алкоголем, народ доволен работой авиаконструктора
```


**Вывод 2:**
```
МАСАНДРА
```

In [None]:
import re

def get_acronym(text):
    # Используем регулярное выражение для поиска первых букв каждого слова
    words = re.findall(r'\b\w', text)

    # Преобразуем буквы в верхний регистр и объединяем их
    acronym = ''.join(word.upper() for word in words)

    return acronym

# Ваш входной текст
input_text = input('Введите ')

# Получаем акроним
acronym = get_acronym(input_text)

# Выводим результат
print(acronym)
