# Упражнения по модулю re

## Задание 1: Поиск email-адресов
Исходные данные:
```
text = """
Привет, меня зовут Алекс. Мой email: alex@example.com.
Вы можете связаться со мной по адресу: contact@mywebsite.org.
Не пишите на: invalid-email@.com или @missingusername.com.
"""
```
Условие: **Найдите все корректные email-адреса, которые содержат домен .com или .org.**

In [64]:
import re

text = """
Привет, меня зовут Алекс. Мой email: alex@example.com.
Вы можете связаться со мной по адресу: contact@mywebsite.org.
Не пишите на: invalid-email@.com или @missingusername.com.
"""

pattern = r'\w+@\w+\.(org|com)'

res = re.finditer(pattern, text)
for match_obj in res:
    print(match_obj.group())

alex@example.com
contact@mywebsite.org


## Задание 2: Извлечение телефонных номеров
Исходные данные:
```
text = """
Звоните по телефону: (123) 456-7890 или 987-654-3210.
Вы также можете позвонить на 1234567890. Не звоните на 123-45-6789.
"""
```

Условие: **Найдите все корректные телефонные номера в формате (XXX) XXX-XXXX, XXX-XXX-XXXX и XXXXXXXXXX.**

In [76]:
import re

text = """
Звоните по телефону: (123) 456-7890 или 987-654-3210.
Вы также можете позвонить на 1234567890. Не звоните на 123-45-6789.
"""

pattern = r'\([0-9]{3}\) [0-9]{3}-[0-9]{4}|([0-9]{3}-){2}[0-9]{4}|\d{10}'

res = re.finditer(pattern, text)
for match_obj in res:
    print(match_obj.group())

(123) 456-7890
987-654-3210
1234567890


## Задание 3: Поиск дат
Исходные данные:
```
text = """
Событие состоится 12/05/2023 и 1/6/2023. 
Не забудьте про даты 31/12/2022 и 02/03/2024!
"""
```

Условие: **Найдите все даты в формате DD/MM/YYYY или D/M/YYYY.**

In [80]:
import re

text = """
Событие состоится 12/05/2023 и 1/6/2023. 
Не забудьте про даты 31/12/2022 и 02/03/2024!
"""

pattern = r'\d+/\d+/\d{4}'

res = re.findall(pattern, text)
print(res)

['12/05/2023', '1/6/2023', '31/12/2022', '02/03/2024']


## Задание 4: Извлечение хештегов

Исходные данные:
```
text = """
Сегодня я изучал #Python и #РегулярныеВыражения. 
Также мне понравился #coding и #AI!
"""
```

Условие: **Найдите все хештеги в тексте.**

In [82]:
import re

text = """
Сегодня я изучал #Python и #РегулярныеВыражения. 
Также мне понравился #coding и #AI!
"""

pattern = r'#\w+'

res = re.findall(pattern, text)
print(res)

['#Python', '#РегулярныеВыражения', '#coding', '#AI']


## Задание 5: Поиск URL

Исходные данные:
```
text = """
Посетите наш сайт по адресу http://example.com и https://secure-site.org.
Не переходите по ссылке ftp://files.example.com.
"""
```

Условие: **Найдите все URL, начинающиеся с http, https или ftp.**

In [96]:
import re

text = """
Посетите наш сайт по адресу http://example.com и https://secure-site.org.
Не переходите по ссылке ftp://files.example.com.
"""

pattern = r'(http|https|ftp)\S+\w'

res = re.finditer(pattern, text)
for match_obj in res:
    print(match_obj.group())

http://example.com
https://secure-site.org
ftp://files.example.com


## Задание 6: Поиск слов с цифрами

Исходные данные:
```
text = """
Вот несколько примеров: abc123, helloWorld, test1, 123abc, и просто текст.
"""
```

Условие: **Найдите все слова, содержащие хотя бы одну цифру и одну букву.**

In [100]:
import re

text = """
Вот несколько примеров: abc123, helloWorld, test1, 123abc, и просто текст.
"""

pattern = r'\b(?=\w*[a-zA-Z])(?=\w*\d)\w+\b'

res = re.findall(pattern, text)
print(res)

['abc123', 'test1', '123abc']


## Задание 7: Извлечение ключей и значений
Исходные данные:
```
text = "name=Alex; age=30; city=Moscow; profession=developer;"
```
Условие: **Извлеките все ключи и значения из строки.**

In [109]:
# способ 1
import re

text = "name=Alex; age=30; city=Moscow; profession=developer;"
pattern = r'(\w+)=(\w+)'

matches = re.findall(pattern, text)
print(matches)

# Преобразуем в словарь
result_dict = {key: value for key, value in matches}

print(result_dict)

[('name', 'Alex'), ('age', '30'), ('city', 'Moscow'), ('profession', 'developer')]
{'name': 'Alex', 'age': '30', 'city': 'Moscow', 'profession': 'developer'}


In [110]:
# способ 2
import re

text = "name=Alex; age=30; city=Moscow; profession=developer;"

# Используем регулярное выражение с именованными группами
pattern = r'(?P<key>\w+)=(?P<value>\w+)'

matches = re.finditer(pattern, text)

# Создаем словарь с помощью groupdict()
result_dict = {match.group('key'): match.group('value') for match in matches}

print(result_dict)

{'name': 'Alex', 'age': '30', 'city': 'Moscow', 'profession': 'developer'}


## Задание 8: Проверка имен пользователей

Исходные данные:
```
usernames = ["user123", "1stUser", "_hiddenUser", "invalid-user!", "another_user"]
```

Условие: **Найдите все корректные имена пользователей (допустим, только буквы, цифры и символы _, начинается с буквы).**

In [113]:
import re

usernames = ["user123", "1stUser", "_hiddenUser", "invalid-user!", "another_user"]
pattern = r'^[a-zA-Z][a-zA-Z0-9_]*$'

valid_usernames = [username for username in usernames if re.match(pattern, username)]

print(valid_usernames)

['user123', 'another_user']


## Задание 9: Поиск целых чисел

Исходные данные:
```
text = "Здесь есть числа: -10, 20, 30, -5, и 0."
```

Условие: **Найдите все целые числа, включая отрицательные.**

In [115]:
import re

text = "Здесь есть числа: -10, 20, 30, -5, и 0."
pattern = r'-{0,1}\d+'

res = re.findall(pattern, text)
print(res)

['-10', '20', '30', '-5', '0']


## Задание 10: Извлечение уникальных слов

Исходные данные:
```
text = "Привет мир! Привет всем! Мир прекрасен."
```

Условие: **Извлеките все уникальные слова из текста (игнорируя регистр и знаки препинания).**

In [121]:
import re

text = "Привет мир! Привет всем! Мир прекрасен."

# Приводим текст к нижнему регистру
text_lower = text.lower()

# Используем регулярное выражение для поиска всех слов
words = re.findall(r'\b\w+\b', text_lower)

# Преобразуем список слов в множество для получения уникальных слов
unique_words = set(words)

# Преобразуем множество обратно в список и сортируем (по желанию)
unique_words_sorted = sorted(unique_words)

print(unique_words_sorted)

['всем', 'мир', 'прекрасен', 'привет']
