<a href="https://colab.research.google.com/github/xsiodse/PR7/blob/main/Untitled3.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
import re

data_text = """
Посетите наши страницы:
Email: info@example.com (главный), support-team@corp.net (поддержка)
Дата: 25-05-2023, 01/01/2024, 12.02.2025.
Коды товаров: ID_PROD-1001, ITEM-20-A, ID-300-B.
Суммы: $150.50, 20 EUR, 500 RUB, £75.
"""

# Паттерн согласно требованиям:
# [\w.-]+      -> 1 или более букв, цифр, -, . или _
# @            -> символ @
# [a-zA-Z0-9-]+ -> 1 или более букв, цифр или -
# \.           -> точка
# [a-zA-Z]{2,3} -> 2 или 3 буквенных символа (домен)
email_pattern = r"[\w.-]+@[a-zA-Z0-9-]+\.[a-zA-Z]{2,3}"

emails = re.findall(email_pattern, data_text)

print("Найденные email-адреса:")
for email in emails:
    print(f"- {email}")


Найденные email-адреса:
- info@example.com
- support-team@corp.net


In [3]:
import re

data_text = """
Посетите наши страницы:
Email: info@example.com (главный), support-team@corp.net (поддержка)
Дата: 25-05-2023, 01/01/2024, 12.02.2025.
Коды товаров: ID_PROD-1001, ITEM-20-A, ID-300-B.
Суммы: $150.50, 20 EUR, 500 RUB, £75.
"""

# Паттерн:
# (?:ID_PROD-|ID-) -> поиск одного из префиксов (без захвата в результат)
# (\d+)            -> захват одной или более цифр в отдельную группу
product_pattern = r"(?:ID_PROD-|ID-)(\d+)"

product_codes = re.findall(product_pattern, data_text)

print("Цифровые части кодов:")
print(product_codes)
# Результат: ['1001', '300']


Цифровые части кодов:
['1001', '300']


In [5]:
import re

data_text = """
Посетите наши страницы:
Email: info@example.com (главный), support-team@corp.net (поддержка)
Дата: 25-05-2023, 01/01/2024, 12.02.2025.
Коды товаров: ID_PROD-1001, ITEM-20-A, ID-300-B.
Суммы: $150.50, 20 EUR, 500 RUB, £75.
"""

# Паттерн для формата DD.MM.YYYY:
# (\d{2}) -> Группа 1: День
# \.      -> Разделитель точка
# (\d{2}) -> Группа 2: Месяц
# \.      -> Разделитель точка
# (\d{4}) -> Группа 3: Год
date_pattern = r"(\d{2})\.(\d{2})\.(\d{4})"

# Замена на формат YYYY-MM-DD:
# \3 - содержимое третьей группы (год)
# \2 - содержимое второй группы (месяц)
# \1 - содержимое первой группы (день)
new_text = re.sub(date_pattern, r"\3-\2-\1", data_text)

print("Текст после замены даты:")
print(new_text)


Текст после замены даты:

Посетите наши страницы:
Email: info@example.com (главный), support-team@corp.net (поддержка)
Дата: 25-05-2023, 01/01/2024, 2025-02-12.
Коды товаров: ID_PROD-1001, ITEM-20-A, ID-300-B.
Суммы: $150.50, 20 EUR, 500 RUB, £75.



In [6]:
import re

data_text = """
Посетите наши страницы:
Email: info@example.com (главный), support-team@corp.net (поддержка)
Дата: 25-05-2023, 01/01/2024, 12.02.2025.
Коды товаров: ID_PROD-1001, ITEM-20-A, ID-300-B.
Суммы: $150.50, 20 EUR, 500 RUB, £75.
"""

# Паттерн:
# \d+(?:\.\d+)?  -> Находит число (целое или с десятичной точкой)
# \s+            -> Один или более пробельных символов
# (?:EUR|RUB)    -> Находит либо EUR, либо RUB (незахватывающая группа)
currency_pattern = r"\d+(?:\.\d+)?\s+(?:EUR|RUB)"

results = re.findall(currency_pattern, data_text)

print("Найденные суммы в EUR и RUB:")
for item in results:
    print(f"- {item}")


Найденные суммы в EUR и RUB:
- 20 EUR
- 500 RUB
