<a href="https://colab.research.google.com/github/litlsun/hse_programming/blob/main/regex.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [1]:
# Задачи на регулярные выражения
import re

In [3]:
# Задача 1: Найти все цены с валютами (руб, $, евро, ₽)
# Ожидаемый результат: ['100 руб', '$50', '75.50 евро', '200₽']

text = "Цены: 100 руб, $50, 75.50 евро, 200₽, 300"
pattern = r'\d+\.?\d*\s*(?:руб|евро)|\$(?:\d+\.?\d*)|\d+\.?\d*₽'
result = re.findall(pattern, text)

print(result)

['100 руб', '$50', '75.50 евро', '200₽']


In [5]:
# Задача 2: Удалить все HTML-теги, оставив только текст
# Ожидаемый результат: "Текст жирный и курсивный"

html = "<div>Текст <b>жирный</b> и <i>курсивный</i></div>"
result = re.sub(r'<[^>]+>', '', html)
print(result)

Текст жирный и курсивный


In [7]:
# Задача 3: Найти все номера версий (числа с точками)
# Ожидаемый результат: ['3.9', '17.0.1', '18.15.0', '1.2.3.4']

text = "Версии: Python 3.9, Java 17.0.1, Node.js v18.15.0, проект v1.2.3.4"
pattern = r'\b(?:v?)(\d+(?:\.\d+)+)\b'
result = re.findall(pattern, text)
print(result)

['3.9', '17.0.1', '18.15.0', '1.2.3.4']


In [11]:
# Задача 4:
# 1. Найти email и телефон
# 2. Найти номер заказа (#12345)
# 3. Найти цену (1,500.50 руб)
# 4. Найти версию заказа (v2.1.5)

complex_text = """
Клиент Иван Иванов (ivan@mail.com, +7-912-345-67-89)
заказал товар #12345 за 1,500.50 руб.
Статус: ВЫПОЛНЕНО. Версия заказа v2.1.5.
Сайт: https://store.com/order/12345
"""

# 1. Email и телефон
email_phone = re.findall(r'\b[\w\.-]+@[\w\.-]+\.\w+\b|\+\d+-\d{3}-\d{3}-\d{2}-\d{2}', complex_text)

# 2. Номер заказа
order_number = re.findall(r'#\d+', complex_text)

# 3. Цена
price = re.findall(r'\b\d{1,3}(?:,\d{3})*\.?\d*\s*руб', complex_text)

# 4. Версия заказа
version = re.findall(r'v\d+(?:\.\d+)+', complex_text)

print("1. Email и телефон:", ', '.join(email_phone))
print("2. Номер заказа:", order_number[0])
print("3. Цена:", price[0])
print("4. Версия заказа:", version[0])

1. Email и телефон: ivan@mail.com, +7-912-345-67-89
2. Номер заказа: #12345
3. Цена: 1,500.50 руб
4. Версия заказа: v2.1.5
