# Python RegEx (Regular Expressions)
Регулярные выражения (RegEx) - это шаблоны, используемые для сопоставления строк.

In [None]:
import re

## Основные функции модуля `re`

### 1. `findall()` - Возвращает список всех совпадений

In [None]:
txt = "The rain in Spain" 
x = re.findall("ai", txt) 
print(x)

### 2. `search()` - Ищет первое совпадение и возвращает объект `Match`

In [None]:
txt = "The rain in Spain" 
x = re.search("\s", txt) 
print("Первый пробел находится на позиции:", x.start())

### 3. `split()` - Разбивает строку по шаблону

In [None]:
txt = "The rain in Spain" 
x = re.split("\s", txt) 
print(x)

### 4. `sub()` - Заменяет совпадения на заданную строку

In [None]:
txt = "The rain in Spain" 
x = re.sub("\s", "9", txt) 
print(x)

## Метасимволы (Metacharacters)

In [None]:
# [] - Набор символов
txt = "cat bat rat"
x = re.findall("[cr]at", txt)
print(x)  # ['cat', 'rat']

In [None]:
# \ - Специальные последовательности
txt = "My number is 12345"
x = re.findall("\d+", txt)
print(x)  # ['12345']

In [None]:
# . - Любой символ
txt = "hello hillo h*llo"
x = re.findall("h.llo", txt)
print(x)  # ['hello', 'hillo']

In [None]:
# ^ - Начало строки
txt = "hello world"
x = re.findall("^hello", txt)
print(x)  # ['hello']

In [None]:
# $ - Конец строки
txt = "hello world"
x = re.findall("world$", txt)
print(x)  # ['world']

In [None]:
# * - 0 или более повторений
txt = "hello helo heeello"
x = re.findall("he.*o", txt)
print(x)  # ['hello', 'helo', 'heeello']

In [None]:
# + - 1 или более повторений
txt = "hello helo heeello"
x = re.findall("he.+o", txt)
print(x)  # ['hello', 'heeello']

In [None]:
# ? - 0 или 1 повторение
txt = "hello helo heeello"
x = re.findall("he.?o", txt)
print(x)  # ['hello', 'helo']

In [None]:
# {} - Точное количество повторений
txt = "hello helo heeello"
x = re.findall("he.{2}o", txt)
print(x)  # ['hello']

In [None]:
# | - Логическое "или"
txt = "The rain in Spain falls mainly in the plain"
x = re.findall("falls|stays", txt)
print(x)  # ['falls']

In [None]:
# () - Группировка
txt = "apple banana apple"
x = re.findall("(apple)", txt)
print(x)  # ['apple', 'apple']

## Специальные последовательности (Special Sequences)

In [None]:
# \A - Совпадение в начале строки
txt = "The rain in Spain"
x = re.findall("\AThe", txt)
print(x)  # ['The']

In [None]:
# \b – Сөздің басында немесе соңында сәйкестік іздейді
txt = "The rain in Spain"
x = re.findall(r"\brain", txt)  # "rain" сөздің басында тұр ма?
print(x)  # ['rain']

y = re.findall(r"Spain\b", txt)  # "Spain" сөздің соңында тұр ма?
print(y)  # ['Spain']

In [None]:
# \B - Совпадение НЕ в начале/конце слова
txt = "rainbrain train"
x = re.findall("\Brain", txt)
print(x)  # ['rain']

In [None]:
# \d – Сан бар ма
txt = "My number is 12345"
x = re.findall(r"\d", txt)  # Барлық сандарды іздейді
print(x)  # ['1', '2', '3', '4', '5']

In [None]:
# \D – Сан ЕМЕС символдар
txt = "My number is 12345"
x = re.findall(r"\D", txt)  # Сан ЕМЕС символдарды іздейді
print("".join(x))  # My number is 

In [None]:
# \s – Бос орын (space, tab, newline)
import re
txt = "Hello world! How are you?"
x = re.findall(r"\s", txt)  # Барлық бос орындарды іздейді
print(x)  # [' ', ' ', ' ', ' ']

In [None]:
# \S - Любой символ, кроме пробела
txt = "Hello World!"
x = re.findall("\S", txt)
print(x)

In [None]:
# \Z - Совпадение в конце строки
txt = "The rain in Spain"
x = re.findall("Spain\Z", txt)
print(x)  # ['Spain']

In [None]:
# \W - Любой символ, кроме букв и цифр
txt = "Hello, World! 123"
x = re.findall("\W", txt)
print(x)

#\w – Сөздік символдар (a-z, A-Z, 0-9, _)


In [None]:
# \W - Любой символ, кроме букв и цифр
txt = "Hello, World! 123"
x = re.findall("\W", txt)
print(x)

In [None]:
# \W - Любой символ, кроме букв и цифр
txt = "Hello, World! 123"
x = re.findall("\W", txt)
print(x)

In [None]:
# \W - Любой символ, кроме букв и цифр
txt = "Hello, World! 123"
x = re.findall("\W", txt)
print(x)

## Наборы (Sets)

In [None]:
# [arn] - Один из символов 'a', 'r', 'n'
txt = "rain ran run"
x = re.findall("[arn]", txt)
print(x)

In [None]:
# [a-n] - Любая строчная буква от 'a' до 'n'
txt = "hello world"
x = re.findall("[a-n]", txt)
print(x)

In [None]:
# [^arn] - Исключая 'a', 'r', 'n'
txt = "rain ran run"
x = re.findall("[^arn]", txt)
print(x)

In [None]:
# [0123] - Одна из цифр 0, 1, 2, 3
txt = "The year is 2023"
x = re.findall("[0123]", txt)
print(x)

In [None]:
# [0-9] - Любая цифра
txt = "The year is 2023"
x = re.findall("[0-9]", txt)
print(x)

In [None]:
# [0-5][0-9] - Двузначные числа от 00 до 59
txt = "Minutes: 45, 30, 75"
x = re.findall("[0-5][0-9]", txt)
print(x)

In [None]:
# [a-zA-Z] - Любая буква (строчная или заглавная)
txt = "Hello123"
x = re.findall("[a-zA-Z]", txt)
print(x)

In [None]:
# [+] - Символ '+' без спец. значения
txt = "1 + 2 = 3"
x = re.findall("[+]", txt)
print(x)