[Документация](https://docs.python.org/3/library/re.html#module-re)

## Синтаксис

```python
import re
re.compile(
	'шаблон',  # raw
	модификаторы
)
```

In [1]:
import re

## Флаги

```python
# Без учета регистра
re.I; re.IGNORECASE;

# . включает \n
re.S; re.DOTALL;

# Конец строки перед каждым \n
re.M; re.MULTILINE;

# Игнорировать пробелы и \n
re.X; re.VERBOSE;

# \w, \W, \b, \B, \d, \D, \s и \S - только ASCII
re.A; re.ASCII;
```

## Символы

```python
# В шаблоне
.    # Любой символ
^    # Начало строки
$    # Конец строки
|    # Или
\A   # Начало текста
\Z   # Конец текста
\b   # Нач/Конец слова (!\w\d)
\B   # Не Нач/Конец слова
\d   # [0-9]
\D   # [^0-9]
\w   # [a-zA-Z0-9_]
\W   # [^a-zA-Z0-9_]
\s   # [\t\n\r\f\v]
\S   # [^\t\n\r\f\v]

# Внутри []
-  # Диапазон (между симв.)
^  # Отрицание (в начале)
```

## Квантификаторы
```python
# Все квантификаторы "жадные"
x+      # одно или более {1,}
x*      # ноль или более {0,}
x?      # ноль или одно {0,1}
\w{4}   # 4 буквы
x{2,4}  # от 2 до 4 вхождений
x{0,}   # 0 и более вхождений
```

## Группы
`Ограничение жадности` применяется добавлением `?` после оператора повторения
```python
(abc)        # Группа
(a|b|c)      # Любой из шаблонов
(a|b)c       # Группа + шаблон
(?:x)        # Сопоставляется, но не запоминает
(?P<n>)      # n - имя шаблона: p.search(n)
(?#...)      # Комментарий. Игонрируется.
x(?=y)       # Положительный просмотр вперед
x(?!y)       # Отрицательный просмотр вперед
(?<=y)x      # Положительный просмотр назад
(?<!y)x      # Отрицательный просмотр назад
(?(id)yes|no)  # Если найдена группа id, то выполняется шаблон yes, иначе no
(?i)a(?-i)b  # Применить флаг i только к 'a' (?imsxXU)
(?i:a)b      # Применить флаг i только к 'a' (?imsxXU)
```

## Свойства возвращаемого объекта Match
```python
{
  re: {        # Ссылка на скомпилированный шаблон
    groups: num,      # Количество групп в шаблоне;
    groupindex: dict, # Словарь с названиями групп и их номерами
    pattern: str,     # Исходная строка с регуляркой
    flags: str,       # Флаги из re.compile() или ?aiLmsux
  },
  string: str,    # Строка из методов match(), search(), fullmatch()
  pos: num,       # Позиция start
  endpos: num,    # Позиция end
  lastindex:num,  # Номер последней группы или None, если неудачно
  lastgroup:num,  # Номер последней именованой группы или None, если неудачно
  group(num||name),   # => Группу по номеру или имени
  groupdict([None]),  # => Словарь именованых групп. Для пустых: None
  groups([None]),     # => Кортеж значений всех групп. Для пустых: None
  start(num||name),   # => Индекс начала фрагмента
  end(num||name),     # => Индекс конца фрагмента
  span(num||name),    # => Кортеж с индексами начала и конца фрагмента
  expand(Шаблон),     # => Замена. В Шаблоне: \номер, \gномер, \gимя
}
```

## Методы

In [6]:
string = 'ABC abc 123 456. aA Aa bB Bb'

In [10]:
# Компиляция регулярного выражения
regexp = re.compile('[A-Z]*', flags=0)

print(regexp)

re.compile('[A-Z]*')


In [17]:
# Сопоставление регулярного выражения с начала строки
match = re.match(regexp, string, flags=0)

print(match)

<re.Match object; span=(0, 3), match='ABC'>


In [None]:
# Сопоставление регулярного выражения со всей строкой
fullmatch = re.fullmatch('^.*$', string, flags=0)

print(fullmatch)

<re.Match object; span=(0, 28), match='ABC abc 123 456. aA Aa bB Bb'>


In [None]:
# Поиск первого вхождения регулярного выражения в строке
search = re.search(r'\d+', string, flags=0)

print(search)

<re.Match object; span=(8, 11), match='123'>


In [None]:

# Все вхождения регулярного выражения в строке
findall = re.findall(r'\d+', string, flags=0)

print(findall)

['123', '456']


In [48]:
# Итератор, возвращающий все вхождения регулярного выражения в строке
finditer = re.finditer(r'\d+', string, flags=0)

print(list(finditer))

[<re.Match object; span=(8, 11), match='123'>, <re.Match object; span=(12, 15), match='456'>]


In [57]:
# Замена подстроки в строке, сопоставленной с регулярным выражением
# => Новая строка или исходная строка, если не найдено
sub = re.sub('ABC', '***', string, count=0, flags=0)

print(sub)

*** abc 123 456. aA Aa bB Bb


In [58]:
# Замена подстроки в строке, сопоставленной с регулярным выражением
# => (Новая строка или Исходная строка, КоличествоЗамен)
subn = re.subn('ABC', '***', string, count=0)

print(subn)

('*** abc 123 456. aA Aa bB Bb', 1)


In [59]:
# Разделение строки по регулярному выражению
split = re.split(' (?=[a-z])', string, maxsplit=0, flags=0)

print(split)

['ABC', 'abc 123 456.', 'aA Aa', 'bB Bb']


## Примеры

In [None]:
pattern = r'\d{3}-\d{2}-\d{4}'
string = '123-45-6789'

match = re.match(pattern, string)
if match:
    print(
        'Совпадение найдено:', match.group()
    )

Совпадение найдено: 123-45-6789


In [None]:
pattern = r'\d+'
string = '12 apples and 5 oranges'

numbers = re.findall(pattern, string)
print(numbers)

['12', '5']


In [None]:
pattern = r'\d+'
repl = '<number>'
string = '12 apples and 5 oranges'

result = re.sub(pattern, repl, string)
print(result)

<number> apples and <number> oranges
