# Исключения

Ситуации, котда что то в коде идет не так (обычно из-за ошибок или неправильного ввода) останавливают работу программы. Подобные ситуации называються исклчениями и имеют различные типи. 

$\textbf{Пример:}$

In [1]:
num1 = 7
num2 = 0
print(num1/num2)

ZeroDivisionError: division by zero

Подобная ситауция вызвала закономерное исключение -  деление на 0.
Сами исключения могут происходить по разным причинам. Наиболее частые из них:

$\textbf{ImportError}$ - импортирование не удалось;

$\textbf{ImdexError}$ - индекс не входит в диапазон элементов списка;

$\textbf{NameError}$ - попытка использовать несуществующую переменную;

$\textbf{SyntaxError}$ - ошибка разбора кода;

$\textbf{TypeError}$ - в функцию передано значение несовместимого типа;

$\textbf{ValueError}$ - в функцию передано значение совместимого типа, но с некорректным значением.

Помимо всего этого есть масса других исключений, как страндартных (все то же $\textbf{ZeroDivisionError}$), так и идущих из сторонних библиотек

### Обработка исключений

Когда происходит исключение, что бы обойти его и выполнить код, можно использовать конструкцию $\textbf{try/except}$. Блок $\textbf{try}$ содержит код под сомнением, код которыйможет вызвать исключение. В случае исключения выполнение кода в блоке $\textbf{try}$ прерывается и передается коду в блоке $\textbf{except}$. Если не происходит никакой ошибки, код в блоке $\textbf{except}$ не выплняется.

$\textbf{Например:}$

In [3]:
try:
    num1 = 7
    num2 = 0
    print(num1/num2)
    print("Done calculation")
except ZeroDivisionError: # В данном примере указан тип ожидаемого исключения
    print("An error occurred")
    print("due to zero division")

An error occurred
due to zero division


Инструкция $\textbf{try}$ может иметь несколько различных блоков $\textbf{except}$, что бы обрабоатывать различные исключения. Блок $\textbf{except}$ может содержать несколько исключений, которые указываються в круглых скобах; все они будут выполнены программой.

In [4]:
try:
    variable = 7
    print(variable + 'hello')
    print(variable/2)
except ZeroDivisionError: 
    print("Divided by zero")
except (ValueError, TypeError): 
    print("Error occurred")

Error occurred


Инструкция $\textbf{except}$ не имеющая каких-либо исключений, будет перехватывать все ошибки. Такие инструкции нужно использовать с осторожностью, так как они могут перехватить слишком много ошибок или же скрыть ошибки в коде.

In [5]:
try:
    word = 'spam'
    print(word/0)
except: 
    print("An error occurred")

An error occurred


Умение обрабоатывать исклчения особенно важно при работе с пользовательским вводом.

### finally 

Когда есть необходимость в том, что бы некоторый фрагмент кода выполнялся, независимо от того, возникают ошибки
или нет, можно использовать конструкцию $\textbf{finally}$. Инструкция $\textbf{finally}$ располагается в нижней части инструкции $\textbf{try/except}$. Данная инструкция выполняется после выполенния блока $\textbf{try}$ и, возможно, после блока $\textbf{except}$.

In [6]:
try:
    print('Hello')
    print(1/0)
except ZeroDivisionError: 
    print("Divided by zero")
finally: 
    print("This code will run no matter what")

Hello
Divided by zero
This code will run no matter what


код в конструкции $\textbf{finally}$ будет выполняться, даже если произойдет неперехваченное исключение в одном
из предыдущих блоков кода.

In [7]:
try:
    print(1)
    print(10/0)
except ZeroDivisionError: 
    print(unknown_var)
finally: 
    print("This is executed last")

1
This is executed last


NameError: name 'unknown_var' is not defined

## Вызов исключений 

Можно вызывать исключения с помощью инструкции $\textbf{raise}$.

In [8]:
print(1)
raise ValueError # Нужно указать тип исключения, которое будет вызвано
print(2)

1


ValueError: 

Исключение можно вызывать с указанием аргумента, который представляет собой ее описание.

$\textbf{Например:}$

In [9]:
name = "132"
raise NameError("Invalid name")

NameError: Invalid name

In [10]:
try:
    num = 5/0
except:
    print("An error occured")
    raise

An error occured


ZeroDivisionError: division by zero

# Утверждения 

$\textbf{Утверждение}$ - это проверка правильности кода; ее можно включить или выключить по завершению тестирования программы. Выражение проверяется, и если оно ложное, вызывается исключение. 
Утверждения создается с помощью инструкции $\textbf{asset}$.

In [11]:
print(1)
assert 2 + 2 == 4
print(2)
assert 1 + 1 == 3
print(3)

1
2


AssertionError: 

Программисты часто размещают утверждения в заголовке функции, чтобы проверить правильность ввода, а также после вызова функции для проверки правильности вывода.

Утверждениям, как и конструкции $\textbf{raise}$, можно давать второй аргумент, который передается в блок AssertionError, выполянемый в случае ложности утверждения.

In [12]:
temp = -10
assert (temp >= 0), "Colder then absolute zero!"

AssertionError: Colder then absolute zero!

Исключения AssertionError могут быть перехвачены как и любое другое исключение, с помощью конструкции  $\textbf{try/except}$. Если же AssertionError не обрабатывается, этот класс исключений приводит к остановке программы.

### Полезные функции обработки строк

В Python есть много полезных встроенных функций и методов выполнения частных задач.  

$\textbf{join}$ - объединение последовательности строк с использованием другой стоки в качестве разделителя;

$\textbf{replace}$ - замена одной подстроки на другую;

$\textbf{startswith}$ и $\textbf{endswith}$ - методы определяют, есть ли подстрока в начале или в конце строки;

Для изменения регистра строки используються методы $\textbf{lower()}$ и $\textbf{upper()}$ 

$\textbf{split}$ - противоположный методу $\textbf{join}$, делает из строки с определенным разделителем список.

$\textbf{Несколько примеров:}$ 


In [14]:
print(','.join(["spam","eggs","ham"]))
print("Hello ME".replace("ME", "world"))
print("This is a sentence.".startswith("This"))
print("This is a sentence.".endswith("sentence."))
print("This is a sentence.".upper())
print("ANALL CAPS SENTENCE".lower())
print("spam, eggs, ham".split(","))

spam,eggs,ham
Hello world
True
True
THIS IS A SENTENCE.
anall caps sentence
['spam', ' eggs', ' ham']


### Функции списков 

Функциям $\textbf{all}$ и $\textbf{any}$, часто используемым в условных конструкциях, можно присваивать в качестве список в качестве аргумента; значение $\textbf{True}$ возвращается когда любой их аргумент(или соответственно все аргументы) возвращает $\textbf{True}$, в противном случае $\textbf{False}$.

Функция $\textbf{enumerate}$ может быть использована для одновременного  перебора значений и показателей списка.

$\textbf{Пример:}$

In [18]:
nums = [55, 44, 33, 22, 11]

if all([i > 5 for i in nums]):
    print("All larger than 5")
    
if any([i % 2 == 0 for i in nums]):
    print('At least one is even')
    
for v in enumerate(nums):
    print(v)

All larger than 5
At least one is even
(0, 55)
(1, 44)
(2, 33)
(3, 22)
(4, 11)


## Функция lambda 

Ламбда-функции - полезные, но не особо функциональные трюки, называемые анонимными функциями.

$\textbf{Пример:}$

In [19]:
# Именованая функция
def polynomial(x):
    return x**2 + 5*x + 4
print(polynomial(-4))
# Анонимная функция
print((lambda x: x**2 + 5*x + 4) (-4))

0
0


Лямбда-функциям можно присваивать переменные и они могут использоваться как обычные функции. Тем не менее подобный способ довольно редкий и функции обычно инициализируються через $\textbf{def}$.

In [20]:
double = lambda x: x*2
print(double(7))

14


## Функция map и filter

Функции $\textbf{map}$ и $\textbf{filter}$ являються встроенными функциями высшего порядка для работы со списками или другими итерируемыми объектами.

Функция $\textbf{map}$ принимает в качестве аргументов функцию и итерируемый объект. Возвращает $\textbf{map}$ новый итерируемый объект, а функция применятеся к каждому аргументу.

$\textbf{Пример:}$

In [21]:
def add_five(x):
    return x + 5

nums = [11, 22, 33, 44, 55]

print(list(map(add_five, nums)))

[16, 27, 38, 49, 60]


С другой стороны, подобную задачу можно решить с помощью анонимной функции более просто:

In [22]:
print(list(map(lambda x: x + 5, nums)))

[16, 27, 38, 49, 60]


Функция $\textbf{filter}$ предназначена для фильтрования итерируемого объекта путем удаления элементов, которые не соответствуют предикату (функции, которая возвращает логичесткую переменную).


In [23]:
print(list(filter(lambda x: x % 2 == 0, nums)))

[22, 44]


# Генераторы

$\textbf{Генераторы}$ представляют собой итерируемый тип, такой как списки или кортежи. 

В отличии от списков им нельзя присваивать произвольные индексы, но они поддерживают циклы $\textbf{for}$. Они  создаються с использованием функций и инструкции $\textbf{yield}$.

$\textbf{Пример:}$

In [27]:
def countdown():
    i = 5
    while i > 0:
        yield i
        i -=1
        
for i in countdown():
    print(i)

5
4
3
2
1


Инструкция $\textbf{yield}$ определяет генератор, заменяет значение, возвращаемое функцией, и возвращает результат, не меняя первоначальные параметры.

Так как генераторы возвращают по одному элементу за раз, они, в отличии от списков, не имеют ограничений по памяти. На само деле они могут выполняться $\textbf{бесконечно!}$

In [None]:
def infinite_sevens():
    while #True: #выполнять этот код не стоит
        yield 7
        
for i in infinite_sevens:
    print(i)

$\textbf{Резюмируя,}$ генераторы позволяют объявить функцию, которая подобна итератору, т.е. может быть использована в цикле.

Конечные генераторы могут быть преобразованы в списки, для этого их нужно передать как аргумент функции $\textbf{list}$.

In [29]:
def numbers(x):
    for i in range(x):
        if i % 2 == 0:
            yield i
            
print(list(numbers(11)))

[0, 2, 4, 6, 8, 10]


Использование $\textbf{генераторов}$ позволяет повысить производительность: "ленивая" генерация значений(генерация по требованию) означает сниженное потребление памяти. Кроме того, не нужно ждать, пока все элементы будут сгенерированы, мы можем начать их использование гораздо раньше.  

# Декораторы 

Декораторы предназначены для модификации функций с помощью других функций. Они очень пригождаються, когда нужно изменить поведение функций, но нет желания ее модифицировать нет.

$\textbf{Пример:}$

In [30]:
def decor(func):
    def wrap():
        print('============')
        func()
        print('============')
    return wrap

def print_text():
    print('Hello world!')
    
decorated = decor(print_text)
decorated()

Hello world!


В примере выше определена функция с именем $\textbf{decor}$, у которой один единственный параметр $\textbf{func}$. Внутри функции $\textbf{decor}$, определена вложенная функция $\textbf{wrap}$. Данная функция выведет строку, затем вызывает $\textbf{func()}$ и выводит еще одну строку. Функция $\textbf{decor}$ возвращает функцию $\textbf{wrap}$ как свой результат.

Можно сказать, что переменная $\textbf{decorated}$ - декорированная версия $\textbf{print_text}$, то есть $\textbf{print_text}$ и еще что-то. 

Предположем, написан полезный декоратор и мы хотим полностью заменить $\textbf{print_text}$ декорированной версией, так чтобы всегда выполнялась наша версия $\textbf{print_text}$ "плюс еще что-то".
Это делается путем присвоения переменной, содержащей нашу функцию. 

In [31]:
print_text = decor(print_text)
print_text() # теперь эта функция привязана к нашей дикорированной версии

Hello world!


Эта конструкция может быть использована в любой момент для оборачивания любой нужной функции. Python представляет способ обернуть функцию в декоратор; для этого нужно поставить перед определением фуекции имя декоратора и символ $\textbf{@}$. 

Если опредляется функция, мы можем "декорировать" ее, добавив символ @;

$\textbf{Вот так вот:}$

In [32]:
@decor
def print_text():
    print("Hello world!")
    
print_text()

Hello world!


Функция может иметь несколько декоарторов. 
Более подробно про $\textbf{декораторы}$ можно прочитать $\textbf{https://habrahabr.ru/post/141411/}$.

# Множества 

Множества - структуры данных, подобные спискам или словарям. Они создаются с помощью фигурных скобок или функции $\textbf{set}$. Некоторые их функции аналогичны функциям списков, например, используется $\textbf{in}$ для проверки наличия в них какого-либо элемента. 

In [33]:
num_set = {1, 2, 3, 4, 5}
word_set = set(['spam', 'eggs', 'sausage'])

print(3 in num_set)
print('spam' not in word_set)

True
False


Чтобы создать пустое множество, используется $\textbf{set()}$, так как скобки $\textbf{{}}$ используються для создания пустого словаря.

Не смотря на тличия со списками, во множествах используються несколько списковых операций. Например, $\textbf{len}$.

Множества являются неупорядоченными, то есть они не могут быть проиндексированны.

$\textbf{Нельзя}$, что бы они содержали дубликаты. Так как множества не проиндексированы, проверить их на наличие элемента быстрее, чем проверить список.

Вместо метода $\textbf{append}$ для добавления новгого элемента во множество используется $\textbf{add}$.
Метод $\textbf{remove}$ удаляет определенный элемент из множества; $\textbf{pop}$ удаляет произвольный элемент.

In [34]:
nums = {1, 2, 3, 4, 5, 6, 7}
print(nums)
nums.add(-7)
nums.remove(3)
print(nums)

{1, 2, 3, 4, 5, 6, 7}
{1, 2, 4, 5, 6, 7, -7}


В основном $\textbf{множества}$ применяються для проверки на вхождения и устранения дубликатов.

Над множествами можно проводить арифмитичесике операции.

Оператор $\textbf{объединения (|)}$ объединяет два множества в одно, содержащее все элементы двух множеств.

Оператор $\textbf{пересечения (&)}$ возвращает только элементы, находящиеся вобоих множествах.

Оператор $\textbf{разности (-)}$ возвращает только элементы первого множества.

Оператор $\textbf{симмерической разности (^)}$ возвращает все элементы с обоих множеств, кроме принадлежащих одновременно обоим.

In [35]:
first = {1, 2, 3, 4, 5, 6}
second = {4, 5, 6, 7, 8, 9}

print(first | second)
print(first & second)
print(first - second)
print(second - first)
print(first ^ second)

{1, 2, 3, 4, 5, 6, 7, 8, 9}
{4, 5, 6}
{1, 2, 3}
{8, 9, 7}
{1, 2, 3, 7, 8, 9}


### Структура данных 

$\textbf{Словари}$ используються:

$\textbf{-}$ когда необходимо установить логическую связь $\textbf{ключ:значения}$;

$\textbf{-}$ когда нужно провести быстрый поиск по данным, используя ключ;

$\textbf{-}$ когда даныне нужно часто изменять.

$\textbf{Списки}$ лучше всего использовать когда имеется база данных, к которой нужен произвольный доступ(списки - простая, итерируемсая и, имеющая возможность частой модификации, коллекция данных).

$\textbf{Множества}$ используются тогда, когда нужны уникальные элементы.

$\textbf{Кортежи}$ используются, когда необходимо защитить данные от изменений. 

# Модуль itertools 

Модуль $\textbf{itertools}$ - это стандартная библиотека, которая содержит несколько полезных в функциональном программировании функций. 

Один тип функций в этой библиотеке - бесконечные итераторы.

Функция $\textbf{count}$ создает бесконечную прогрессию вверх от заданного числа.

Функция $\textbf{cycle}$ бесконечное число раз перебирает итерируемый объект (списко или строку).

Функция $\textbf{repeat}$ повторяет объект бескоенчное (или заданное) количество раз.

$\textbf{Пример:}$

In [36]:
from itertools import count

for i in count(3):
    print(i)
    if i >=11:
        break

3
4
5
6
7
8
9
10
11


Функция $\textbf{takewhile}$ - возвращает элементы из итерируемого объекта, которые удвлетворяют предикативной функции.

Функция $\textbf{chain}$ - объединяет несоклько итерируемых объектов в один.

Функция $\textbf{accumulate}$ - возвращение сумму значений внутри итерируемого объекта.

In [37]:
from itertools import accumulate, takewhile

nums = list(accumulate(range(8)))
print(nums)
print(list(takewhile(lambda x: x <= 6, nums)))

[0, 1, 3, 6, 10, 15, 21, 28]
[0, 1, 3, 6]


В $\textbf{itertools}$ есть также несколько комбинаторных функций, например $\textbf{product}$ и $\textbf{permutation}$.

Они используються, когда нужно выполнить задачу со всеми возможными комбинациями некоторых элеменов.

$\textbf{Пример:}$

In [40]:
from itertools import product, permutations

letters = ('A','B')
print(list(product(letters,range(4))))
print(list(permutations(letters)))      

[('A', 0), ('A', 1), ('A', 2), ('A', 3), ('B', 0), ('B', 1), ('B', 2), ('B', 3)]
[('A', 'B'), ('B', 'A')]


# Классы

Классы являются неотъемлимой частью основной парадигмы Python - $\textbf{объектро-ориентированногопрораммирования}$. Класс описывет объект, но является назевисимым от него. Иными словами, класс -  это экземпляр, описание или определение объекта. Можно использовать класс в качестве образа для создания различных объектов.

Классы оформляюься с помощью ключевого слова $\textbf{class}$ и в виде блока с отступом, содержащим $\textbf{методы класса}$(которые явяються функциями).

$\textbf{Пример простого класса:}$

In [41]:
class Cat(object):
    def __init__(self, color, legs):
        self.color = color
        self.legs = legs
        
felix = Cat('gingir', 4)
rover = Cat('dog-colored', 4)
stumpy = Cat('browm', 3)

Метод $\textbf{__init__}$ - самый важный метод класса. Он вызывается, когда создается экземпляр (объект) класса; имя класса используется как функция.

Все методы должны иметь $\textbf{self}$ в качестве своего первого параметра; хотя $\textbf{self}$ непосредственно не передается, Python добавляет инстукцию $\textbf{self}$ в список сам; нет нужды включать self, когда происходит вызов метода. В пределах определения метода, инструкция $\textbf{self}$ относится к эеземпляру класса, вызывающему метод.

Экземпляры класса берут $\textbf{атрибуты}$ - фраггменты свзаных с ними данных. Их можно получать через $\textbf{dot notation}$ - указав точку и имя атрибута после экземпляра.

Таким образом внутри метода $\textbf{__init__}$ с помощью $\textbf{self.attribute}$ можно задать начальное значение атрибутов экземпляра. 

Метод $\textbf{__init__}$ называют $\textbf{конструктор}$ класса.

Можно использовать различные методы, расширяя функциональность классов. 

In [2]:
class Dog(object):
    def __init__(self, name, color):
        self.name = name
        self.color = color
        
    def bark(self):
        print("Woof!")
        
fido = Dog('Fido', 'brown')
print(fido.name)
fido.bark()

Fido
Woof!


Классы могут также иметь $\textbf{атрибуты класса}$, которые создаются путем присвоения переменных в теле класса. На них можно ссылаться либо из экземпляра класса, либо с тела самого класса. 

In [3]:
class Dog(object):
    legs = 4 
    def __init__(self, name, color):
        self.name = name
        self.color = color
        
    def bark(self):
        print("Woof!")
        
fido = Dog('Fido', 'brown')
print(fido.legs)
print(Dog.legs) # атрибуты класса являються общими для всех экземпляров класса

4
4


Попытка вызова атрибута экземпляра, который не был определен вызывает$\textbf{AttributeError}$. Такая же ошибка выдается при попытке вызова несуществующего метода.

$\textbf{Пример:}$

In [4]:
class Rectangle(object):
    def __init__(self, width, height):
        self.width = width
        self.height = height
rect = Rectangle(7, 8)
print(rect.color)

AttributeError: 'Rectangle' object has no attribute 'color'

# Наследование

С помощю $\textbf{наследования}$ можно задать единую функциональность разным классам.

Предположим необходимо создать несколько классов $\textbf{Cat, Dog, Rabbit}$ и другие. Некоторые методы этих классов будут уникальными: только $\textbf{Dog}$ будет иметь метод $\textbf{bark}$ (от англ. - лай). Но другие методы будут одинаковыми: все классы будут иметь $\textbf{color}$ и $\textbf{name}$.

Это сходство можно выразить с помощью функции наследования, так чтобы все классы наследовали общую функциональность от $\textbf{суперкласса Animal}$. Наследование оформляется путем заключения в круглые скобки имени суперкласса, следующего за именем класса.

$\textbf{Пример:}$

In [5]:
class Animal(object):
    def __init__(self, name, color):
        self.name = name
        self.color = color
class Cat(Animal):
    def purr(self):
        print('Purr...')
        
class Dog(Animal):
    def bark(self):
        print("Woof!")
        
fido = Dog('Fido', 'brown')
print(fido.color)
fido.bark()

brown
Woof!


Класс, наследующий атрибуты или методы дугого класса, называется $\textbf{подклассом}$. Класс, из которого наследуються атрибуты или методы, называется $\textbf{суперклассом}$. 

Если наследуемый класс имеет такие же атрибуты или методы, что и класс-наследник, то класс-наследник переопределяет их.

In [6]:
class Wolf(object):
    def __init__(self, name, color):
        self.name = name
        self.color = color
    def bark(self):
        print('Grr...')
        
class Dog(Wolf):
    def bark(self):
        print('Woof')

husky = Dog('Max', 'grey')
husky.bark()

Woof


Наследование может быть также непрямым. Один класс может наследовать от другого класса, который в свою очередь может наследовать от третьего класса. Круговое наследование, тем не менее, не поддерживается.

$\textbf{Пример:}$

In [7]:
class A(object):
    def method(self):
        print('method A')
        
class B(A):
    def another_method(self):
        print('method B')
        
class C(B):
    def third_method(self):
        print('method C')
        
        
c = C()
c.method()
c.another_method()
c.third_method()

method A
method B
method C


Функция $\textbf{super}$ - полезная функция наследования, которая указывает на родительский класс. Предназначена для поиска метода по его имени в суперклассе объекта.

$\textbf{Пример:}$

In [9]:
class A(object):
    def spam(self):
        print(1)
class B(A):
    def spam(self):
        print(2)
        super().spam()
B().spam()

2
1


# Магические методы

$\textbf{Магические методы}$ это специальные методы с $\textbf{двойным подчеркиванием}$ в начале и конце своих имен (в английском языке они известны как $\textbf{"dunders"}$). До этого момента из подобных рассматривался только $\textbf{__init__}$, но существует и множество других. Они предназначены для создания специальной функциональности. 

Магические методы часто применяються для $\textbf{переопределения операторов}$. Под этим подразумевается определение операторов для пользовательских классов, которые поддерживают такие классы как $\textbf{+}$ и $\textbf{*}$.

Пример магического метода $\textbf{__add__}$ для операции $\textbf{+}$.

In [3]:
class Vector2D(object):
    def __init__(self, x, y):
        self.x = x
        self.y = y
    def __add__(self, other):
        return Vector2D(self.x + other.x, self.y + other.y)

first = Vector2D(5,7)
second = Vector2D(3,9)

result = first + second

print(result.x)
print(result.y)
print(type(result))

8
16
<class '__main__.Vector2D'>


Метод $\textbf{__add__}$ позволяет определить специальное поведение для оператора + в данном классе. Таким образом определяются соответствующие атрибутам объектов и возвращается новый объект, содержащий результат. После этого можно объеденить два объекта класса.

Магические матоды для распространенных операторов:

$\textbf{__sub__}$ для  $\textbf{-}$

$\textbf{__mul__}$ для  $\textbf{*}$

$\textbf{__truediv__}$ для  $\textbf{/}$

$\textbf{__floordiv__}$ для  $\textbf{//}$

$\textbf{__mod__}$ для  $\textbf{%}$

$\textbf{__pow__}$ для  $\textbf{**}$

$\textbf{__and__}$ для  $\textbf{&}$

$\textbf{__xor__}$ для  $\textbf{^}$

$\textbf{__or__}$ для  $\textbf{|}$

Выражение $\textbf{x + y}$ представляется как $\textbf{x.__add__(y)}$. Но если метод $\textbf{__add__}$ не выполняется, а $\textbf{x}$ и $\textbf{y}$ различных типов, тогда используется $\textbf{y.__radd__(x)}$.

У всех упомянутых выше магических методов есть аналогичные методы $\textbf{r}$

$\textbf{Пример:}$

In [5]:
class SpecialString(object):
    def __init__(self, cont):
        self.cont = cont
        
    def __truediv__(self, other):
        line = '='*len(other.cont)
        return '\n'.join([self.cont, line, other.cont])
    
spam = SpecialString('spam')
hello = SpecialString('eggs')

print(spam/hello) # в данном примере определена операция разделения для класса SpecialString

spam
====
eggs


В Python также есть магические методы для операций сравнения.

$\textbf{__lt__}$ для  $\textbf{<}$

$\textbf{__le__}$ для  $\textbf{<=}$

$\textbf{__eq__}$ для  $\textbf{==}$

$\textbf{__ne__}$ для  $\textbf{!=}$

$\textbf{__gt__}$ для  $\textbf{>}$

$\textbf{__ge__}$ для  $\textbf{<=}$

Если $\textbf{__ne__}$ не выполнятеся, возвращается значение, противоположное $\textbf{__eq__}$.
Кроме этого, других отношений между различными операторами больше нет.

$\textbf{Пример:}$

In [6]:
class SpecialString(object):
    def __init__(self, cont):
        self.cont = cont
        
    def __gt__(self, other):
        for index in range(len(other.cont)+1):
            result = other.cont[:index] + '>' + self.cont
            result += '>' + other.cont[index:]
            
            print(result)
spam = SpecialString('spam')
eggs = SpecialString('eggs')

spam > eggs

>spam>eggs
e>spam>ggs
eg>spam>gs
egg>spam>s
eggs>spam>


Как видно из примера, переопределяя операторы, можно задавать им любое специальное поведение.

Сущесвует несколько магических методов, которые задают классам функциональность контейнеров.

$\textbf{__len__}$ для  $\textbf{len()}$

$\textbf{__getitem__}$ для  $\textbf{индексации}$

$\textbf{__setitem__}$ для  $\textbf{присваивания значения индексированному элементу}$

$\textbf{__delitem__}$ для  $\textbf{удаления индексированных элементов}$ 

$\textbf{__iter__}$ для  $\textbf{перебора объектов}$ (например в циклах) $\textbf{for}$

$\textbf{__contains__}$ для  $\textbf{in}$

Существуют множество других магических методов, все из которых нет смысла рассматривать:
Примеры:
$\textbf{__call__}$ - используется для вызова объектов как функций;
$\textbf{__int__}$, $\textbf{__str__}$ и другие подобные им - перобразуют объекты в родные для Python типы данных.

$\textbf{Примеры:}$

In [8]:
import random

class VagueList(object):
    def __init__(self, cont):
        self.cont = cont
        
    def __getitem__(self, index):
        return self.cont[index + random.randint(-1, 1)]
    
    def __len__(self):
        return random.randint(0, len(self.cont)*2)
    
vague_list = VagueList(['A', 'B', 'C', 'D', 'E'])

print(len(vague_list)) # Функция len переопределена и возвращает случайное число
print(len(vague_list))
print(vague_list[2]) # Функция индексации также переопределена и возвращает случайный элемент в заданном диапазоне
print(vague_list[2])

2
3
B
C


# Жизненый цикл объекта

$\textbf{Создние, использование}$ и $\textbf{уничтожение}$ составляет жизненный цикл объекта.

Первый этап жизненного цикла объекта - $\textbf{определение}$ класса, к которому он принадлежит.
Следующий этап - инстанцирование экземпляра, когда вызывается метод $\textbf{__init__}$. Выделяется память под хранение экземпляра. Непосредственно перед этим вызыается метод класса $\textbf{__new__}$. Это действие, как правило, отменяется только в редких случаях. После этого объект готов к использованию и с ним можно взаимодействовать: вызывать функции и использовать его атрибуты. В конце концов, когда объект больше не нужен, он может быть уничтожен.

Когда объект $\textbf{уничтожается}$, выделенная для него память освобождается и может быть использована для других целей. Уничтожение объекта происходит тогда, когда количество ссылок на него достигает нуля. $\textbf{Количество ссылок}$ - это число переменных и других элементов, которые ссылаються на объект. Если на объект ничто не ссылается (количество ссылок равно нулю), ничто не взаимодействует с ним, так что его можно смело удалять.

В некоторых ситуациях, два (или более) объекта могут ссылаться только друг на друга, и, следовательно, также могут быть удалены.

Инструкция $\textbf{del}$ уменшает количество ссылок объекта на единицу, что часто приводит к его удалению.
Для инструкции $\textbf{del}$ используется магический метод $\textbf{__del__}$.

Процесс удаления ненужных объектов называется $\textbf{сборкой мусора}$.

Когда же объекту присваивается новое имя или его включают в контейнер (список, кортеж, словарь), количество ссылок на него увеличивается на единицу. Число ссылок объекта уменьшается, когда он удаляется с помощью интрукции $\textbf{del}$, одна из его ссылок была переназначена, или когда его ссылка указывает на элемент за рамки доступного диапазона. Когда количество ссылок объекта достигает нуля, Python  фвтоматически удаляет его.

$\textbf{Пример:}$

In [12]:
a = 42 # создание объекта <42>
b = a # увеличение количества ссылок
c = [a] # увеличение количества ссылок

del a # уменьшение количества ссылок
print(b)
b = 100 # уменьшение количества ссылок
print(c)
c[0] = -1 # уменьшение количества ссылок
# В системе не осталось ссылок на объект <42>

42
[42]


# Сокрытие данных

Одним из ключевых понятий ООП является $\textbf{инкапсуляция}$ - упаковка в целях простоты использования связанных переменных и функций в один объект (экземпляр класса).

$\textbf{Сокрытие данных}$ - близкое к инкапсуляции понятие, суть которого в том что детали реализации класса должны быть скрыты, и чистый стандартный интерфейс должен быть представлен тем, кто будет использовать класс.

В других языках программирования это достигается с использованием частных методов и атрибутов, которые закрывают доступ извне к определенным методам и атрибутам классам.

Идеология Python несколько иной направленности. В сообществе Python  часто звучит фраза $\textbf{"мы все взрослые и по своему согласию здесь"}$, что означает, что не следует устанавливать свои ограничения на доступ к отдельным частям класса. Так как все равно невозможно обеспечить строгую частность метода или атрибута. Тем не менее можно сделать предупрежение о доступе к некоторым частям класса, например, указать, что эта деталь должна использоваться на свой страх и риск.

Условно частные методы и атрибуты оформляются с $\textbf{единичным подчеркиванием}$ в начале имени. 

Это частные методы, которые не должны взаимодействовать со внешней частью программы. Но часто это правило условно; внешняя часть программы может получить к ним доступ. 

Реальная особенность этих методов лишь в том, что $\textbf{from module_name import *}$ не будет импортировать переменные, которые начинаються с едничного подчеркивания.

$\textbf{Пример:}$

In [14]:
class Queue(object):
    def __init__(self, contents):
        self._hiddenlist = list(contents)
        
    def push(self, value):
        self._hiddenlist.insert(0, value)
        
    def pop(self):
        return self._hiddenlist.pop(-1)
    
    def __repr__(self): # __repr__ возвращает экземпляр в виде строки
        return 'Queue({})'.format(self._hiddenlist)
    
    
queue = Queue([1, 2, 3])
print(queue)
queue.push(0)
print(queue)
queue.pop()
print(queue)
print(queue._hiddenlist)
        
    

Queue([1, 2, 3])
Queue([0, 1, 2, 3])
Queue([0, 1, 2])
[0, 1, 2]


Не смотря на то, что атрибут $\textbf{_hiddenlist}$ помечен как частный, но внешний код все же может получить к нему доступ.

Строго частные методы и арибуты оформляються с $\textbf{двойным подчеркиванием}$ в началеимени. Таким образом их имена искажаються, и внешняя часть программы не может получить к ним доступ. Но это делается не для того, чтобы обеспечить их частность, а что бы избежать ошибок, если где-либо в коде есть подклассы, которые имеют методы или атрибуты с такими же именами. 

Методы с искаженными именами все же могут быть вызваны извне, но по другим именам. Метод $\textbf{__privatemethod}$ класса $\textbf{Spam}$ может быть вызван извне по имени $\textbf{_Spam__privatemethod}$. 

$\textbf{Пример:}$

In [15]:
class Spam(object):
    __egg = 7
    def print_egg(self):
        print(self.__egg)
        
s = Spam()
s.print_egg()
print(s._Spam__egg)
print(s.__egg)

7
7


AttributeError: 'Spam' object has no attribute '__egg'

Практически, Python самостоятельно защищает члены класса: автомаически включая имя класса в их имена.

# Методы класса

Методы объектов вызываются экземпляром класса, который затем перетается в параметр $\textbf{self}$.

$\textbf{Методы класса}$ несколько другие: они вызываються классом, который передается параметру $\textbf{cls}$ метода. Чаще всего это используется в фабричных методах: создается экземпляр класса, при этом используются иные параметры, чем те, которые обычно передаются в конструктор класса.

Методы класса оформляются с $\textbf{деократором classmethod}$.

$\textbf{Пример:}$

In [1]:
class Rectangle(object):
    def __init__(self, width, height):
        self.width = width
        self.height =height
        
    def calculate_area(self):
        return self.width * self.height
    
    @classmethod
    def new_square(cls, side_length):
        return cls(side_length, side_length)
    
square = Rectangle.new_square(5)
print(square.calculate_area())

25


$\textbf{new_square}$ - метод класса и вызывается для класса, а не для экземпляра класса.Он возвращает новый объект класса $\textbf{cls}$.

In [2]:
type(square)

__main__.Rectangle

Практически параметры $\textbf{self}$ и $\textbf{cls}$ используются просто по традиции; вместо них могут использоваться другие. Тем не менее все их используют, так что имеет смысл придрживаться традиции. 

# Статические методы

$\textbf{Статические методы}$ похожи на методы класса с тем отличием, что они не берут никаких дополнительных аргументов; они аналогичны обычным функциям класса. Они оформляются с декоратором $\textbf{staticmethod}$.

$\textbf{Пример:}$

In [3]:
class Pizza(object):
    def __init__(self, toppings):
        self.toppings = toppings
        
    @staticmethod
    def validate_topping(topping):
        if topping == "pineapple":
            raise ValueError('No pineapples!')
        else:
            return True
ingredients = ["cheese", "onions", 'spam']
if all(Pizza.validate_topping(i) for i in ingredients):
    pizza = Pizza(ingredients)

Статические методы ведут себя как обычные функции с тем отличием, что их можно вызвать экземпляром класса.

# Свойства

В $\textbf{свойствах}$ можно настроить доступ к атрибутам экземпляра. 

Чтобы создать свойства, непосредсвенно перед методом помещается декоратор $\textbf{property}$: при вызове атрибута экземпляра с таким же именем, что и у метода, вместо него будет вызван метод. Один из распросраненных способов их применения - присвоение атрибуту свойства $\textbf{"только для чтения"}$.

$\textbf{Пример:}$

In [4]:
class Pizza(object):
    def __init__(self, toppings):
        self.toppings = toppings
        
    @property
    def pineapple_allowed(self):
        return False
    
pizza = Pizza(['cheese','tomato'])
print(pizza.pineapple_allowed)
pizza.pineapple_allowed = True

False


AttributeError: can't set attribute

Свойства также могут быть заданы с помощью функций $\textbf{setter/getter}$.

Функция $\textbf{setter}$ устанавливает значение соответствующего свойства.

Функция $\textbf{getter}$ возвращает значение.

Что бы определить $\textbf{setter}$, используется декоратор с таким же именем, что и у свойства, с последующим ключевым словом $\textbf{setter}$, разделенные точкой. Точно так же определяются функции $\textbf{getter}$.

$\textbf{Пример:}$

In [7]:
class Pizza(object):
    def __init__(self, toppings):
        self.toppings = toppings
        self._pineapple_allowed = False
        
    @property
    def pineapple_allowed(self):
        return self._pineapple_allowed
    @pineapple_allowed.setter
    def pineapple_allowed(self, value):
        if value:
            password = input('Enter the password:')
            if password == 'Sw0rdf1sh!':
                self._pineapple_allowed = value
            else:
                raise ValueError('Alert! Intruder!')
                
pizza = Pizza(['cheese','tomato'])
print(pizza.pineapple_allowed)
pizza.pineapple_allowed = True
print(pizza.pineapple_allowed)

False
Enter the password:Sw0rdf1sh!
True


# Простая игра

При работе с различными объектами и их отношениями широко используется объектная ориентация. Основная область применения - разработка игр, где часто используются персонажи с различной функциональностью.

Ниже будет приведен пример простой игры (текстового кеста), на котором можно понять принципы работы и взаимодействия классов.
Для начала функция, обрабатывающая ввод и делающая простой разбор.

In [8]:
def get_input():
    command = input(':').split()
    verb_word = command[0]
    if verb_word in verb_dict:
        verb = verb_dict[verb_word]
    else:
        print('Unknown verb {}'.format(verb_word))
    if len(command) >= 2:
        noun_word = command[1]
        print(verb(noun_word))
    else:
        print(verb())
    return
    
def say(noun):
    return('You said {}'.format(noun))

verb_dict = {
    'say': say,
}

while True:
    get_input()

:say Hello1
You said Hello1
:say y
You said y
:test
Unknown verb test


UnboundLocalError: local variable 'verb' referenced before assignment

In [13]:
# просто чекинг
def no(x):
    return x**2

def yes(x):
    return x**3

func = {'no': no, 'yes': yes}

new_func = func['no']

print(new_func(5))

25


Создание игровых объектов с помощью классов

In [19]:
class GameObject(object):
    class_name = ''
    desc = ''
    objects = {}
    
    def __init__(self, name):
        self.name = name
        GameObject.objects[self.class_name] = self
        
    def get_desc(self):
        return self.class_name + '\n' + self.desc
class Goblin(GameObject):
    class_name = 'goblin'
    desc = 'A foul creature'
    
goblin = Goblin('Gobbly')

def examine(noun):
    if noun in GameObject.objects:
        return GameObject.objects[noun].get_desc()
    else:
        return "There is no {} here".format(noun)

Создается класс $\textbf{Goblin}$, который нааследует от класса $\textbf{GameObjects}$. Помимо этого создается новыя функция $\textbf{examine}$, которая возвращает описание объектов. Теперь можно добавить новый глагол "исследуй" в словарь и использовать его.

In [20]:
verb_dict = {"say": say, "examine": examine, "hit": hit}


In [14]:
while True:
    get_input()

:say hello
You said hello
:examine goblin
goblin
A foul creature
:examine elf
There is no elf here
:


IndexError: list index out of range

Далее добавляем дополнительные детали класса $\textbf{Goblin}$ и возможность $\textbf{бороться}$ против гоблинов. 

In [21]:
class Goblin(GameObject):
    def __init__(self, name):
        self.class_name = 'goblin'
        self.health = 3
        self._desc = 'A foul creature'
        super().__init__(name)
        
    @property
    def desc(self):
        if self.health >= 3:
            return self._desc
        elif self.health == 2:
            health_line = 'It has a wound on its knee.'
        elif self.health == 1:
            health_line = 'Its left arm has been cut off!'
        elif self.health <= 0:
            health_line = 'It is dead.'
        return self._desc + '\n' + health_line
    
    @desc.setter
    def desc(self, value):
        self._desc = value
        
def hit(noun):
    if noun in GameObject.objects:
        thing = GameObject.objects[noun]
        if type(thing) == Goblin:
            thing.health = thing.health - 1
            if thing.health <= 0:
                msg = 'You killed the goblin'
            else:
                msg = 'You hit the {}'.format(thing.class_name)
        else:
            msg = 'There is no {} here'.format(noun)
    return msg
        
        

In [23]:
goblin = Goblin('Gobbly')

In [24]:
while True:
    get_input()

:hit goblin
You hit the goblin
:hit goblin
You hit the goblin
:examine gobline
There is no gobline here
:examine goblin
goblin
A foul creature
Its left arm has been cut off!
:hit goblin
You killed the goblin
:


IndexError: list index out of range

# Регулярные выражения

Регулярные выражения в Python создаются с использованием модуля $\textbf{re}$, входящего в стандартную библиотеку.

После того, как определяется регулярное выражение, с помощью функции $\textbf{re.match}$ можно определить, если ли совпадения $\textbf{в начале}$ строки.

Если совпадение найдено, $\textbf{match}$ возвращает объект совпадения; в противном случае возвращается $\textbf{None}$. Во избежание путаницы в примерах будут использоваться "сырые" строки формата $\textbf{r"выражение"}$.  Сырые строки ничего не экранируют, поэтому с регулярными выражениями так легче работать.

$\textbf{Пример:}$

In [25]:
import re

patten = r'spam'

if re.match(patten, 'spamspamspam'):
    print('Match')
else:
    print('No match')

Match


Для поиска совпадений используются и другие функции, такие как $\textbf{re.search}$ и $\textbf{re.findall}$.

Функция $\textbf{re.search}$ используется для поиска набора символов в любом месте строки. 

Функция $\textbf{re.findall}$ возвращает список всех подстрок, которые совпадают с искомым набором символов.

$\textbf{Пример:}$

In [27]:
if re.match(patten, 'eggspamsausagespam'):
    print('Match')
else:
    print('No match')
    
if re.search(patten, 'eggspamsausagespam'):
    print('Match')
else:
    print('No match')
    
print(re.findall(patten, 'eggspamsausagespam'))

No match
Match
['spam', 'spam']


В первом примере функция $\textbf{re.match}$ не нашла совпадений, так как она искала в начале строки.

Функция $\textbf{re.finditer}$ делает тоже самое, что и $\textbf{re.findall}$, за исключением того, что она возвращает итератор, а не список.

In [28]:
print(re.finditer(patten, 'eggspamsausagespam'))

<callable_iterator object at 0x7f4e2f484320>


Поиск с регулярными выражениями возвращает объект с несколькими методами, содержащими информацию об объекте.

Это такие методы как $\textbf{group}$, возвращающий совпадающую строку, $\textbf{start}$ и $\textbf{end}$, возвращает начальную и конечную позицию первого совпадения, и $\textbf{span}$, возвращает начальную и конечную позицию первого совпадения в виде кортежа.

$\textbf{Пример:}$

In [29]:
pattern = r'pam'

match = re.search(pattern, 'eggspamsausagespam')
if match:
    print(match.group())
    print(match.start())
    print(match.end())
    print(match.span())

pam
4
7
(4, 7)


## Поиск с заменой 

Один из наиболее выжных методов $\textbf{re}$, используемых в регулярных выражениях, метод $\textbf{sub}$.

$\textbf{Синтаксис: }$

In [None]:
re.sub(patten, repl, string, max = 0)

Этот метод заменяет все упоминания $\textbf{набора символов}$ в строке на $\textbf{repl}$: заменяются все упонимания, если не установлено ограничение $\textbf{max}$. Метод возвращает новую версию строки.

$\textbf{Пример:}$

In [30]:
string = 'My name is David. Hi David'
pattern = r'David'
newString = re.sub(pattern, 'Amy', string)
print(newString)

My name is Amy. Hi Amy


## Метасимволы 

Именно благодаря использованию $\textbf{метасимволов}$ регулярные выражения эффективнее обычных строковых методов. Они позволяют выражать с помощью регулярных выражений такие сложные условия, как "одно или несколько повторений гласных". 

Существование метасимволов несколько усложняет создание регулярных выражений, состоящих из обычных символов, являющихся также метасимволами, например \$. В таких случаях метасимволы необходимо экранировать, ставя пред ними $\textbf{обратную косую черту}$.

Хотятакой способ также может создать проблемы, так как обрятные косые черты также имеют функцию экранирования. По этой причине может понадобиться три или четыре бэкслеша в строке. Что бы избежать этого, можно использовать сырую строку.

$\textbf{Точка}$ означает $\textbf{любой символ}$, исключая символ новой строки.

$\textbf{Пример:}$

In [31]:
pattern = r'gr.y'

if re.match(pattern, 'grey'):
    print('Match 1')
if re.match(pattern, 'gray'):
    print('Match 2')
if re.match(pattern, 'blue'):
    print('Match 3')

Match 1
Match 2


Метасимволы $\textbf{^}$ и $\textbf{\$}$ указывают соответственно на $\textbf{начало}$ и $\textbf{конец}$ строки.

$\textbf{Пример:}$

In [40]:
pattern = r'^gr.y$' #н данный набор символов означает, что строка должна начинаться с gr, в середине содержать
# любой символ, за исключением символа новой строки, и заканчиваться на y.

if re.match(pattern, 'grey'):
    print('Match 1')
if re.match(pattern, 'gray'):
    print('Match 2')
if re.match(pattern, 'stingray'):
    print('Match 3')

Match 1
Match 2


## Классы символов 

$\textbf{Классы символов}$ предназначены для поиска конкретного символа из набора символов.

Класс символов создается путем заключения искомых символов в $\textbf{квадратные скобки}$.

$\textbf{Пример:}$

In [35]:
pattern = r'[aeiou]' # при поиске с таким набором будут найдены все строки, содержащие хотя бы один символ с набора

if re.search(pattern, 'grey'):
    print('Match 1')
if re.search(pattern, 'qwertyuiop'):
    print('Match 2')
if re.search(pattern, 'rhythm myths'):
    print('Match 3')

Match 1
Match 2


Классы символов могут также использоваться для поиска символов в заданном диапазоне.

Несколько примеров:

класс $\textbf{[a - z]}$ - поиск любой строчной буквы.

класс $\textbf{[G - P]}$ - поиск любого символа верхнего регистра от G до P.

класс $\textbf{[0 - 9]}$ - поиск любой цифры.

Класс может состоять из более чем одного диапазона. Нпример, класс $\textbf{[A - z a - z]}$ означает поиск любой буквы алфавита верхнего или нижнего регистра.

$\textbf{Пример:}$

In [38]:
pattern = r'[A-Z][A-Z][0-9]'

if re.search(pattern, 'LS8'):
    print('Match 1')
if re.search(pattern, 'E3'):
    print('Match 2')
if re.search(pattern, '1ab'):
    print('Match 3')

Match 1


Чтобы $\textbf{инвертировать}$ класс символов, нужно поместить $\textbf{^}$ в начало определения класса.

Эта команда ищет любой символов, кроме символов класса.

Другие метасимволы, такие как $\textbf{\$}$ и $\textbf{.}$ не имеют никакого специального значения в классах символов.

Метасимвол $\textbf{^}$ не имеет специального значения, если он не является первым символом класса.

$\textbf{Пример:}$

In [39]:
pattern = r'[^A-Z]' # данный набор исключает строки с текстом в верхнем регистре

if re.search(pattern, 'this is all quiet'):
    print('Match 1')
if re.search(pattern, 'AaCdEfG123'):
    print('Match 2')
if re.search(pattern, 'THISISALLSHOUTING'):
    print('Match 3')

Match 1
Match 2


Среди других метасимволов: $\textbf{*}$, $\textbf{+}$, $\textbf{?}$, $\textbf{{}}$, которые задают число упоминаний.

$\textbf{*}$ - ноль или более упоминаний объектов поиска. Эта команда позволяет найти как можно больше упописаний.
"Объект поиска" указывается в $\textbf{скобках}$; им может быть один символ, класс или группа символов.

$\textbf{Пример:}$

In [41]:
pattern = r'egg(spam)*'

if re.match(pattern, 'egg'):
    print('Match 1')
if re.match(pattern, 'eggspamspamegg'):
    print('Match 2')
if re.match(pattern, 'spam'):
    print('Match 3')
    
"""
В примере будут найдены строки, начинающиеся с egg, за которой следует (или нет) неограниченое число упоминаний spam
"""

Match 1
Match 2


Меасимвол $\textbf{+}$ очень похож  на $\textbf{*}$ с тем отличием, что он означает "$\textbf{одно}$ (или более) упоминание", в отличие от "ноль или более упоминаний".

$\textbf{Пример:}$

In [42]:
pattern = r'g+'

if re.match(pattern, 'g'):
    print('Match 1')
if re.match(pattern, 'ggggggggg'):
    print('Match 2')
if re.match(pattern, 'abc'):
    print('Match 3')

Match 1
Match 2


Метасимвол $\textbf{?}$ означает "ноль или одно повторение".

$\textbf{Пример:}$

In [45]:
pattern = r'ice(-)?cream'

if re.match(pattern, 'ice-cream'):
    print('Match 1')
if re.match(pattern, 'icecream'):
    print('Match 2')
if re.match(pattern, 'sausages'):
    print('Match 3')
if re.match(pattern, 'ice-ice'):
    print('Match 4')

Match 1
Match 2


$\textbf{Фигурные скобки}$ можно использовать для поиска числа упоминаний между двумя числами.
Выражение $\textbf{{x, y}}$ означает "упоминания объекта поиска между x и y".

Следовательно, $\textbf{{0,1}}$ - тоже самое, что и $\textbf{?}$.

Если первое число отсутствует, интерпритатор считает, что это число 0. Если второе число отсутствует, то программа будет искать до бесконечности.

$\textbf{Пример:}$

In [46]:
pattern = r'9{1,3}$'

if re.match(pattern, '9'):
    print('Match 1')
if re.match(pattern, '999'):
    print('Match 2')
if re.match(pattern, '99999'):
    print('Match 3')

Match 1
Match 2


## Группы 

Группа создается путем заключения части регулярного выражения в $\textbf{круглые скобки}$. Это значит, что группа может быть задана в качестве аргумента метасимволами, такими как * и ?.

$\textbf{Пример:}$

In [47]:
pattern = r'egg(spam)*' # (spam) представляет собой группу внутри набора символов

if re.match(pattern, 'egg'):
    print('Match 1')
if re.match(pattern, 'eggspamspamspamspamegg'):
    print('Match 2')
if re.match(pattern, 'spam'):
    print('Match 3')


Match 1
Match 2


Содержание групп можно получить с помощью функции $\textbf{group}$.

Вызов метода $\textbf{group(0)}$ или $\textbf{group()}$ возвращает все найденые совпадения. Вызов метода $\textbf{group(n)}$, где $\textbf{n}$ больше 0, возвращает $\textbf{n}$-ю группу, считая слева.

Метод $\textbf{groups()}$ возвращает все группы, начиная с первой.

$\textbf{Пример:}$

In [48]:
pattern = r'a(bc)(de)(f(g)h)i' # группы могут быть вложенными

match = re.match(pattern, 'abcdefghijklmno')
if match:
    print(match.group())
    print(match.group(0))
    print(match.group(1))
    print(match.group(2))
    print(match.groups())

abcdefghi
abcdefghi
bc
de
('bc', 'de', 'fgh', 'g')


Есть несколько типов специальных групп.

Две наиболее важные: именованные группы и "незахватывающие" группы.

Формат $\textbf{именованных групп: (?P<name>)...}$, где $\textbf{name}$ - имя группы, а $\textbf{...}$ - содержание группы. У них точно такая же функциональность, как и у обычных групп, но их можно получить не только по номеру, но и с помощью метода $\textbf{group(name)}$.

Формат "незахватывающих" групп: $\textbf{(?:....)}$.

Их нельзя получить по методу группы, поэтому их можно добавлять в регулярное выражение, не нарушая нумерацию.

$\textbf{Пример:}$

In [49]:
pattern = r'(?P<first>abc)(?:def)(ghi)'

match = re.match(pattern, 'abcdefghi')
if match:
    print(match.group('first'))
    print(match.groups())

abc
('abc', 'ghi')


Другой важный метасимвол $\textbf{|}$, который имеет значение "или". Т.о. в результате выражения $\textbf{красный|синий}$ вернется либо "красный" или "синий".

$\textbf{Пример:}$

In [50]:
pattern = r'gr(a|e)y'

if re.match(pattern, 'gray'):
    print('Match 1')
if re.match(pattern, 'grey'):
    print('Match 2')
if re.match(pattern, 'griy'):
    print('Match 3')

Match 1
Match 2


## Специальные последовательности 

В регулярных выражениях также используются различные $\textbf{специальные последовательные}$. Их синтаксис записывается как бэкслэш, за которым следует другой символ.
Одна такая специальная последовательность: бэкслеш и число от 1 до 99, например, \1 или \17. Такая последовательность соответствует выражению группы с таким же числом. 

$\textbf{Пример:}$

In [52]:
pattern = r'(.+) \1'


if re.match(pattern, 'word word'):
    print('Match 1')
if re.match(pattern, '?! ?!'):
    print('Match 2')
if re.match(pattern, 'abc cde'):
    print('Match 3')    

Match 1
Match 2


Стоит обратить внимание, что $\textbf{(.+) \1}$ - не то же самое, что $\textbf{(.+) (.+)}$, потому что $\textbf{\1}$ относится к подвыражению первой группы, которое само по себе является совпавшим выражением, а не набором символов регулярного выражения.

Есть другие специальные последовательности: $\textbf{\d}$, $\textbf{\s}$ и $\textbf{\w}$.

Они означают соответственно $\textbf{цифры}$ (d от англ. digits), $\textbf{пробелы}$ (s от англ. spaces) и $\textbf{символы слов}$ (w от англ. word characters). 

В режиме ASCII им соответствуют [0-9], [\t\n\r\f\v] и [a-zA-z0-9_].

В режиме Unicode они соответствуют также некоторым другим символам, Например символ $\textbf{\w}$ соответствует символам с диактрикой.

Если эти специальные последовательности записаны заглавными буквами ($\textbf{\D}$, $\textbf{\S}$ и $\textbf{\W}$), они имеют противоположное значение. Например, $\textbf{\D}$ совпадает с любыми символами, кроме цифр.

$\textbf{Пример:}$

In [53]:
pattern = r'(\D+\d)' # будет искать один (или несколько) нецифровых символов с последующей цифрой


if re.match(pattern, 'Hi 999!'):
    print('Match 1')
if re.match(pattern, '1, 23, 456!'):
    print('Match 2')
if re.match(pattern, '! $?'):
    print('Match 3') 

Match 1


## Извлечение адреса почты(пример) 

Для демонстрации соорудим код для извлечения адреса электронной почты из программной строки.
Как правило адрес состоит из нескольких частей:
1 - первая часть адреса, которая может содержать слова, цифры, точки и тирэ. Далее следует знак @.
2 - имя домена
3 - суффикс доменного имени

$\textbf{[\w\.-]+}$ соответствует одному или более символу слова, точке или черточке. Следовательно шаблон должен будет выглядеть следующим образом:

In [1]:
pattern = r'([\w\.-]+)@([\w\.-]+)(\.[\w\.]+)'

In [2]:
string = 'Please contact info@sololearn.com for assistance'

In [4]:
import re


match = re.search(pattern, string) 
if match:
    print(match.group())

info@sololearn.com


Если строка содержит несколько адресов электронной почты, можно использоват метод re.findall вместо re.search, что бы извлечь все адреса электронной почты.

# Тернарный оператор

In [6]:
a = 4
b = 1 if a >= 5 else 42
print(b)

42
