## Перегрузка методов. Индексирование и нарезание. Протокол итерации. 

На прошлом семинаре мы говорили о том, что в классах бывают следующие разновидности методов:

- методы экземпляра класса
- методы класса
- статические методы
- магические методы (по сути, тоже методы экземпляра класса, но с зарезервированным именем)

Вот последние методы нас и интересуют сегодня. Это те методы, которые обычно явным образом не вызываются, и их имена зарезервированы в питоне (они пишутся обычно с двумя нижними подчеркиваниями слева и справа). Часть этих методов определена в верхнем объекте иерархии питона object, от которого неявно наследуют все создаваемые классы. Смысл многих из этих методов вам будет интуитивно понятен. Ниже приведен полный их список.

|Метод|Описание|
|---|---|
|\_\_abs\_\_|Absolute value of a given argument|
|\_\_add\_\_|Addition x + y for x and y arguments|
|\_\_aenter\_\_|Like \_\_enter\_\_() but must return an awaitable|
|\_\_aexit\_\_|Like \_\_exit\_\_() but must return an awaitable|
|\_\_aiter\_\_|Returns an asynchronous iterator|
|\_\_and\_\_|Bitwise “AND” of a and b|
|\_\_anext\_\_|Return an awaitable as the next value of the iterator argument|
|\_\_annotations\_\_|A dict containing annotations (values) associated to parameter names (keys)|
|\_\_await\_\_|Return an iterator to implement awaitable objects|
|\_\_bool\_\_|Truth value testing for built-in bool() returning False or True. If undefined, call \_\_len\_\_()|
|\_\_bytes\_\_|Called by bytes() to compute a byte-string representation of an object. Must return a bytes object.|
|\_\_call\_\_|Called when a given instance is called as a function|
|\_\_ceil\_\_|Implement math function ceil()|
|\_\_complex\_\_|Implement the built-in functions complex() to create a new complex number|
|\_\_contains\_\_|Implements the Python in operator to check membership.|
|\_\_del\_\_|Called when the instance is about to be destroyed|
|\_\_delattr\_\_|Delete an attribute|
|\_\_delete\_\_|Delete the attribute on an instance of the owner class.|
|\_\_delitem\_\_|Remove the value of the first argument at index as defined in second argument.|
|\_\_dir\_\_|Called when dir(x) is called on object x.|
|\_\_div\_\_|The division operator (/) in Python 2 is implemented by this dunder method. For Python 3, the \_\_truediv\_\_() method is used instead.|
|\_\_divmod\_\_|Implements the divmod() built-in method. Python’s built-in divmod(a, b) function takes two integer or float numbers a and b as input arguments and returns a tuple (a // b, a % b).|
|\_\_enter\_\_|Enter the runtime context related to this object.|
|\_\_eq\_\_|Rich comparison: x==y calls x.\_\_eq\_\_(y)|
|\_\_exit\_\_|Exit the runtime context related to this object.|
|\_\_float\_\_|Called to implement the built-in function float().|
|\_\_floor\_\_|Implements behavior for math.floor(), i.e., rounding down to the nearest integer.|
|\_\_floordiv\_\_|Implements a//b|
|\_\_format\_\_|The Python \_\_format\_\_() method implements the built-in format() function as well as the string.format() method. So, when you call format(x, spec) or string.format(spec), Python attempts to call x.\_\_format\_\_(spec). The return value is a string.|
|\_\_ge\_\_|Return whether x is greater than or equal y|
|\_\_get\_\_|Called on the attribute type to get a class attribute or instance attribute of the owner class.|
|\_\_getattr\_\_|Called when the default attribute access fails with an AttributeError|
|\_\_getattribute\_\_|Called unconditionally to implement attribute accesses for instances of the class. If the class also defines \_\_getattr\_\_(), this method won’t be called unless \_\_getattribute\_\_() either calls it explicitly or raises an AttributeError.|
|\_\_getitem\_\_|Return the value of a at index b.|
|\_\_gt\_\_|Returns the result of the greater than operation x > y|
|\_\_hash\_\_|Called by built-in function hash(), should return an integer.|
|\_\_hex\_\_|Does not work for Python 3. Use \_\_index\_\_() instead.|
|\_\_iadd\_\_|a = iadd(a, b) is equivalent to a += b.|
|\_\_iand\_\_|a = iand(a, b) is equivalent to a &= b.|
|\_\_idiv\_\_|a = idiv(a, b) is equivalent to a /= b in Python 2. In Python 3, this is replaced by \_\_itruediv\_\_.|
|\_\_ifloordiv\_\_|a = ifloordiv(a, b) is equivalent to a //= b.|
|\_\_ilshift\_\_|a = ilshift(a, b) is equivalent to a <<= b.|
|\_\_imatmul\_\_|a = imatmul(a, b) is equivalent to a @= b.|
|\_\_imod\_\_|a = imod(a, b) is equivalent to a %= b.|
|\_\_import\_\_|Import a library by name. For example, to import the NumPy library dynamically, you could run \_\_import\_\_('numpy').|
|\_\_imul\_\_|a = imul(a, b) is equivalent to a *= b.|
|\_\_index\_\_|Returns the object converted to an integer. This is used for many built-in functions such as oct(), hex(), or bin().|
|\_\_init\_\_|Called after the instance has been created (by \_\_new\_\_()), but before it is returned to the caller.|
|\_\_init_subclass\_\_|This method is called whenever the class defining it is subclassed.|
|\_\_instancecheck\_\_|Return True if instance should be considered a direct or indirect instance of class. If defined, called to implement isinstance(instance, class).|
|\_\_int\_\_|Called to implement the built-in function int().|
|\_\_invert\_\_(x)|Return the bitwise inverse ~x of the number x.|
|\_\_ior\_\_|a = ior(a, b) is equivalent to a |= b.|
|\_\_ipow\_\_|a = ipow(a, b) is equivalent to a \*\*= b.|
|\_\_irshift\_\_|a = irshift(a, b) is equivalent to a >>= b.|
|\_\_isub\_\_|a = isub(a, b) is equivalent to a -= b.|
|\_\_iter\_\_|This method is called when an iterator is required for a container. It returns a new iterator object that can iterate over all the objects in the container.|
|\_\_itruediv\_\_|a = itruediv(a, b) is equivalent to a /= b.|
|\_\_ixor\_\_|a = ixor(a, b) is equivalent to a ^= b.|
|\_\_le\_\_|Returns True if the former is less than or equal to the latter argument, i.e., x <= y|
|\_\_len\_\_|Called to implement the built-in function len(). Returns the length of the object >= 0. An object that doesn’t define \_\_bool\_\_() is considered False if its \_\_len\_\_() method returns zero.|
|\_\_lshift\_\_|Return x shifted left by y.|
|\_\_lt\_\_|Returns the result of the less than operation x < y|
|\_\_matmul\_\_|Return a @ b.|
|\_\_missing\_\_|Called by dict.\_\_getitem\_\_() to implement self[key] for dict subclasses when key is not in the dictionary.|
|\_\_mod\_\_|Return x % y.|
|\_\_mul\_\_|Return a * b, for a and b numbers.|
|\_\_ne\_\_|Rich comparison: x!=y and x<>y call x.\_\_ne\_\_(y)|
|\_\_neg\_\_|Return x negated (-x).|
|\_\_new\_\_|Called to create a new instance of a given class cls.|
|\_\_next\_\_|Return the next item from the container.|
|\_\_oct\_\_|Does not work for Python 3. Use \_\_index\_\_() instead.|
|\_\_or\_\_|Return the bitwise or of a and b.|
|\_\_pow\_\_|Return a ** b, for a and b numbers.|
|\_\_radd\_\_|Called to implement the binary arithmetic operation + with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rand\_\_|Called to implement the binary arithmetic operation & (\_\_and\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rdiv\_\_|Called to implement the binary arithmetic operation / (\_\_div\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rdivmod\_\_|Called to implement the binary arithmetic operation divmod() with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_repr\_\_|Called by the repr() built-in function to compute the “official” string representation of an object.|
|\_\_reversed\_\_|Called (if present) by the reversed() built-in to implement reverse iteration. It should return a new iterator object that iterates over all the objects in the container in reverse order.|
|\_\_rfloordiv\_\_|Called to implement the binary arithmetic operation // (\_\_floordiv\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rlshift\_\_|Called to implement the binary arithmetic operation << (\_\_lshift\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rmatmul\_\_|Called to implement the matmul operation @ (\_\_matmul\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rmod\_\_|Called to implement the binary arithmetic operation % (\_\_mod\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rmul\_\_|Called to implement the binary arithmetic operation * (\_\_mul\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_ror\_\_|Called to implement the binary arithmetic operation \| (\_\_or\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_round\_\_|Called to implement the built-in function round() and math functions trunc(), floor() and ceil().|
|\_\_rpow\_\_|Called to implement the arithmetic multiplication operation ** (\_\_pow\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rrshift\_\_|Called to implement the binary arithmetic operation >> (\_\_rshift\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rshift\_\_|Return a shifted right by b, i.e., a >> b.|
|\_\_rsub\_\_|Called to implement the binary arithmetic operation – (\_\_sub\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rtruediv\_\_|Called to implement the binary arithmetic operation / (\_\_truediv\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_rxor\_\_|Called to implement the binary arithmetic operation ^ (\_\_xor\_\_) with reflected (swapped) operands. Only called if the left operand does not support the corresponding operation and the operands are of different types.|
|\_\_set\_\_|Called to set the attribute on an instance of the owner class to a new value.|
|\_\_set_name\_\_|Called at the time the owning class owner is created. The descriptor has been assigned to name.|
|\_\_setattr\_\_|Called when you assign an attribute via setattr() instead of the normal mechanism of storing the value in the instance dictionary.|
|\_\_setitem\_\_|Set a given element at a given index to a new value.|
|\_\_sizeof\_\_|Returns the internal size in bytes for the given object|
|\_\_str\_\_|Called by str(object) and the built-in functions format() and print() to compute the “informal” or printable string representation of an object.|
|\_\_sub\_\_|Return a - b.|
|\_\_subclasscheck\_\_|Return true if subclass should be considered a (direct or indirect) subclass of class. If defined, called to implement issubclass(subclass, class).|
|\_\_subclasses\_\_|Finds all subclasses of a given class.|
|\_\_truediv\_\_|Return a / b where 2/3 is .66 rather than 0. This is also known as “true” division.|
|\_\_trunc\_\_|Called to implement the math.trunc() function.|
|\_\_xor\_\_|Return the bitwise exclusive or of a and b.

Итак, что же такое перегрузка операций? 

Перегрузка операций позволяет объектам, созданным из классов, перехватывать и реагировать на операции, которые работают со встроенными типами: сложение, нарезание, вывод, уточнение и т.д. То есть, это и есть когда мы переопределяем магические методы. Все эти методы переопределять необязательно, но если мы потом попытаемся применить такой метод, не переопределив его, вызовем исключение. 

Как правило, перегрузка операций используется разработчиками инструментов: обычным программистам может быть проще писать обычные методы экземпляра класса. Один из немногих методов, который обычно перегружается, - это \_\_init\_\_. Знать о перегрузке все же полезно, потому что тогда становятся понятны многие механизмы, работающие в этих самых инструментах, например, будет понятно, почему мы в pytorch пишем nn.Flatten()(x) и как в razdel устроена работа sentenize. 

До сегодняшнего мы перегружали в основном три метода: \_\_init\_\_, \_\_repr\_\_ и \_\_str\_\_. С двумя последними вроде все понятно, а вот первый может иногда хотеться перегрузить не полностью: не перезаписать его с нуля, а только добавить что-то свое. Например, у класса Human есть в динамических атрибутах имя и возраст, а у класса-ребенка Student хотим добавить курс. Как сделать это без копипасты?

Можно при перегрузке метода \_\_init\_\_ вызвать из него же родительский метод \_\_init\_\_. Это может выглядеть так:

In [5]:
class Human:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    
class Student(Human):
    def __init__(self, name, age, course):
        Human.__init__(self, name, age) # явно передаем self тоже, потому что вызываем метод от имени класса
        self.course = course

In [6]:
vasya = Student('Вася', 19, 2)

Но в питоне (для лучшей поддержки кода) есть специальная немного особенная функция, которая называется super(). Она служит ровно для этого:

In [7]:
class Student(Human):
    def __init__(self, name, age, course):
        super().__init__(name, age) # тут не нужно передавать self - super() сам его отыщет и передаст куда надо
        self.course = course
        
vasya = Student('Вася', 19, 2)

### Итерирование и связанные методы

Основная тема сегодняшнего разговора, однако - это **итерирование** и связанные с ним магические методы. 

С понятием итерируемого объекта связаны несколько важных вещей (действий), которые обычно с итерируемыми объектами и исполняются. Это:
- индексирование и нарезание (slicing, когда берем срезы)
- собственно итерация
- проверка членства in 

Все эти вещи реализуются с помощью магических методов. 

#### Индексирование и нарезание

Индексирование реализуется в питоне с помощью магического метода \_\_getitem\_\_. Нарезание тоже. Обратите внимание, что способ записи вида lst[1:2:3] - это только синтаксический сахар, на самом деле запись 1:2:3 превращается внутри питона в объект класса slice: slice(1, 2, 3). Соответственно, когда мы пишем в квадратных скобочках либо число, либо слайс, этот объект неявным образом передается в магический метод \_\_getitem\_\_. Как реализовать полностью идентичную обычной работу с индексированием и нарезанием:

In [None]:
from time import sleep

sleep(2)

class Human:
    eyes = 2
    def __init__(self, name):
        self.name = name

    def work(self):
        raise NotImplementedError

    def eat(self):
        print('I eat')

    def sleep(self, n):
        sleep(n)

In [None]:
class Linguist(Human):
    def __init__(self, name, publications):
        super().__init__(name)
        self.publications = publications

    def __getitem__(self, index):
        if isinstance(index, int):  # если передано просто число - значит, берем один элемент с индексом
            return self.publications[index]
        else:  # если не число, то значит,  slice. У этого объекта есть три атрибута, которые мы и используем
            return self.publications[index.start:index.stop:index.step]

    def __contains__(self, x):
        return x in self.publications
  
    def work(self, new_publ):
        self.publications.append(new_publ)

Соответствующий метод, который реализует присваивание элементу с индексом какого-то значения - это \_\_setitem\_\_. Он работает примерно аналогичным образом. 

Магический метод \_\_index\_\_ тесно связан с этими двумя, но делает наоборот: возвращает индекс для запрашиваемого экземпляра. 

#### Протокол итерации. Итерирование

Когда мы с вами вызываем какой-нибудь цикл или пишем генераторное выражение, на самом деле внутри питона в этот момент происходит следующее:

    Мы написали:
    for elem in lst:
        do something
    
    Питон делает:
    i = iter(lst)  # превращает список в объект "итератор"
    next(i)
    next(i)
    ...
    Когда итератор закончится, он вызовет исключение StopIteration, которое и отлавливает протокол итерации, останавливая все действие. 
    
Функции iter() и next() - встроенные функции питона. Их "магические" эквиваленты, которые они на самом деле вызывают - \_\_iter\_\_ и \_\_next\_\_. 

Их-то и нужно переопределить, если мы хотим научиться итерироваться по экземплярам нашего класса. Здесь есть несколько вариантов. 

№1. "Простое" итерирование: мы создаем класс, который сам по себе является итератором, и когда мы проитерируемся по такому экземпляру один раз, второй уже будет нельзя. 

In [None]:
class Squares:
    """ Класс-итератор, который будет делать ровно то же, что range, только возвращать квадраты чисел. """
    def __init__(self, start, stop):
        self.value = start - 1
        self.stop = stop - 1
    
    def __iter__(self):
        return self # такой объект возвращает самого себя для итерации
    
    def __next__(self):
        if self.value == self.stop:
            raise StopIteration
        self.value += 1
        return self.value ** 2

№2. Множественное итерирование: мы создаем отдельный класс для итерации, таким образом, чтобы при итерации состояние нашего объекта сохранялось и можно было итерироваться по нему много раз, хоть одновременно во вложенных циклах:

In [None]:
class Squares:
    """Собственно наш объект, который итератором по себе не является"""
    def __init__(self, start, stop):
        self.start = start
        self.stop = stop

    def __iter__(self):
        return SquaresIterator(self.start, self.stop)  # когда мы хотим итерироваться, создается отдельный объект-итератор

class SquaresIterator:
    """А вот и класс для этого объекта"""
    def __init__(self, start, stop):
        self.value = start - 1
        self.stop = stop - 1
 
    def __next__(self):
        if self.value == self.stop:
            raise StopIteration
        self.value += 1
        return self.value ** 2 

№3. Итерирование с помощью генераторов. Тут нужно быстро пробежаться по генераторным функциям. 

Что вообще такое генераторы? Генераторная функция - это понятие из функционального программирования. Такая функция не вычисляет все, что надо, сразу, а делает это только по требованию (и поэтому работает очень быстро). То есть, на самом деле задачку с Squares можно было написать просто функцией:

In [None]:
def gsquares(start, stop):
    for i in range(start, stop):
        yield i ** 2

yield - это оператор, который работает почти как return, но не выводит нас из функции сразу (их может быть больше одного), а возвращает результат, когда с него это потребовали. 

Генераторные выражения - это выражения, которые нам давно хорошо знакомы, обычно мы их используем вместе с представлением списка (списковым включением, list comprehension):

    [x for x in lst]
    
если мы напишем круглые скобочки, а не квадратные, то получим объект типа "генератор", который будет существовать себе и ждать, когда мы попросим его нагенерировать то, что он умеет. 

В связи с генераторами неплохо вспомнить такие функции, как map, filter & reduce: это все инструменты функционального программирования, которые в результате своей работы возвращают генераторы. Напомню о них:

- map отображает функции на итерируемые объекты:

        list(map(pow, [1, 2, 3], [4, 5, 6]))
        
        Вернет список всех чисел первого списка, возведенных в степень из второго списка. 
        
- filter - выбирает элементы из итерируемых объектов, которые соответствуют функции-условию. 

        list(filter(lambda x: x > 0, range(-5, 5)))
        
        Вернет только положительные числа. 
        
- reduce: эта функция находится в стандартном модуле functools. На каждом шаге она передает результат выполненной функции-аргумента вместе с очередным элементом из списка. 

        reduce((lambda x, y: x + y), [1, 2, 3, 4])
        
        Просуммирует все элементы в списке. 

Так вот, можно сочетать генераторные функции с переопределением итерирования очень лаконичным и красивым способом:

In [None]:
class Squares:
    def __init__(self, start, stop):
        self.start = start
        self.stop = stop

    def __iter__(self):
        """ Такой вариант автоматически создает множественный итератор. """
        for item in range(self.start, self.stop):
            yield item ** 2

Генераторная функция сама работает по протоколу итерации (каждый next() заставляет срабатывать yield и возвращать новое значение), поэтому мы и можем так сократить код. 

Казалось бы, для чего нам тогда вариант 2? Но для некоторых сложных случаев (и для большей гибкости работы) он все равно может пригождаться. 

### Contains, iter, getitem: приоритеты

Все эти методы (+ метод \_\_contains\_\_, который вызывается при проверке членства in) могут частично друг друга взаимозаменять: так, если определен getitem, мы автоматически сможем и итерироваться в цикле for, а если определен хотя бы один из getitem & iter, то будет работать проверка членства. Но питон, естественно, старается использовать "правильные" методы, поэтому если у вас в классе определены все три, для индексирования питон охотнее будет использовать getitem, для итерации - iter, для проверки членства - contains. 

Последнее, о чем мы успели весьма бегло поговорить - это метод \_\_call\_\_. Как легко догадаться, его перегрузка позволяет вызывать экземпляр класса, будто функцию:

In [1]:
class Callee:
    def __call__(self):
        print('Called')

In [2]:
Callee()()

Called


Именно этот метод и вызывает артефакт с двумя скобочками при одновременном создании экземпляра класса и его вызове. Встречается, как я уже говорила, в pytorch на постоянной основе (с функциями активации и некоторыми другими вещами). 