## 0. Объектно-ориентированное программирование в Python.

Бывает, что вам нужно написать программу, которую вы запустите один раз и которая просто должна решить некоторую задачу. В этом случае все средства хороши, и можно оформлять код так, как вам удобно. Есть и другая ситуация: вам надо запрограммировать что-то, что потом вы будете использовать много раз, а ещё этот код могут захотеть редактировать другие люди. Тут надо задуматься о правильном оформлении кода.

В машинном обучении главное — это модели, их обучение, применение, подсчёт качества и прочие связанные операции. Допустим, вы собрались запрограммировать обучение и применение метода k ближайших соседей и выложить в открытый доступ. Тогда будет логично потребовать от вашего кода следующее:
1. Вы можете что-то улучшить в нём, не поменяв логику работы, и это не сломает ничего у пользователей. Будет странно, если вы, скажем, замените циклы на векторные операции в numpy, опубликуете новую версию, и любой код, зависящий от вашего, перестанет работать. Ведь суть того, что делает ваш код, не поменялась!
2. Достаточно легко можно сделать расширенные версии kNN на основе вашего кода — например, запрограммировать kNN с весами.
3. От пользователей скрыты все детали вашей реализации — чтобы пользоваться вашим кодом для kNN, им не нужно вникать, как вы храните данные, как ищете ближайших соседей и т.д. Они просто вызывают нужные функции, и всё работает.

Объектно-ориентированное программирование (ООП) — это подход к организации кода, который (наверное) лучше всего подходит для оформления операций из машинного обучения. В его основе лежат классы и объекты, а также три важных свойства: инкапсуляция, наследование и полиморфизм. Ниже мы разберёмся со всем этим.

Программист может создать класс, своеобразный чертёж, который будет определять поведение объектов этого класса: какие данные они могут хранить и какой код исполнять. После этого можно создавать объекты класса с ожидаемым поведением.

Поломать голову над формальными определениями ООП можно [на вики](https://ru.wikipedia.org/wiki/%D0%9E%D0%B1%D1%8A%D0%B5%D0%BA%D1%82%D0%BD%D0%BE-%D0%BE%D1%80%D0%B8%D0%B5%D0%BD%D1%82%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%BD%D0%BE%D0%B5_%D0%BF%D1%80%D0%BE%D0%B3%D1%80%D0%B0%D0%BC%D0%BC%D0%B8%D1%80%D0%BE%D0%B2%D0%B0%D0%BD%D0%B8%D0%B5).

Оглавление:
* [Как создать класс](#Как-создать-класс)
* [Методы](#Методы)
* [Атрибуты класса и метод `__init__`](#Атрибуты-класса-и-метод-__init__)
* [Magic методы](#Magic-методы)
* [Копирование](#Копирование)
* [getter, setter](#getter,-setter)
* [`@staticmethod`](#@staticmethod)
* [`@classmethod`](#@classmethod)
* [Наследование, `super()`](#Наследование,-super())
* [ABC — Abstract Base Classes](#ABC-—-Abstract-Base-Classes)
* [Datacasses](#Dataclasses)

<a name="introduction"></a>

### Как создать класс

Класс в питоне создаётся специальной конструкцией `class`. Экземпляр (объект, instance) класса создаётся вызовом класса со скобками.

In [2]:
class DummyClass:
    a = 0
    pass


dummy_object = DummyClass()

dummy_object
type(dummy_object)

__main__.DummyClass

In [10]:
type(DummyClass)

type

In [9]:
dir(DummyClass)

['__annotations__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'a']

In [15]:
dir(dummy_object)

['__annotations__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 'a']

In [13]:
DummyClass.__dict__

mappingproxy({'__module__': '__main__',
              'a': 0,
              '__dict__': <attribute '__dict__' of 'DummyClass' objects>,
              '__weakref__': <attribute '__weakref__' of 'DummyClass' objects>,
              '__doc__': None,
              '__annotations__': {}})

In [8]:
object

object

In [7]:
DummyClass.__bases__

(object,)

In [6]:
DummyClass.__mro__

(__main__.DummyClass, object)

In [None]:
import math
vars(DummyClass)

mappingproxy({'__module__': '__main__',
              'a': 0,
              '__dict__': <attribute '__dict__' of 'DummyClass' objects>,
              '__weakref__': <attribute '__weakref__' of 'DummyClass' objects>,
              '__doc__': None})

Названия классов в питоне пишутся CamelCase, названия функций/объектов/переменных snake_case.

### Методы

Классы могут определять функции, которые можно будет вызывать от их объектов. Такие функции называются методами. В любом (почти) методе первым аргументом является self. В него будет передан сам объект, от которого вызывается метод.

Наш класс не особо полезен, так как ничего не делает. Давайте напишем класс с методом. Вызов методов происходит через оператор `.`

In [34]:
GOOSE = """
░░░░░▄▀▀▀▄░░░░░░░░
▄███▀░◐░░░▌░░░░░░░
░░░░▌░░░░░▐░░░░░░░
░░░░▐░░░░░▐░░░░░░░
░░░░▌░░░░░▐▄▄░░░░░
░░░░▌░░░░▄▀▒▒▀▀▀▀▄
░░░▐░░░░▐▒▒▒▒▒▒▒▒▀▀▄
░░░▐░░░░▐▄▒▒▒▒▒▒▒▒▒▒▀▄
░░░░▀▄░░░░▀▄▒▒▒▒▒▒▒▒▒▒▀▄
░░░░░░▀▄▄▄▄▄█▄▄▄▄▄▄▄▄▄▄▄▀▄
░░░░░░░░░░░▌▌▌▌░░░░░
░░░░░░░░░░░▌▌░▌▌░░░░░
░░░░░░░░░▄▄▌▌▄▌▌░░░░░"""

class GoosePrinter:
    GOOSE = 'goose'
    def print_goose(self) -> None:
        print(self.GOOSE)

# class GoosePrinter:
#     GOOSE = 'goose'
#     def print_goose() -> None:
#         print(GoosePrinter.GOOSE)

goose_printer = GoosePrinter()
ret = goose_printer.print_goose()

# GoosePrinter.print_goose()

print(ret)

goose
None


In [None]:
vars(GoosePrinter)

mappingproxy({'__module__': '__main__',
              'GOOSE': 'goose',
              'print_goose': <staticmethod at 0x7fcc6deb93d0>,
              '__dict__': <attribute '__dict__' of 'GoosePrinter' objects>,
              '__weakref__': <attribute '__weakref__' of 'GoosePrinter' objects>,
              '__doc__': None})

Обратите внимание, что мы вызвали метод без аргументов, хотя в сигнатуре есть аргумент `self`. `self` подаётся "автоматически".

**NB:** первый аргумент можно назвать как угодно, не обязательно `self`. Но не нужно.

### Атрибуты класса и метод `__init__`

Помимо методов у объектов класса могут быть атрибуты &mdash; переменные. К ним так же можно обращаться через `.`, а создавать внутри класса их как раз можно при помощи вышеупомянутого `self`.

Любой класс может определить метод `__init__` &mdash; конструктор: он выполняется при создании объекта класса, а его аргументы передаются в скобках после названия класса во время создания. Обычно именно в нём и задаются атрибуты класса.

Давайте напишем класс целочисленной точки на плоскости, объекты которого будут уметь выводить свои координаты:

In [57]:
class Point2D:
    """
    A point in 2D space
    :param x: x coordinate
    :param y: y coordinate
    """
    def __init__(self, x: int, y: int) -> None:
        # Создаём атрибуты и присваиваем им переданные значения координат
        self.x = x
        self.y = y

    def print_coords(self) -> None:
        """Выводим координаты, обращаясь к ним через self с точкой"""
        # Выводим координаты, обращаясь к ним через self с точкой
        print(f"({self.x}, {self.y})")

    def first_coord(self) -> int:
        return self.n


point = Point2D(3, 5)
point.print_coords()

# vars(Point2D)

# point.x

# del point.x

# point.x

# print(point.first_coord())

# # point.print_coords()

# point.n = 10

# print(point.n)

# point.first_coord()

print(point)

point

(3, 5)
<__main__.Point2D object at 0x7e32b670f160>


<__main__.Point2D at 0x7e32b670f160>

In [40]:
help(Point2D)

Help on class Point2D in module __main__:

class Point2D(builtins.object)
 |  Point2D(x: int, y: int) -> None
 |  
 |  A point in 2D space
 |  :param x: x coordinate
 |  :param y: y coordinate
 |  
 |  Methods defined here:
 |  
 |  __init__(self, x: int, y: int) -> None
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  first_coord(self) -> int
 |  
 |  print_coords(self) -> None
 |      Выводим координаты, обращаясь к ним через self с точкой
 |  
 |  ----------------------------------------------------------------------
 |  Data descriptors defined here:
 |  
 |  __dict__
 |      dictionary for instance variables (if defined)
 |  
 |  __weakref__
 |      list of weak references to the object (if defined)



Мы задаём координаты в конструкторе, присваивая их `self` через точку, и потом можем использовать их в методе.

### Magic методы

В питоне у классов могут быть так называемые магические методы. Это методы, которые может определить класс, которые позволяют ему действовать определённым образом. Обычно они не вызываются напрямую.

Все магические методы отличаются тем, что их названия начинаются и заканчиваются на двойные подчёркивания (`__method__`). С одним таким мы уже познакомились &mdash; это метод `__init__`, который вызывается при создании объекта класса. Давайте посмотрим, какие ещё бывают магические методы:

#### \_\_str\_\_ и \_\_repr\_\_ [(Документация)](https://docs.python.org/3/reference/datamodel.html#object.__repr__)

Методы `__str__` и `__repr__` позволяют добавить текстовое описание к объекту класса. Они возвращают строку, описывающую объект.

Метод `__str__` должен возвращать строку, описывающую объект простым, понятным, читаемым образом, а метод `__repr__` предназаначен больше для дебага и должен возвращать всю информацию об объекте, а его вывод должен в идеале быть исполняемым кодом, с помощью которого можно было бы создать такой же объект.

Метод `__str__` вызывается, например, когда мы принтим объект или берём `str` от него (например, `str(point)`).
Метод `__repr__` вызывается, например, когда мы просто выводим объект в консоли или берём `repr` от него.
Если `__str__` не определён, по дефолту его роль будет играть `__repr__`.

Давайте избавимся от метода `print_coords` и добавим нашим точкам хорошее форматирование:

In [64]:
# Для начала убедимся, что по дефолту наши точки не умеют красиво печататься:
print(f"Некрасивая точка: {Point2D(5, 5)}")

class Point2D:
    """
    A point in 2D space
    :param x: x coordinate
    :param y: y coordinate
    """
    def __init__(self, x: int, y: int) -> None:
        # Создаём атрибуты и присваиваем им переданные значения координат
        self.x = x
        self.y = y

    def __repr__(self) -> str:
        return f"Point2D({self.x}, {self.y})"

    def __str__(self) -> str:
        return f"A 2D point with coordinates ({self.x}, {self.y})"

# Посмотрим, что у нас есть теперь:
print(Point2D(5, 5))
Point2D(3, 4)

Некрасивая точка: A 2D point with coordinates (5, 5)
A 2D point with coordinates (5, 5)


Point2D(3, 4)

In [65]:
p = Point2D(10, 11)
p

Point2D(10, 11)

In [66]:
print(p)
p + Point2D(1, 1)

A 2D point with coordinates (10, 11)


TypeError: ignored

Обратите внимание, что `__str__` вызвался, когда мы запринтили объект, а `__repr__`, когда мы вывели его в конце ячейки.

#### \_\_add\_\_, \_\_sub\_\_, \_\_mul\_\_, \_\_truediv\_\_, etc. [(Документация)](https://docs.python.org/3/reference/datamodel.html#emulating-numeric-types)

Методы `__add__`, `__sub__`, `__mul__`, `__truediv__` позовляют добавить классу функционал сложения, вычитания, умножения, деления и так далее, (операторы `+`, `-`, `*`, `/`, etc.). Они вызываются от левого операнда и применяются к правому, возвращая результат. Давайте научим наши точки складываться и вычитаться:

In [73]:
class Point2D:
    """
    A point in 2D space
    :param x: x coordinate
    :param y: y coordinate
    """
    def __init__(self, x: int, y: int) -> None:
        # Создаём атрибуты и присваиваем им переданные значения координат
        # self.set_x(x)
        self.x = x
        self.y = y

    def __repr__(self) -> str:
        return f"Point2D({self.x}, {self.y})"

    def __str__(self) -> str:
        return f"A 2D point with coordinates ({self.x}, {self.y})"

    def __add__(self, other: Point2D) -> Point2D:
        return Point2D(self.x + other.x, self.y + other.y)

    def __sub__(self, other: Point2D) -> Point2D:
        return Point2D(self.x - other.x, self.y - other.y)

    # def set_x(self, value):
    #     self.x = value

    # def get_x(self):
    #     return self.x

In [76]:
point = Point2D(3, 5)
print(point + Point2D(4, 7))
print(point - Point2D(4, 7))

A 2D point with coordinates (7, 12)
A 2D point with coordinates (-1, -2)


У каждого из вышеописанных методов есть так же версия "i" в начале, отвечающая за операцию с присвоением (`__iadd__` &mdash; `+=`, `__isub__` &mdash; `-=`, etc.)

В принципе, операции с присовением будут работать и так, питон сам выведет их из обычных операций. Но на самом деле они не будут модифицировать объект in-place, а будут возвращать новый объект и присваивать его переменной:

In [83]:
a = Point2D(3, 3)
print(id(a))
print(a)

a += Point2D(1, 1)
print(id(a))
print(a)

138755430174864
A 2D point with coordinates (3, 3)
138755430174864
A 2D point with coordinates (4, 4)


In [79]:
b = a + point
b

Point2D(7, 9)

In [80]:
print(id(a), id(b), id(point), sep='\n')

138755797300608
138755430174816
138755797301760


В данном случае это скорее правильное поведение, но давайте для практики добавим в наш класс эти методы:

In [81]:
class Point2D:
    """
    A point in 2D space
    :param x: x coordinate
    :param y: y coordinate
    """
    def __init__(self, x: int, y: int) -> None:
        # Создаём атрибуты и присваиваем им переданные значения координат
        self.x = x
        self.y = y

    def __repr__(self) -> str:
        return f"Point2D({self.x}, {self.y})"

    def __str__(self) -> str:
        return f"A 2D point with coordinates ({self.x}, {self.y})"

    def __add__(self, other: Point2D) -> Point2D:
        return Point2D(self.x + other.x, self.y + other.y)

    def __sub__(self, other: Point2D) -> Point2D:
        return Point2D(self.x - other.x, self.y - other.y)

    def __iadd__(self, other: Point2D) -> Point2D:
        self.x += other.x
        self.y += other.y
        return self

    def __isub__(self, other: Point2D) -> Point2D:
        self.x -= other.x
        self.y -= other.y
        return self

In [84]:
a = Point2D(3, 3)
print(id(a))

a += Point2D(2, 2)
print(id(a))
print(a)

a += Point2D(2, 2)
print(id(a))
print(a)

138755430177312
138755430177312
A 2D point with coordinates (5, 5)
138755430177312
A 2D point with coordinates (7, 7)


Теперь при использовании `+=` мы остаёмся с тем же объектом.

#### \_\_eq\_\_, \_\_ne\_\_, \_\_lt\_\_, \_\_le\_\_, \_\_gt\_\_, \_\_ge\_\_,  [(Документация)](https://docs.python.org/3/reference/datamodel.html#object.__lt__)

По умолчанию объекты классов в питоне не имеют порядка и сравниваются на равенство при помощи `is`.
Таким образом, две точки будут равны друг другу только тогда когда они представляют один и тот же объект в памяти:

In [95]:
a = Point2D(1, 1)
b = Point2D(1, 1)

a == b, a == a

(True, True)

In [94]:
a is b

False

Методы `__eq__`, `__ne__`, `__lt__`, `__le__`, `__gt__`, `__ge__` позволяют задать правила сравнения для объектов класса.

Давайте научим наши точки сравниваться:

In [97]:
class Point2D:
    """
    A point in 2D space
    :param x: x coordinate
    :param y: y coordinate
    """
    def __init__(self, x: int, y: int) -> None:
        # Создаём атрибуты и присваиваем им переданные значения координат
        self.x = x
        self.y = y

    def __repr__(self) -> str:
        return f"Point2D({self.x}, {self.y})"

    def __str__(self) -> str:
        return f"A 2D point with coordinates ({self.x}, {self.y})"

    def __add__(self, other: Point2D) -> Point2D:
        return Point2D(self.x + other.x, self.y + other.y)

    def __sub__(self, other: Point2D) -> Point2D:
        return Point2D(self.x - other.x, self.y - other.y)

    def __iadd__(self, other: Point2D) -> Point2D:
        self.x += other.x
        self.y += other.y
        return self

    def __isub__(self, other: Point2D) -> Point2D:
        self.x -= other.x
        self.y -= other.y
        return self

    def __eq__(self, other: Point2D) -> Point2D:
        return self.x == other.x and self.y == other.y

    # def __call__(self):
    #     print('сall', end=' ')
    #     print(self)

print(Point2D(1, 1) == Point2D(1, 1))
print(Point2D(1, 1) != Point2D(1, 1))
print(Point2D(1, 1) == Point2D(1, 2))
print(Point2D(1, 1) != Point2D(1, 2))

p = Point2D(1, 1)
# p()

True
False
False
True


Обратите внимание, что когда мы определили `__eq__` (==) для сравнения, `__ne__` (!=) вывелся автоматически. Однако, это исключение. Если мы, например, определим ещё и `__gt__` (>), операция `__le__` (<=) сама не выведется.

**NB**: Если вам хочется написать одну операцию, чтобы остальные вывелись автоматически, используйте декоратор [`functools.total_ordering`](https://docs.python.org/3/library/functools.html#functools.total_ordering)




Кроме описанных в питоне есть ещё великое множество магических методов, которые способны осуществить примерно любое поведение, которое вы видели в питоне. Все их можно посмотреть [в документации](https://docs.python.org/3/reference/datamodel.html#special-method-names) или нагуглить.

Из полезных можно отметить:
* `__new__` и `__del__` &mdash; создание и удаление объекта.
* `__len__` &mdash; возвращение длины объекта (например, контейнера). Используется функцией `len`.
* `__getitem__`, `__setitem__` &mdash; индексация квадратными скобками.
* `__getattr__`, `__setattr__` &mdash; обращение к атрибутам по точке.
* `__iter__` &mdash; возвращает итератор, проходящий по объекту. Используется, например, for.
* `__next__` &mdash; возвращает следующее состояние итератора
* `__nonzero__` &mdash; определяет поведение функции `bool` на объекте.
* `__contains__` &mdash; определяет поведение оператора `in` (полезно для контейнеров)
* `__call__` &mdash; вызывается, когда объект класса вызывается со скобками (как функция). Позволяет сделать объекты класса callable.
* `__copy__`, `__deepcopy__` &mdash; определяют, как объект класса копируется.

In [111]:
b = a

In [98]:
a = [1, 2, 3, 4]

In [112]:
b[1] = -1

In [113]:
a

[1, -1, 3, 4]

In [114]:
a is b

True

In [110]:
10 in a

False

In [99]:
for elem in a:
  print(elem)

1
2
3
4


In [101]:
iterator = a.__iter__()
iterator = iter(a)

In [108]:
dir(iterator)

['__class__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__length_hint__',
 '__lt__',
 '__ne__',
 '__new__',
 '__next__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setstate__',
 '__sizeof__',
 '__str__',
 '__subclasshook__']

In [103]:
iterator.__next__()

1

In [107]:
next(iterator)

StopIteration: ignored