# ООП: Базовые концепции

На [прошлой лекции](../lesson10/interactive_conspect.ipynb) мы начали изучать объектно ориентированный стиль программирования и его проявление в Python. В самом начале занятия мы затронули 4 основные концепции ООП: инкапсуляция, наследование, полиморфизм и абстракция. В сегодняшнем занятии мы постараемся рассмотреть реализацию этих концепций в Python.

## Инкапсуляция

Согласно концепции инкапсуляции все данные и методы объекта деляться на два основных класса: интерфейс и реализацию. Интерфейс описывает совокупность данных и операций, доступных пользователю для манипуляции над объектом. По факту в сознании пользователя объект определенного типа данных полностью описывается и определяется его интерфейсом. Реализация же состоит из служебной информации и включает в себя данные и методы обеспечивающие надежное функционирование объекта, но скрытые от пользователя. В идеале пользователь не должен иметь доступ к реализации, а все его взаимодействие с объектом должно выстраиваться через использование методов и данных, предоставляемых интерфейсом. 

В таких объектно-ориентированных языках программирования, как С++ инкапсуляция реализуется с помощтю спецификаторов доступа, типа private, shared или public. В Python подобных механизмов нет. По умолчанию, вы можете получить доступ абсолютно к любому полю класса. Однако, в Python существуют специальные соглашения об именовании атрибутов, чтобы разработчики могли понимать, какая часть функционала вашего объекта задумывалась как интерфейс, а какая - как реализация. Согласно данному соглашению, атрибуты класса поддерживают три типа именования.

**Первый тип**   

Имя атрибута не содержит ведущих нижних подчеркиваний. В данном случае атрибут является публичным и входит в состав интерфейса. Вы можете смело обращаться к нему и, если класс не определяет иного, перезаписывать этот атрибут в своих приложениях.  

In [2]:
class Point2D:
    abscissa: float = 0
    ordinate: float = 0

In [3]:
point = Point2D()
print(Point2D.__dict__)

print(f'{point.abscissa = }; {point.ordinate = };')
point.abscissa = 6
print(f'{point.abscissa = }; {point.ordinate = };')

{'__module__': '__main__', '__annotations__': {'abscissa': <class 'float'>, 'ordinate': <class 'float'>}, 'abscissa': 0, 'ordinate': 0, '__dict__': <attribute '__dict__' of 'Point2D' objects>, '__weakref__': <attribute '__weakref__' of 'Point2D' objects>, '__doc__': None}
point.abscissa = 0; point.ordinate = 0;
point.abscissa = 6; point.ordinate = 0;


**Второй тип**  
 
Имя атрибута содержит одно нижнее подчеркивание в качестве первого символа. В этом случае вы можете думать об этом атрибуте, как о shared-атрибуте. Т.е. атрибут является деталью реализации. Предполагается, что такой атрибут может быть использован при написании любых методов данного класса. Также вы можете использовать его в дочерних классах для реализации определнного функционала. Но как пользователь обращаться напрямую к этому методу вы не должны. Однако за прямое обращение вы не получите никаких санкций со стороны интерпретатора. Максимум - предупреждение в достатоно интеллектуальных IDE. 

In [4]:
class Point2D:
    _abscissa: float = 0
    _ordinate: float = 0

In [5]:
point = Point2D()
print(Point2D.__dict__)

print(f'{point._abscissa = }; {point._ordinate = };')
point._abscissa = 6
print(f'{point._abscissa = }; {point._ordinate = };')

{'__module__': '__main__', '__annotations__': {'_abscissa': <class 'float'>, '_ordinate': <class 'float'>}, '_abscissa': 0, '_ordinate': 0, '__dict__': <attribute '__dict__' of 'Point2D' objects>, '__weakref__': <attribute '__weakref__' of 'Point2D' objects>, '__doc__': None}
point._abscissa = 0; point._ordinate = 0;
point._abscissa = 6; point._ordinate = 0;


**Третий тип**

Имя атрибута содержит два ведущих нижних подчеркивания. В этом случае такой атрибут считается полностью приватным и используется только в реализации данного класса. Вы не сможете обратиться к нему напрямую вне тела данного класса. Обращение к приватному атрибуту по его имени в пользовательском коде или в теле дочернего класса приведет к ошибке. 

In [6]:
class Point2D:
    __abscissa: float = 0
    __ordinate: float = 0

In [7]:
point = Point2D()
print(Point2D.__dict__)

print(f'{point.__abscissa = }; {point.__ordinate = };')

{'__module__': '__main__', '__annotations__': {'_Point2D__abscissa': <class 'float'>, '_Point2D__ordinate': <class 'float'>}, '_Point2D__abscissa': 0, '_Point2D__ordinate': 0, '__dict__': <attribute '__dict__' of 'Point2D' objects>, '__weakref__': <attribute '__weakref__' of 'Point2D' objects>, '__doc__': None}


AttributeError: 'Point2D' object has no attribute '__abscissa'

Такие атрибуты называются чисто служебными. Детальное изучения атрибута \_\_dict\_\_ класса Point2D, код которого приведен в примере выше, показывает, что в момент определения класса, интерпретатор Python неявным образом подменяет имя чисто служебных атрибутов и сохраняет их в пространство имен класса под именем \_Classname\_\_atributename. Т.е., зная эту деталь, мы все же можем получить доступ к данным атрибутам, минуя препятствия, созданные интерпретатором: 

In [8]:
point = Point2D()
print(Point2D.__dict__)

print(f'{point._Point2D__abscissa = }; {point._Point2D__ordinate = };')
point._Point2D__abscissa = 6
print(f'{point._Point2D__abscissa = }; {point._Point2D__ordinate = };')

{'__module__': '__main__', '__annotations__': {'_Point2D__abscissa': <class 'float'>, '_Point2D__ordinate': <class 'float'>}, '_Point2D__abscissa': 0, '_Point2D__ordinate': 0, '__dict__': <attribute '__dict__' of 'Point2D' objects>, '__weakref__': <attribute '__weakref__' of 'Point2D' objects>, '__doc__': None}
point._Point2D__abscissa = 0; point._Point2D__ordinate = 0;
point._Point2D__abscissa = 6; point._Point2D__ordinate = 0;


### property

Встроенный декоратор **property** позволяет добавить в ваш класс дескриптор, ограничивающий доступ к тому или иному атрибуту через интерфейс. Стоит отметить, что property не решает проблему доступа полностью, но лишь позволяет описать интерфейс взаимодействия с тем или иным атрибутом. Так, например, с помощью property мы можем добавить в интерфейс нашего класса поля, доступные исключительно для чтения:

In [9]:
from dataclasses import dataclass
from typing import Any, Generator


@dataclass
class Vector2D:
    _x: float = 0
    _y: float = 0

    def __iter__(self) -> Generator:
        yield from (self._x, self._y)

    def __abs__(self) -> float:
        return sum(x_i ** 2 for x_i in self) ** 0.5

    @property
    def x(self) -> float:
        return self._x

    @property
    def y(self) -> float:
        return self._y

In [10]:
vector = Vector2D(2, 7)

print(f'{vector.x = }; {vector.y = }')
vector.x = -2

vector.x = 2; vector.y = 7


AttributeError: property 'x' of 'Vector2D' object has no setter

При необходимости, с помощью propery мы можем включить перезапись значения того или иного атрибута в интерфейс:

In [11]:
from dataclasses import dataclass
from typing import Generator


@dataclass
class Vector2D:
    _x: float = 0
    _y: float = 0

    def __iter__(self) -> Generator:
        yield from (self._x, self._y)

    def __abs__(self) -> float:
        return sum(x_i ** 2 for x_i in self) ** 0.5

    @property
    def x(self) -> float:
        return self._x
    
    @x.setter
    def x(self, x_new: float) -> None:
        self._x = float(x_new)

    @property
    def y(self) -> float:
        return self._y

In [12]:
vector = Vector2D(2, 7)

print(f'{vector.x = }; {vector.y = }')
vector.x = -2
print(f'{vector.x = }; {vector.y = }')

vector.x = 2; vector.y = 7
vector.x = -2.0; vector.y = 7


Однако, как было сказано ранее, property не решает проблему полной инкапсуляции. Несмотря на возможность ограничения манипуляции с атрибутами через интерфейс, мы по-прежнему имеем доступ к реализации:

In [13]:
print(f'{vector._x = }')
vector._x = 2
print(f'{vector._x = }')

vector._x = -2.0
vector._x = 2


## Наследование

Концепция наследования позволяет сформулировать четкую иерархуию классов в вашем коде. Помимо этого, вы можете думать о наследовании, как о расширении функционала существующего класса и о средстве, позволяющим избежать дублирования кода. Классы, от которых происходит наследование, обычно называются родительскими классами, или суперклассами. В Python принят второй вариант наименования. Классы-наследники называются дочерними классами или сабклассами, в Python принят второй вариант именования.

Как мы помним из предыдущей лекции, суперклассы указываются в момент создания нового класса. Синтаксически наследование выглядит следующим образом:

```python
class Derived(base-classes):
    ...
```

В данном псевдокоде, `base-classes` - это последовательность выражений, разделенных запятыми. Результаты вычисления этих выражений - классы.

### MRO

Из факта того, что `base-classes` - это последовательность выражений, можно сделать вывод о допустимости множественного наследования в Python, т.е. наш класс может расширять одновременно несколько классов и приходятся сабклассом одноврменное для нескольких суперклассов. Однако возможность множественного наследования ведет к большому количеству проблем. Самая популярная проблема - это, так называемая проблема ромба (англ. *diamond problem*).

Проблема ромба заключается в следующем: предположим у нас есть некоторый класс, который обладает некоторым методом. Для конкретики представим, что имеется класс `Parallelogram`, у которого есть метод `area`. У данного супер класса есть два сабкласса `Rectangle` и `Rhombus`, которые переопределяют метод area исходного класса. Также есть класс `Square`, который является сабклассом и для класса `Rectangle`, и для класса `Rhombus`. Мы создаем экземпляр класса Square и вызываем у него метод area, метод какого класса будет вызван? 

In [20]:
class Parallelogram:
    def area(self) -> None:
        print('parallelogram area')


class Rectangle(Parallelogram):
    def area(self) -> None:
        print('rectangle area')


class Rhombus(Parallelogram):
    def area(self) -> None:
        print('rhombus area')


class Square(Rectangle, Rhombus):
    pass

In [21]:
square = Square()
square.area()

rectangle area


Данный пример иллюстрирует две вещи: первая вещь - возможность переопределять атрибуты суперкласса в сабклассе, об этой возможности мы поговорим чуть позже; вторая вещь - это стратегия для решения проблемы ромба в Python. Как мы видим, в качестве метода area наш класс Square использует метод класса Rectangle. Но почему?

В момент определения класса Python сохраняет весь граф наследования в специальный атрибут, который называется \_\_mro\_\_. Это сокращение от английского method resolution order, т.е. порядок разрешения методов. \_\_mro\_\_ - это специальный атрибут класса, в котором хранится порядок обхода графа наследования для поиска того или иного атрибута. Сам алгоритм поиска мы обсуждали на предыдущей лекции. Давайте посмотрим на порядок обхода классов для поиска аттрибута и освежим в памяти этот самый алгоритм поиска. 

In [23]:
print(Square.__mro__)

(<class '__main__.Square'>, <class '__main__.Rectangle'>, <class '__main__.Rhombus'>, <class '__main__.Parallelogram'>, <class 'object'>)


Итак, при попытке вызвать метод area у экземпляра класса Square, интерпретатор пытается найти переопределяющий дескрипток в классе Square. Поскольку класс Square не содержит в себе подобного дескриптора, интерпретатор пытается найти имя area в атрибуте \_\_dict\_\_ экземпляра класса Square. Но данный атрибут пуст. Тогда интерпретатор пытается найти указанное имя в атрибуте \_\_dict\_\_ самого класса Square, но и этот атрибут не содержит нужного имени. Тогда интерпретатор начинает поиск в следующем элементе кортежа \_\_mro\_\_, т.е. в классе Rectangle. Атрибут \_\_dict\_\_ данного класса содержит искомое имя, интерпретатор использует найденное в Rectangle значение для имени area в качестве результата поиска, а сам поиск на этом завершается.

Но почему классы в атрибуте \_\_mro\_\_ расположены именно в такой последовательности? И что в этом кортеже делает класс `object`? Ответ на первый вопрос достаточно сложный, однако, если упростить алгоритм обхода графа наследования, то он будет представлять из себя следующую конструкцию. Чем ближе суперклассы к сабклассу в графе наследования, тем левее они будут находится в кортеже \_\_mro\_\_, более того, при множественном наследовании, классы, указанные левее, будут располагаться левее и в \_\_mro\_\_. Собственно, это явно и илюстрирует полученный кортеж. Классы, от которых мы наследовались напрямую, расположены ближе к левой границе массива. При этом, порядок их расположения соответствует порядку из следования в области наследования при определении нашего класса Square.

Ответ на второй вопрос состоит в следующем: даже при отсутствии наследования, все объекты Python неявно наследуются от встроенного типа данных object, который описывает объекты Python.

### super()

Предположим, что в предыдущем примере мы бы хотели переопределить функцию area в классе Square. Однако наша переопределенная функция не должна перекрывать функцию суперкласса, но лишь дополнять ее поведение. Как нам быть в этом случае? Вообще, ничего не мешает нам вызвать нужную функцию, явно указав базовый класс, чей метод мы хотели бы модифицировать. 

In [24]:
class Parallelogram:
    def area(self) -> None:
        print('parallelogram area')


class Rectangle(Parallelogram):
    def area(self) -> None:
        print('rectangle area')


class Rhombus(Parallelogram):
    def area(self) -> None:
        print('rhombus area')


class Square(Rectangle, Rhombus):
    def area(self) -> None:
        Rhombus.area(self)
        print('square area')

In [25]:
square = Square()
square.area()

rhombus area
square area


Однако, в этом случае нам приходится держать в голове порядок обхода графа наследования, чтобы точно знать, у какого именно класса нам необходимо вызвать нужный метод. Чтобы избежать этой головной боли мы можем использовать встроенный объект `super()`.

In [28]:
class Parallelogram:
    def area(self) -> None:
        print('parallelogram area')


class Rectangle(Parallelogram):
    def area(self) -> None:
        print('rectangle area')


class Rhombus(Parallelogram):
    def area(self) -> None:
        print('rhombus area')


class Square(Rectangle, Rhombus):
    def area(self) -> None:
        super().area()
        print('square area')

In [29]:
square = Square()
square.area()

rectangle area
square area


Во-первых, данный подход является более элегантным. Во-вторых, данный подход требует от вас меньше умственных усилий, поскольку super осуществит поиск нужного атрибута среди суперклассов графа наследования и вернет значение первого найденного. Однако, если вам необходимо осуществить поиск конкретного атрибута в конкретном суперклассе, минуя метод разрешения методов, вы всегда можете воспользоваться явным вызовом метода класса, как это было в примере выше. 

Вызов super необходим при инициализации экземпляра сабкласса:

In [32]:
class Parent:
    def __init__(self) -> None:
        print('init Parent')


class ChildWrong(Parent):
    def __init__(self) -> None:
        print('init ChildWrong')


class ChaildNaive(Parent):
    pass


class ChildGood(Parent):
    def __init__(self) -> None:
        super().__init__()
        print('init ChildGood')

In [33]:
child_wrong = ChildWrong()
child_naive = ChaildNaive()
child_good = ChildGood()

init ChildWrong
init Parent
init Parent
init ChildGood


В данном примере показано два важных положения. Первое: если сабкласс не переопределяет метод init, то для инициализации его экземпляров будет использоваться соответствующий метод суперкласса. Второе: при переопределении метода init в сабклассе метод init суперкласса не вызывается неявным образом, его необходимо вызывать явно. Причем, если имеет место мультинаследование, то вызова super будет недостаточно, поскольку, как обсуждалось выше, super прервет выполнение найдя нужный атрибут в одном из суперклассов:

In [34]:
class A:
    def __init__(self) -> None:
        print('init A')


class B:
    def __init__(self) -> None:
        print('init B')


class C(A, B):
    def __init__(self) -> None:
        super().__init__()
        print('init C')

In [35]:
c_instance = C()

init A
init C


Корректная реализация данного класса выглядила бы следующим образом:

In [39]:
class A:
    def __init__(self) -> None:
        print('init A')


class B:
    def __init__(self) -> None:
        print('init B')


class C(A, B):
    def __init__(self) -> None:
        A.__init__(self)
        B.__init__(self)
        
        print('init C')

In [40]:
c_instance = C()

init A
init B
init C


## Полиморфизм

Концепция полиморфизма заключается в унификации точки входа в определенную операцию для разных типов данных или комбинаций аргементов. Мы уже знакомы с полиморфизмом на примере вногих втроенных функций. Ярким примером может быть функция `len()`. Данная функция способна принимать на вход список, кортеж, словарь, любой объект, реализующий функцию \_\_len\_\_(). Т.е. это единая точка входа в операции определения размера для объектов различных типов данных.

В ООП под полиморфизмом обычно понимают полиморфизм классов. Т.е. наличие в классах методов с одинаковыми сигнатурами, однако реализующими операции, исходя из логики самого класса. Для демонстрации полиморфизма классов рассмотрим один из примеров, приведенных выше.

In [42]:
class Parallelogram:
    def area(self) -> None:
        print('parallelogram area')


class Rectangle(Parallelogram):
    def area(self) -> None:
        print('rectangle area')


class Rhombus(Parallelogram):
    def area(self) -> None:
        print('rhombus area')

In [43]:
polygons = [Parallelogram(), Rectangle(), Rhombus()]

for polygon in polygons:
    polygon.area()

parallelogram area
rectangle area
rhombus area


Как мы видим, в данном случае классы обладают полиморфной функцией area. Благодаря этому мы можем работать схожим образом с тремя разными экземплярами трех разных классов.

Подобный полиморфизм классов приводит нас к понятию протоколов. Говоря о протаколе, мы подразумеваем, что объект реализует некоторый функционал. Например, мы знакомы с вами с протоколом последовательностей. Когда мы говорили, что объект является последовательность, мы подразумевали, что он ведет себя как последовательсноть, т.е. поддерживает определенный набор операций.

Понятие протокола является неформальным, это значит, что обычно нам не приходится проверять соответствие объекта определенному типу данных. Вместо этого мы просто пытаемся работать с полученным объектом, как с представителем данного протокола. Если у нас получается обработать его нужным образом - хорошо, не получается - значит объект не удовлетворял требуемому протоколу. 

Ярким примером данного принципа может служить стремление интерпретатора обрабатывать объект, частично реализующий протокол последовательности, как последовательность:

In [44]:
from typing import Iterable, Union, Any


class MySequence:
    _iterable: list

    def __init__(self, iterable: Iterable) -> None:
        self._iterable = list(iterable)

    def __getitem__(self, index: Union[int, slice]) -> Any:
        return self._iterable[index]

In [47]:
my_seq = MySequence((1, 2, 3, 4))

for elem in my_seq:
    print(elem)

1
2
3
4


## Абстракция

Последняя концепция ООП - это абстракция. Абстракция - это выделение в моделируемом предмете важного для решения конкретной задачи. Абстракции являются более формальными протоколами, посколько они строго определены. Если, как мы видели выше, для обработки объекта по протоколу последовательностей не требуется строгого соответствия протоколу последовательности, то при разработке абстракций, от объекта, наследующего некоторый абстрактный интерфейс, требуется четкое соответствие ему. 

Для реализации обстракций в коде используют абстрактные базовые классы. Это специальные классы, которые описывают четкий интерфес взаимодействия с объектами, но при этом не реализующие его. Создать экземпляр абстрактного класса невозможно. 

In [53]:
import abc


class Polygon(abc.ABC):
    @abc.abstractmethod
    def area(self) -> float:
        ...


class Square(Polygon):
    _side_len: float

    def __init__(self, side_len: float) -> None:
        self._side_len = float(side_len)

    def area(self) -> float:
        return self._side_len ** 2
    
    @property
    def side_len(self) -> float:
        return self._side_len
    

class Rectangle(Polygon):
    _length: float
    _width: float

    def __init__(self, length: float, width: float) -> None:
        self._length = float(length)
        self._width = float(width)

    def area(self) -> float:
        return self._length * self._width
    
    @property
    def length(self) -> float:
        return self._length
    
    @property
    def width(self) -> float:
        return self._width

In [54]:
square = Square(4)
rectangle = Rectangle(3, 5)

print(f'square: {square.area()}; rect: {rectangle.area()};')

square: 16.0; rect: 15.0;


In [55]:
polygon = Polygon()

TypeError: Can't instantiate abstract class Polygon with abstract method area

Как вы видите, абстрактный базовый класс не подерживает создание экземпляров. Абстрактный базовый класс может включать как обычные методы, так и чисто виртуальные методы, как в данном примере. При этом, если абстрактный базовый класс включает в себя методы с реализацией, то реализация должна состоять только из вызовов методов описываемого интерфейса, без ограничения возможностей внутренний реализации объектов. Классы, наследующиеся от абстрактного базового класса обязаны реализовать в себе чисто виртуальные методы, иначе итерпретатор будет считать их виртуальными классами и не позволит создавать экземпляры. При этом, классы наследники могут дополнять интерфейс исходного базового класса.

Абстрактные базовые классы и чистые интерфейсы - это большая редкость в Python. Большая часть объектов реализуются как представители определнных протоколов. На практике, вам врят ли придется реализовывать свой абстрактный базовый класс.