# Классы

## Импорты

In [9]:
!pip install pymorphy2 -q

  Preparing metadata (setup.py) ... [?25l[?25hdone
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m55.5/55.5 kB[0m [31m2.2 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m8.2/8.2 MB[0m [31m53.0 MB/s[0m eta [36m0:00:00[0m
[?25h  Building wheel for docopt (setup.py) ... [?25l[?25hdone


In [10]:
from time import time
import pymorphy2


morph = pymorphy2.MorphAnalyzer()

## База

**Объектно-ориентированное программирование** (ООП) $-$ один из ключевых подходов к программированию. В нем программы представляются как набор объектов, каждый из которых $-$ это представитель некоторого более общего типа (класса).

Класс описывает свойства (атрибуты) и действия (методы) объекта. Например, у нас есть словарь (не тот, который `dict` в питоне, а тот, который русско-английский).

Какие у него есть свойства?
- Исходный язык (например, русский)
- Язык перевода (например, английский)
- Количество слов
- Какая-то метаинформация (стиль, составитель, год создания/последнего изменения)

А какие мы хотим уметь выполнять с ним действия?
- Получить перевод слова (возможно, в обе стороны)
- Добавить слово
- Удалить слово (а вдруг понадобиться)
- Получить список всех слов (например, чтобы использовать где-то еще)

Если говорить про код, то мы хотим, чтобы вот это работало:

Свойства (с этого момента $-$ атрибуты):

```
# Исходный язык
my_dict.source_language
# Язык перевода
my_dict.target_language
# Количество слов
my_dict.size
# Метаинформация
my_dict.meta
```

Действия ( с этого момента $-$ методы):

```
# Получить перевод слова
my_dict.translate(word='')
# Добавить слово
my_dict.add_word(source='', target='')
# Удалить слово
my_dict.delete_word(word='')
# Получить список всех слов: может быть метод, а может и атрибут. В чем разница?
my_dict.get_all_words()
my_dict.vocabulary
```

Как это должно выглядеть снаружи с точки зрения пользователя, мы описали. Теперь давайте посмотрим, как наш словарь будет выглядеть изнутри. Тут есть несколько моментов:
- Методы $-$ это функции внутри класса, атрибуты $-$ это переменные внутри класса (но не все)
- У каждого класса должен быть метод `__init__`, который отвечает за создание (инициализацию in fact) отдельного объекта, относящегося к этому классу (экземпляра класса). Этот метод, кроме всех переменных, которые мы хотим передать для создания, должен первым аргументом иметь `self` (вообще, назвать можно как угодно, но так не принято делать), который отвечает за работу с самим классом изнутри: например, вам надо из функции добавления слова иметь доступ к словарю.
- Классы обычно называются с большой буквы, а объекты-представители с маленькой (если вы пользуетесь PyCharm или любой другой штукой с проверкой PEP8, то они любезно вам об этом напомнят).

Теперь давайте напишем шаблон нашего словаря:

In [1]:
class Dictionary:

    def __init__(self, source=None, target=None, meta=None):
        # функция, которая создает наш словарь и прописывает, какие у него есть атрибуты
        self.source_language = source
        self.target_language = target
        self.meta = meta
        self.size = 0
        self.vocabulary = {}

    def translate(self, word):
        # переводим слово
        new_word = self.vocabulary.get(word, None)
        if new_word is None:
            print(f'{word} not in dictionary')
        return new_word

    def add_word(self, source, target):
        # добавляем слово
        if source not in self.vocabulary:
            self.vocabulary[source] = target
            self.size += 1
        else:
            print(f'{source} is already added')

    def delete_word(self, word):
        # удаляем слово
        if word in self.vocabulary:
            self.vocabulary.pop(word)
            self.size -= 1
        else:
            print(f'{word} not in dictionary')

    def get_all_words(self):
        # получаем все слова из словаря (в данном виде - весь словарь целиком)
        return self.vocabulary

Обернем ячейки из начала тетрадки в функцию и будем считать, что это способ тестировать наш класс.

In [2]:
def test(my_dict, src='кошка', tgt='cat'):
    print(f'Сам словарь: {my_dict}', end='\n\n')

    print('Атрибуты')
    print(f'Исходный язык: {my_dict.source_language}')
    print(f'Метаинформация: {my_dict.meta}', end='\n\n')

    print('Методы')
    print(f'Добавить слово')
    my_dict.add_word(source=src, target=tgt)
    print(f'Все слова в словаре: {my_dict.get_all_words()}')
    print(f'Количество слов: {my_dict.size}', end='\n\n')

    print(f'Получить перевод слова "{src}": "{my_dict.translate(word=src)}"', end='\n\n')

    print('Удалить слово')
    my_dict.delete_word(word=src)
    print(f'Все слова в словаре: {my_dict.get_all_words()}')
    print(f'Количество слов: {my_dict.size}')

Посмотрим, что получится, но сначала создадим сам словарь

In [3]:
dct = Dictionary('ru', 'en', {'name': 'my dict'})

In [4]:
test(dct)

Сам словарь: <__main__.Dictionary object at 0x7f8624c59750>

Атрибуты
Исходный язык: ru
Метаинформация: {'name': 'my dict'}

Методы
Добавить слово
Все слова в словаре: {'кошка': 'cat'}
Количество слов: 1

Получить перевод слова "кошка": "cat"

Удалить слово
Все слова в словаре: {}
Количество слов: 0


Заметим, что вывести словарь целиком у нас не очень получилось. Это происходит из-за того, что питон не имеет какого-то способа по умолчанию, чтобы показывать пользовательские классы. Но дальше, если успеем, я скажу, как это можно сделать.

А теперь давайте еще немного посмотрим теории про классы

## Три кита ООП

- **Инкапсуляция** $-$ хранение вместе объекта и связанных с ним характеристик и действий (атрибутов и методов)
- **Наследование** $-$ можем перенимать атрибуты и методы у другого класса (наследовать их)
- **Полиморфизм** $-$ можем использовать одинаковый интерфейс у разных объектов (основано на наследовании)

И четвертый не совсем кит $-$ **абстракция**. Ее суть заключается в том, что пользователь должен иметь доступ только к интерфейсу, но не к деталям внутренней реализации.

### Абстракция

Когда мы писали класс словаря, мы подразумевали, что пользователь будет что-то добавлять или удалять с помощью специальных методов. Вот только, пользователям чаще всего не очень интересно, что мы подразумевали. Здесь возникает принцип абстракция: мы хотим, чтобы снаружи было доступно только то, что изначально было на это рассчитано.

In [5]:
# вот так
dct.add_word('мяч', 'ball')
# а не вот так
dct.vocabulary['питон'] = 'python'

In [6]:
dct.get_all_words()

{'мяч': 'ball', 'питон': 'python'}

К сожалению, у питона конкретно с этим принципом все не очень хорошо: чем глубже вы что-то спрячете, тем больше букв пользователю придется написать, чтобы это достать, но он все равно однажды достанет

Тем не менее, у питона есть несколько методов что-то спрятать, я скажу только о самых простых.

Во-первых, можно поставить один или два знака "_" в начале названия атрибута или метода, и тогда питон либо просто намекнет, что пользователь не прав, либо выдаст ошибку, когда тот попытается обратиться к ним. Перепишем наш класс словаря, сделав атрибут со словами скрытым и добавив какой-нибудь скрытый метод.

In [7]:
class SafeDictionary:

    def __init__(self, source=None, target=None, meta=None):
        self.source_language = source
        self.target_language = target
        self.meta = meta
        self.size = 0
        # вот он атрибут, который мы прячем
        self.__vocabulary = {}
        # а вот вызов метода, который снаружи недоступен
        self.__detect_creation()

    def translate(self, word):
        new_word = self.__vocabulary.get(word, None)
        if new_word is None:
            print(f'{word} not in dictionary')
        return new_word

    def add_word(self, source, target):
        if source not in self.__vocabulary:
            self.__vocabulary[source] = target
            self.size += 1
        else:
            print(f'{source} is already added')

    def delete_word(self, word):
        if word in self.__vocabulary:
            self.__vocabulary.pop(word)
            self.size -= 1
        else:
            print(f'{word} not in dictionary')

    def get_all_words(self):
        return self.__vocabulary

    def __detect_creation(self):
        self.creation_time = time()

In [11]:
dct = SafeDictionary('ru', 'en', {'name': 'my dict'})

Теперь питон на нас ругается при попытке достать словарь на прямую, нам придется пользоваться методом, который мы сами и написали.

In [12]:
dct.__vocabulary

AttributeError: 'SafeDictionary' object has no attribute '__vocabulary'

In [13]:
dct.get_all_words()

{}

Но мы все еще можем его немного обмануть

In [14]:
dct._SafeDictionary__vocabulary

{}

Теперь посмотрим, что у нас с методом (все то же самое в целом)

In [16]:
dct.__detect_creation()

AttributeError: 'SafeDictionary' object has no attribute '__detect_creation'

In [17]:
dct._SafeDictionary__detect_creation()

In [18]:
dct.__dict__

{'source_language': 'ru',
 'target_language': 'en',
 'meta': {'name': 'my dict'},
 'size': 0,
 '_SafeDictionary__vocabulary': {},
 'creation_time': 1733816157.7102277}

Вообще, есть в питоне приняты три вида названий атрибутов и методов:
- Просто названия с маленькой буквы (public): доступны снаружи и формируют интерфейс для пользователя
- Названия, которые начинаются с "_" (protected, но не совсем): доступны пользователю, но мы мягко намекаем, что это можно трогать только, если он очень уверен в своих действиях
- Названия с "__" (private): недоступны снаружи, но их все еще можно вытащить методом хитрых комбинаций (пользователь точно знает, что лезет куда-то не туда)

### Инкапсуляция

Фактически, класс выше можно считать примером реализации принципа инкапсуляции: в одном классе лежат и сами данные словаря (`source_language`, `target_language`, `meta` etc.), и свойственный словарю набор возможных действий (`translate`, `add_word`, `delete_word` etc.)

Как делать **НЕ** надо:

In [None]:
class SillyDictionary:

    def __init__(self, source=None, target=None, meta=None):
        self.source_language = source
        self.target_language = target
        self.meta = meta
        self.size = 0
        # вот он атрибут, который мы прячем
        self.__vocabulary = {}
        # а вот вызов метода, который снаружи недоступен
        self.__detect_creation()

    def translate(self, word):
        new_word = self.__vocabulary.get(word, None)
        if new_word is None:
            print(f'{word} not in dictionary')
        return new_word

    def add_word(self, source, target):
        if source not in self.__vocabulary:
            self.__vocabulary[source] = target
            self.size += 1
        else:
            print(f'{source} is already added')

    def delete_word(self, word):
        if word in self.__vocabulary:
            self.__vocabulary.pop(word)
            self.size -= 1
        else:
            print(f'{word} not in dictionary')

    def __detect_creation(self):
        self.creation_time = time()

In [None]:
def get_all_dict_words(dct):
    return dct._SillyDictionary__vocabulary

In [None]:
dct = SillyDictionary('ru', 'en', {'name': 'my dict'})
dct.add_word('мяч', 'ball')

In [None]:
get_all_dict_words(dct)

{'мяч': 'ball'}

### Наследование

Представьте, что у нас есть словарь, с которым все просто: слова всегда подаются по одному. Но вдруг нам понадобилось добавлять слова списками (и апельсины бочками, да). Здесь нам может помочь наследование.

Общая идея заключается в том, что мы не хотим переписывать общие для старого и нового словаря методы. Тот же вывод всех слов или фиксацию времени. Но мы хотим сделать новый метод, который умеет добавлять список. Для этого можно создать новый класс, но унаследовать его от предыдущего

In [19]:
class DictionaryWithList(SafeDictionary):

    def add_many_words(self, words):
        # добавляем много слов
        for word, target in words:
            self.add_word(word, target)

    def delete_many_words(self, words):
        # удаляем много слов
        for word in words:
            self.delete_word(word)

In [20]:
dct = DictionaryWithList('ru', 'en', {'name': 'my dict'})

In [21]:
dct.add_word('кошка', 'cat')

In [22]:
words = [('собака', 'dog'), ('птица', 'bird'), ('стол', 'table')]
dct.add_many_words(words)
dct.get_all_words()

{'кошка': 'cat', 'собака': 'dog', 'птица': 'bird', 'стол': 'table'}

In [23]:
words = ['птица', 'стол']
dct.delete_many_words(words)
dct.get_all_words()

{'кошка': 'cat', 'собака': 'dog'}

### Полиморфизм

Теперь представим, что нам нужен словарь, который умеет сам приводить слово к начальой форме и только после этого переводить его. При этом, нам бы очень не хотелось объяснять пользователям, что теперь им нужно использовать метод с другим именем.

Здесь нам поможет полиморфизм, идея которого в том, что под одинаковым интерфейсом может скрываться разное содержание, реализующее нужный нам метод. И мы все еще не переопределяем то, что менять не надо.

In [24]:
class SuperDictionary(DictionaryWithList):

    def translate(self, word):
        # переводим слово, получив перед этим его лемму
        word = morph.parse(word)[0].normal_form
        # здесь мы вызываем метод перевода из родителя, так как здесь мы его уже переопределили
        new_word = DictionaryWithList.translate(self, word)
        return new_word

In [25]:
dct = SuperDictionary('ru', 'en', {'name': 'my dict'})

In [26]:
words = [('собака', 'dog'), ('птица', 'bird'), ('стол', 'table')]
dct.add_many_words(words)
dct.get_all_words()

{'собака': 'dog', 'птица': 'bird', 'стол': 'table'}

In [27]:
dct.translate('собаки')

'dog'

## Дополнительная информация

- Статические методы: НЕ принимают в качестве первого аргумента сам объект

In [28]:
class StrangeDictionary(Dictionary):

    @staticmethod
    def strange_method(word):
        print(word, len(word))

    # если не указать, что метод static
    def very_strange_method(word):
        print(word, len(word))

In [29]:
dct = StrangeDictionary()

In [30]:
dct.strange_method('кошка')

кошка 5


In [31]:
dct.very_strange_method('кошка')

TypeError: StrangeDictionary.very_strange_method() takes 1 positional argument but 2 were given

In [32]:
dct.very_strange_method()

TypeError: object of type 'StrangeDictionary' has no len()

- `*args`, `**kwargs`: позволяют собрать все аргументы функции в один кортеж и(ли) словарь:

In [33]:
def func(*args, **kwargs):
    print(f'args: {args}')
    print(f'kwargs: {kwargs}')

In [34]:
func(1, 2, 3, 5, a=23, b=12, c=74)

args: (1, 2, 3, 5)
kwargs: {'a': 23, 'b': 12, 'c': 74}


- Методы с названием имени \_\_METHOD\_\_: нужны для переопределения базовых операций:

Например, `__repr__` позволяет рассказать питону, как надо отображать объект этого класса, а `__str__` $-$ как надо его переводить в строку (да, это разные вещи)

In [35]:
class BeautifulDictionary(SuperDictionary):
    def __repr__(self):
        s = SuperDictionary.__name__.split('.')[-1]
        args = []
        for el, val in self.__dict__.items():
            args.append(f'{el}={val}')
        if len(args) > 0:
            args = f'({", ".join(args)})'
            s += args
        return s

In [36]:
dct = BeautifulDictionary('ru', 'en', {'name': 'my dict'})

In [37]:
dct

SuperDictionary(source_language=ru, target_language=en, meta={'name': 'my dict'}, size=0, _SafeDictionary__vocabulary={}, creation_time=1733816912.5647068)

In [38]:
print(dct)

SuperDictionary(source_language=ru, target_language=en, meta={'name': 'my dict'}, size=0, _SafeDictionary__vocabulary={}, creation_time=1733816912.5647068)


- Что на самом деле делает питон, когда скрывает атрибуты и методы: мухлюет, как всегда

Питон вместе того, чтобы сохранить атрибут с тем именем, которое вы ему дали, сохраняет его в виде `_CLASS__ATTRIBUTE`

In [39]:
dct.__dict__

{'source_language': 'ru',
 'target_language': 'en',
 'meta': {'name': 'my dict'},
 'size': 0,
 '_SafeDictionary__vocabulary': {},
 'creation_time': 1733816912.5647068}

## SOLID

Более подробно можно почитать вот [тут](https://habr.com/ru/articles/688530/).

Принципы SOLID:
- **S $-$ Single Responsibility Principle** $-$ у класса должна быть только одна четкая цель и логика использования, швейцарские ножи в мире ООП не поощряются

- **O $-$ Open Closed Principle** $-$ мы должны иметь возмодность расширять возможности класса (добавить новый метод, переопределить старый), но у нас не должно возникать необходимости править исходный код

- **L $-$ Liskov Substitution Principle** $-$ наследник может использоваться на месте родителя (словарь с красивым интерфейсом - все еще словарь и в нем должно быть можно найти нужное слово)

- **I $-# Interface Segregation Principle** $-$ класс должен уметь только то, что уместно для его зоны отвественности (русско-английский словарь не умеет рисовать картины и переводить книги, он просто словарь)

- **D $-$ Dependency Inversion Principle** $-$ не должно быть прямых зависимостей между модулями, только между интерфейсами (у переводчика не должно быть методов "перевести на русский", "перевести на английский", только метод "перевести", который использует интерфейс словарей)


## Как делать красивый код

Тут есть несколько моментов:
1. Соблюдать PEP8!
2. Разделять код на понятные функции, большие проекты на отдельные файлы и папки
3. Комментировать ваш код, но в меру: когда комментарий написан к каждой строке, такой код очень тяжело читать. В идеале, ваш код должен быть написан так, чтобы хватало одного комментария к функции, объясняющего ее назначение. В редких случаях $-$ еще комментариев к сложным решениям в логике
4. Прописывать тайпинги: типы входных и выходных значений функций. И придерживаться того, что описали!

Вот о последнем мы с вами сейчас и поговорим

Для работы с типами есть два варианта:
- В последних версиях мы можем писать `list[str]`, имея в виду списки строк. Но в более старых такое приведет к ошибкам, так что лучше пока не стоит (пока весь мир не перешел на питон 3.10+)
- Использовать библиотеку `typing`, которая входит в базовый питон и поддерживает сложные тайпинги для любых версий

In [40]:
from typing import (
    List, # аналог списков, позволяет List[TYPE]
    Dict, # аналог словарей, можем прописать тип ключа и значения, Dict[KEY_TYPE, VALUE_TYPE]
    Tuple, # аналог картежа, Tuple[TYPE]
    Union, # реализует логику "любой из", варианты прописавыются в скобках, Union[TYPE1, TYPE2, ...]
    Optional # либо None, либо то, что прописано в вскобках, Optional[TYPE]
    )

import pandas as pd
import random

Например, у нас есть функция (не пытайтесь понять, зачем она нужна...):
```python
def my_func(data):
    stat = {}
    for key in data:
        for item in data[key]:
            if item not in stat:
                stat[item] = 0
            stat[item] += key
    return stat, pd.DataFrame(data)
```

Какие типы данных должны быть у входных и выходных значений?

Еще, если у нас в коде часто встречается какая-то сложная штука, мы можем прописать ее один раз, дав ей название, после чего использовать его

In [41]:
CustomType = Dict[str, Optional[Union[str, List[str]]]]

In [42]:
def my_func(item: CustomType):
    pass

Правильно оформленая функция:

In [None]:
def do_something(lst: List[str], bad: bool = False) -> List[str]:
    '''
    This function does something (bad or good) to list
    :param lst: list of input strings
    :param bad: marker if bad action should be done
    :return: sorted (or not...) input list
    '''
    if bad:
        random.shuffle(lst)
        return lst
    else:
        return sorted(lst)

Еще есть интересная библиотека `enum`, она тоже встроена в питон и отвечает за хранения наборов значений с поддержкой итерации.
Если вам надо задать закрытое множество объектов (набор времен года, например), то можно использовать эту библиотеку. Еще она очень хорошо работает с FastAPI, где позволяет накладывать более жесткие правила на переменные, чем просто ограничение типов.

In [43]:
from enum import Enum

In [44]:
class YearPeriod(Enum):
    summer = 'summer'
    winter = 'winter'
    spring = 'spring'
    autumn =' autumn'

In [45]:
YearPeriod.summer

<YearPeriod.summer: 'summer'>

In [46]:
def my_func(item: Dict[YearPeriod, List[str]]):
    pass