# `Введение в обработку естественного языка`
<br>

## `Основы ООП, декораторы`
<br><br>

### `Роман Ищенко (roman.ischenko@gmail.com)`

#### `Москва, 2025`

### `ООП в Python`

- Python - это полностью объектно-ориентированный язык<br><br>

- В Python абсолютно всё является объектами, включая классы<br><br>

- Полностью поддерживаются все принципы ООП<br><br>

- Инкапсуляция понимается немного в другом смысле: нет ограничения на доступ к полям класса<br><br>

- Поэтому для инкапсуляции используют договорные соглашения

### `Так выглядят классы в Python`

In [1]:
class Car:
    def __init__(self):
        self.tank = 0
        self.is_turned_on = False

    def fill_up(self, gas_volume):
        self.tank += gas_volume

    def turn_on(self):
        self.is_turned_on = True

    def turn_off(self):
        self.is_turned_on = False

car = Car()
print(type(car), car.__class__)

car.fill_up(10)
print(car.tank)

<class '__main__.Car'> <class '__main__.Car'>
10


### `Функция __init__`

- Главное: `__init__` - не конструктор! Она ничего не создаёт и не возвращает

- Созданием объекта занимается функция `__new__`, переопределять которую без необходимости не надо

- `__init__` получает на вход готовый объект и инициализирует его атрибуты<br>

В отличие от C++, атрибуты можно добавлять/удалять на ходу:

In [4]:
class Cls:
    pass

cls = Cls()
cls.field = 'field'
print(cls.field)

del cls.field
print(cls.field)  # AttributeError: 'Cls' object has no attribute 'field'

field


AttributeError: ignored

### `Параметр self`

- Метод класса отличается от обычной функции только наличием объекта `self` в качестве первого аргумента <br><br>

- Это то же самое, что происходит в C++/Java (там аналогом `self` является указатель/ссылка `this`) <br><br>

- Название `self` является общим соглашением, но можно использовать и другое (не надо!)<br><br>

- Метод класса, не получающий на вход `self` является _статическим_<br><br>

- Статические методы часто используются для специализированного создания объектов класса<br><br>

- Еще есть _методы класса_, входом у них является класс как объект<br><br>

- В Python `__new__` является статическим методом

### `Как быть с инкапсуляцией`

- Приватное поле прежде всего должно быть обозначено таковым
- В Python для этого есть соглашения:<br>

In [7]:
class Cls:
    def __init__(self):
        self.public_field = 'Ok'
        self._private_field = "You're shouldn't see it"
        self.__mangled_field = "YOU REALLY SHOULDN'T SEE IT!!!"

    def get_mangled_field(self):
        return self.__mangled_field

cls = Cls()
print(cls.public_field)
print(cls._private_field)
print(cls.get_mangled_field())
print(cls.__mangled_field)

Ok
You're shouldn't see it
YOU REALLY SHOULDN'T SEE IT!!!


AttributeError: ignored

In [18]:
print(cls._Cls__mangled_field)

YOU REALLY SHOULDN'T SEE IT!!!


### `Атрибуты объекта и класса`

In [11]:
class Cls:
    pass

cls = Cls()
print([e for e in dir(cls) if not e.startswith('__')])

cls.some_obj_attr = '1'
print([e for e in dir(cls) if not e.startswith('__')])

[]
['some_obj_attr']


In [12]:
print([e for e in dir(Cls) if not e.startswith('__')])

Cls.some_cls_attr = '1'
print([e for e in dir(Cls) if not e.startswith('__')])
print([e for e in dir(cls) if not e.startswith('__')])

[]
['some_cls_attr']
['some_cls_attr', 'some_obj_attr']


### `Переменная __dict__`

- Для большого числа типов в Python пределена переменная-словарь `__dict__`
- Она содержит атрибуты, специфичные для данного объекта (не его класса и не его родителей)
- Множество элементов `__dict__` является подмножеством элементов, возвращаемых функцией `dir()`

In [32]:
class A: pass

print(set(A.__dict__.keys()).issubset(set(dir(A))))

[].__dict__
# https://stackoverflow.com/questions/46575174/if-an-object-doesnt-have-dict-must-its-class-have-a-slots-attribut

True


AttributeError: ignored

### `Доступ к атрибутам`

- Для работы с атрибутами есть функции `getattr`, `setattr` и `delattr`
- Их основное преимущество - оперирование именами атрибутов в виде строк

In [None]:
cls = Cls()

setattr(cls, 'some_attr', 'some')

print(getattr(cls, 'some_attr'))

delattr(cls, 'some_attr')

print(getattr(cls, 'some_attr'))

some


AttributeError: 'Cls' object has no attribute 'some_attr'

### `Class magic methods`

- Магические методы придают объекту класса определённые свойства

- Такие методы получают `self` вызываются интерпретатором неявно

- Например, операторы - это магические методы<bf>

Рассмотрим несколько примеров:

In [None]:
class Cls:
    def __init__(self):  # initialize object
        self.name = 'Some class'

    def __repr__(self):  # str for printing object
        return 'Class: {}'.format(self.name)

    def __call__(self, counter):  # call == operator() in C++
        return self.name * counter

cls = Cls()
print(cls.__repr__())  # == print(cls)
print(cls(2))

Class: Some class
Some classSome class


In [15]:
class Digit:
    def __add__(self, val):
        print('add')
    def __mul__(self, val):
        print('add')
Digit() + Digit(), Digit() * Digit()

add
add


(None, None)

### `Class magic methods`

Ещё примеры магических методов:

In [None]:
def __lt__(self, other): pass

def __eq__(self, other): pass

def __add__(self, other): pass

def __mul__(self, value): pass

def __int__(self): pass

def __bool__(self): pass

def __hash__(self): pass

def __getitem__(self, index): pass

def __setitem__(self, index, value): pass

### `Как на самом деле устроен доступ к атрибутам`

При работе с атрибутами вызываются магические методы `__getattr__`, `__getattribute__`, `__setattr__` и `__delattr__`:

In [25]:
class Cls:
    def __setattr__(self, attr, value):
        print(f'Create attr with name "{attr}" and value "{value}"')
        self.__dict__[attr] = value

    def __getattr__(self, attr):
        print(f'WE WILL ENTER IT ONLY IN CASE OF ERROR!')
        return self.__dict__[attr]

    def __getattribute__(self, attr):
        if not attr.startswith('__'):
            print(f'Get value of attr with name "{attr}"')

        return super().__getattribute__(attr)  # call parent method implementation

    def __delattr__(self, attr):
        print(f'Remove attr "{attr}" is impossible!')


### `Как на самом деле устроен доступ к атрибутам`

In [31]:
cls = Cls()

cls.some_attr = 'some'
a = cls.some_attr

del cls.some_attr
b = cls.some_attr
cls.non_exists_attr

Create attr with name "some_attr" and value "some"
Get value of attr with name "some_attr"
Remove attr "some_attr" is impossible!
Get value of attr with name "some_attr"
Get value of attr with name "non_exists_attr"
WE WILL ENTER IT ONLY IN CASE OF ERROR!


KeyError: ignored

### `Магические методы и менеджер контекста`

Менеджер контекста (оператор `with`) работает с двумя магическими методами:

- `__enter__` - код, который нужно выполнить над объектом при входе в блок менеджера
- `__exit__` - код, который нужно в любом случае выполнить при выходе из блока

In [40]:
class SomeDataBaseDao:
    def __init__(self): self._db = ()

    def append(self, value): self._db.append(value)

    def __enter__(self):
        self._db = list(self._db)
        print('Set DB to read-write mode')
        return self

    def __exit__(self, exception_type, exception_val, trace):
        self._db = tuple(self._db)
        print('Set DB to read-only mode')
        return True

dao = SomeDataBaseDao()
#dao.append(1)  # AttributeError: 'tuple' object has no attribute 'append'
with dao:
    dao.append(1)
print(dao._db)

Set DB to read-write mode
Set DB to read-only mode
(1,)


Например: https://pytorch.org/docs/stable/_modules/torch/autograd/grad_mode.html#no_grad

### `Наследование в Python`

In [None]:
class Parent:
    def __init__(self):
        self.value = 10

    def get_value(self):
        return self.value

class Child(Parent):
    pass

class NewChild(Parent):
    def __init__(self):
        super().__init__()  # without it we will not have `value` field
        self.new_value = 20

print(Parent().get_value(), Child().get_value(), NewChild().get_value())

print(Child().__dict__)
print(NewChild().__dict__)

10 10 10
{'value': 10}
{'value': 10, 'new_value': 20}


### `Перегрузка родительских методов`

In [None]:
class Parent:
    def __init__(self, value):
        self._value = value

    def get_value(self):
        return self._value

    def __str__(self):
        return f'Value: {self._value}'

class Child(Parent):
    def __init__(self, value):
        Parent.__init__(self, value)  # == super().__init__(value)

    def get_value(self):
        return Parent.get_value(self) * 2  # == super().get_value() * 2

print(Parent(10).get_value())
print(Child(10).get_value())
print(Child(10)._value)
print(Child(10))

10
20
10
Value: 10


### Искаженные (mangled) атрибуты

Главное название такого именования - борьба с коллизией важных полей при наследовании (аналог `final` атрибутов в Java):

In [47]:
class Parent:
    def __init__(self):
        self.__variable = 'Parent'

class Child(Parent):
    def __init__(self):
        self.__variable = 'Child'

print(Parent().__dict__)
print(Child().__dict__)

{'_Parent__variable': 'Parent'}
{'_Child__variable': 'Child'}


### `Множественное наследование`

- Даёт возможность классу получить методы и свойства сразу нескольких предков<br><br>
- Позволяет строить сложные иерархии зависимостей<br><br>
- Использовать без необходимости не нужно, поскольку архитектура кода сильно усложняется<br><br>
- В Python поддерживается без ограничений<br><br>
- У класса может быть один и более предков (`object` есть всегда)

### `Множественное наследование в Python`
- Методы и атрибуты ищутся в следующем порядке:<br><br>
    1. имя ищется в объекте (т.е. в его `__dict__`)
    2. дальше в классе объекта
    3. дальше в предках класса<br><br>
- Для поиска по предкам используется MRO (Method resolution order)<br><br>
- У каждого класса в момент создания вычисляется этот порядок и сохраняется в атрибуте `__mro__`

In [None]:
class A():
    def method(self): return 'A'

class B():
    def method(self): return 'B'

class C(A, B): pass

print(C.__mro__)
print(C().method())

(<class '__main__.C'>, <class '__main__.A'>, <class '__main__.B'>, <class 'object'>)
A


### `Вызов метода класса-родителя`

- В Python есть два способа обращения к родительским методам<br><br>
    - через функцию `super` (использует порядок mro)
    - напрямую по имени<br><br>

In [None]:
class A():
    def method(self): return 'A'

class B():
    def method(self): return 'B'

class C(A, B):
    def method(self):
        return (A.method(self), B.method(self), super().method())

print(C.__mro__)
print(C().method())

(<class '__main__.C'>, <class '__main__.A'>, <class '__main__.B'>, <class 'object'>)
('A', 'B', 'A')


### `Функция isinstance`

In [None]:
print('isinstance(1, int) == {}'.format(isinstance(1, int)))
print('isinstance(1.0, int) == {}'.format(isinstance(1.0, int)))
print('isinstance(True, int) == {}'.format(isinstance(True, int)))

class Interface:
    def get_value(self):
        raise NotImplementedError

class Cls1(Interface):
    pass

class Cls2(Interface):
    pass

print('isinstance(Cls1(), Cls1) == {}'.format(isinstance(Cls1(), Cls1)))
print('isinstance(Cls1(), Interface) == {}'.format(isinstance(Cls1(), Interface)))
print('isinstance(Cls1(), object) == {}'.format(isinstance(Cls1(), object)))

print('isinstance(Cls2(), Cls1) == {}'.format(isinstance(Cls2(), Cls1)))

isinstance(1, int) == True
isinstance(1.0, int) == False
isinstance(True, int) == True
isinstance(Cls1(), Cls1) == True
isinstance(Cls1(), Interface) == True
isinstance(Cls1(), object) == True
isinstance(Cls2(), Cls1) == False


### `Функция issubclass`

Очень похожа на `isinstance`, но проверяет только классы, не объекты:

In [None]:
# print('issubclass(1, int) == {}'.format(issubclass(1, int))) -> TypeError: issubclass() arg 1 must be a class
print('issubclass(float, int) == {}'.format(issubclass(float, int)))
print('issubclass(bool, int) == {}'.format(issubclass(bool, int)))

# print('issubclass(Cls1(), Cls1) == {}'.format(issubclass(Cls1(), Cls1))) -> TypeError
print('issubclass(Cls1, Interface) == {}'.format(issubclass(Cls1, Interface)))
print('issubclass(Cls1, object) == {}'.format(issubclass(Cls1, object)))
print('issubclass(Cls2, Cls1) == {}'.format(issubclass(Cls2, Cls1)))

issubclass(float, int) == False
issubclass(bool, int) == True
issubclass(Cls1, Interface) == True
issubclass(Cls1, object) == True
issubclass(Cls2, Cls1) == False


### `Полиморфизм в Python`

In [None]:
class Animal:
    def speak(self):
        print("Animal speaks")

class Dog(Animal):
    def speak(self):
        print("Dog barks")

class Cat(Animal):
    def speak(self):
        print("Cat meows")

# Create objects
animal1 = Dog()
animal2 = Cat()

# Call speak for each class
animal1.speak()  # Вывод: Dog barks
animal2.speak()  # Вывод: Cat meows

### `Декораторы в Python`

- Функции или классы, которые позволяют добавлять дополнительную функциональность к другим функциям или методам <br>
- В Python они реализованы как обёртки вокруг функций или методов

In [None]:
def simple_decorator(func):
    def wrapper():
        print("Before function call")
        func()
        print("After function call")
    return wrapper
    
@simple_decorator
def say_hello():
    print("Hello!")

# Аналог
# say_hello = simple_decorator(say_hello)

say_hello()

Before function call
Hello!
After function call


Декораторы с параметрами

In [1]:
def parametrized_decorator(a, b):
    def simple_decorator(func):
        def wrapper():
            print("Before function call")
            print(f'Parameters: {a=}, {b=}')
            func()
            print("After function call")
        return wrapper
    return simple_decorator
    
@parametrized_decorator(10, 'example')
def say_hello():
    print("Hello!")

# Аналог
# real_dec = parametrized_decorator(10, 'example')
# say_hello = real_dec(say_hello)

say_hello()

Before function call
Parameters: a=10, b='example'
Hello!
After function call


Чтобы передать аргументы в декорируемую функцию, используется `*args` и `**kwargs`:

In [58]:
def decorator_with_args(func):
    def wrapper(*args, **kwargs):
        print(f"Arguments were: {args}, {kwargs}")
        return func(*args, **kwargs)
    return wrapper

@decorator_with_args
def greet(name):
    print(f"Hi, {name}!")

greet("Alice")

Arguments were: ('Alice',), {}
Hi, Alice!


Можно накладывать несколько декораторов на одну функцию. Они будут применяться сверху вниз:

```
@decorator1
@decorator2
def my_func():
    pass
```
Это эквивалентно
```
my_func = decorator1(decorator2(my_func))
```

Класс — это `callable`, так что ему ничто не мешает быть декоратором:

In [59]:
class Timer:
    from time import time
    from sys import stderr

    def __init__(self, fun):
        self.function = fun

    def __call__(self, *args, **kwargs):
        start_time = self.time()
        result = self.function(*args, **kwargs)
        end_time = self.time()
        print(f"Duration: {end_time-start_time} seconds", file=self.stderr)
        return result


# adding a decorator to the function
@Timer
def payload(delay):
    return sorted(sum(range(i)) for i in range(delay))

print(payload(10000)[-1])

49985001


Duration: 1.0111806392669678 seconds


### `Декораторы в Python`

Есть много декораторов, встроенных в Python:

__Пример__: декоратор `@property`, превращающий get-метод класса в неизменяемое поле для чтения:

In [None]:
class A:
    def __init__(self):
        self._field = 'value'

    @property
    def field(self):
        return self._field

a = A()
print(a.field)

#a.field() -> TypeError: 'str' object is not callable
#a.field = 5 -> AttributeError: can't set attribute

value


- В языке и библиотеках определено множество декораторов, используем далее некоторые
- Определять декораторы можно самостоятельно, об этом мы говорили выше

### `Статические методы`

- Обычные методы класса принимают на вход первым параметром вызывающий объект и работают с ним
- Статические методы являются методами класса и к объекту не привязаны
- Как следствие, их можно вызывать без объекта
- В Python статический метод определяется с помощью декоратора `@staticmethod`

In [None]:
class A:
    def method(self):
        print('Regular method')

    @staticmethod
    def static_method():
        print('Static method')

# A.method()  # method() missing 1 required positional argument: 'self'

A().method()
A.static_method()
A().static_method()  # object also has his type methods
A.method(A())

Regular method
Static method
Static method
Regular method


### `Методы класса`

- Метод класса получает на вход объект-класса вместо объекта класса
- Используется для доступа к свойствам класса в целом (а не свойствам его экземпляров)
- В Python метод класса определяется с помощью декоратора `@classmethod`

In [None]:
class Cls:
    attr = 10

    @classmethod
    def set_attr(cls, val):
        cls.attr = val

a = Cls()
print(a.attr)

b = Cls()
b.set_attr(20)
print(a.attr)

10
20


### `Сохранение объектов: модуль pickle`

Метод pickle в Python используется для сериализации и десериализации объектов. Сериализация — это процесс преобразования объекта в байтовый поток, а десериализация — это обратный процесс, возвращающий объект из байтового потока.

In [None]:
class Cls:
    def __init__(self, value):
        self.__value = value

    def get_value(self):
        return self.__value

In [None]:
import pickle

cls = Cls(Cls(10))

with open('cls.pkl', 'wb') as fout:
    pickle.dump(cls, fout)

In [None]:
with open('cls.pkl', 'rb') as fin:
    cls_2 = pickle.load(fin)

In [None]:
cls_2.get_value().get_value()

10

**Ограничения и предостережения**

- Не все объекты можно сериализовать с помощью pickle. Объекты, определённые в __main__ (например, лямбда-функции), не могут быть корректно сериализованы и десериализованы <br><br>
- Будьте осторожны при десериализации данных из ненадежных источников. Модуль pickle не безопасен от произвольного кода, поэтому есть риск выполнения вредоносного кода <br><br>

## `Спасибо за внимание!`