# Python и инструменты машинного обучения


<img src="https://www.python.org/static/community_logos/python-logo-master-v3-TM.png" align="right" style="height: 200px;"/>

# Занятие 5. Объектно-ориентированное программирование в Python


# Что такое ООП?

**Парадигма программирования** — совокупность идей и понятий, определяющих стиль написания компьютерных программ (подход к программированию).



**Парадигмы программирования:**
- **императивное программирование** - последовательность команд, которые выполняются одна за другой
- **процедурное программирование** - создание процедур и функций для сокращения дублирования кода
- **декларативное программирование** - фокус на то "что" должна делать программа, а не "как" (примерно как SQL)
- **функциональное программирование** - разбиение программы на функции, выход одной функции - выход другой
- **структурное программирование** - веха в области программирования, структурировали основные элементы написания программ - последовательность, ветвление (if/else), цикл while, подпрограммы (функции)
- **объектно-ориентированное программирование**

**Объектно-ориентированное программирование** - парадигма программирования, основанная на представлении программы в виде совокупности взаимодействующих объектов со своими свойствами и поведениями, каждый из которых является экземпляром определённого класса, которые образуют иерархию наследования.

**Основные термины в ООП:**
- Класс
- Объекты
- Абстракция
- Инкапсуляция
- Наследование
- Полиморфизм





## Объекты и классы

Основная идея ООП - выделить в программе отдельные сущности - объекты.

**Примеры объектов из реальной жизни** - стол, чашка, человек, книга, здание и т.д.
**Примеры объектов в программах** - пользователь, кнопка, сообщение.

У объектов могут быть свои свойства, например, цвет, содержание или имя пользователя. Такие переменные (конкретные характеристики объекта) называются **атрибутами**.

Возможные действия, например, "отправить сообщение", "нанять сотрудника", "нажать кнопку", называются **методами**. Это функции, которые описаны внутри объекта или класса. Они относятся к определенному объекту и позволяют взаимодействовать с ними или другими частями кода. 

Чтобы не создавать для каждого отдельного объекта свои методы (переиспользование кода), существуют классы. 
**Класс** — это «шаблон» для объекта, который описывает его атрибуты и методы Каждый объект — это экземпляр какого-нибудь класса.

**Пример** - пишем систему учета сотрудников. Создадим класс "Сотрудник" с атрибутами: ФИО, должность, подразделение, руководитель, зарплата; и методами: "перевести в другой отдел", "повысить зарплату", "сменить должность", "уволить". Отдельный сотрудник, Вася Пупкин, является объектом - экземпляром класса "Сотрудник".

## Абстракция

Абстрагирование — это способ выделить набор наиболее важных атрибутов и методов и исключить незначимые. Соответственно, абстракция — это использование всех таких характеристик для описания объекта. Важно представить объект минимальным набором полей и методов без ущерба для решаемой задачи.

Пример: объекту класса «программист» вряд ли понадобятся свойства «умение готовить еду» или «любимый цвет». Они не влияют на его особенности как программиста. А вот «основной язык программирования» и «рабочие навыки» — важные свойства, без которых программиста не опишешь.

Набор атрибутов и методов, доступный извне, работает как интерфейс для доступа к объекту. Через них к нему могут обращаться другие структуры данных, причем им не обязательно знать, как именно объект устроен внутри.



## Инкапсуляция

**Каждый объект — независимая структура.** Он содержит в себе все, что ему нужно для работы. Если ему нужна какая-либо переменная, она будет описана в теле объекта, а не наружном коде. Это делает объекты более гибкими. Даже если внешний код перепишут, логика работы не изменится.

Инкапсуляция позволяет спрятать от внешнего кода и других объектов детали реализации того или иного метода. Другим объектам не важно (и не нужно) знать как именно объект выполняет свою задачу, главное - что выполняет :)

Таким образом, внутреннее устройство одного объекта закрыто от других: извне «видны» только значения атрибутов и результаты выполнения методов.

## Наследование

Позволяет создавать классы и объекты, которые похожи друг на друга, но немного отличаются, например, имеют дополнительные атрибуты или другие методы. Более общий класс в таком случае становится «родителем», а более специфичный и подробный — «наследником».

Например, класс "сотрудник" может иметь наследные классы "программист", "аналитик" и "тестировщик", каждый из которых имеет собственные методы, например, "запрограммировать", "проанализировать", "протестировать", а остальные методы и атрибуты класса "сотрудник" будут присутствовать во всех дочерних классах. И наш Вася Пупкин будет и экземпляром класса "сотрудник", и класса "программист".

У одного "родителя" может быть несколько дочерних классов, у одного дочернего класса может быть и несколько родительских.

Наследование позволяет создавать сложные схемы с четкой иерархией "от общего к частному". Это облегчает понимание и масштабирование кода. Не нужно много раз переписывать в разных объектах одни и те же свойства. Достаточно унаследовать эти объекты от одного "родителя", и родительские свойства применятся автоматически.

## Полиморфизм

Одинаковые методы разных классов могут выполнять задачи разными способами. Например, у "сотрудника" есть метод "работать". У "программиста" реализация этого метода будет означать написание кода, а у "тестировщика" — рассмотрение управленческих вопросов. Но глобально и то, и другое будет работой.

Тут важны единый подход и договоренности между специалистами. Если метод называется delete, то он должен что-то удалять. Как именно — зависит от объекта, но заниматься такой метод должен именно удалением. Более того: если оговорено, что «удаляющий» метод называется delete, то не нужно для какого-то объекта называть его remove или иначе. Это вносит путаницу в код.

---

# ООП в Python

## Объявление класса и экземпляра

В Python объявление класса выполняется следующим образом:

In [12]:
class MyLittleClass(object):  # название класса и родительский класс, родительский класс по умолчанию - object, его можно и не указывать
#class MyLittleClass:
    # Атрибут класса
    color = "blue"
    
    # Метод
    def set_color(self, new_color):
        color = new_color
        print('set color to', color)

Создание объекта - экземпляра класса выглядит так:

In [13]:
obj = MyLittleClass()

In [14]:
type(obj)

__main__.MyLittleClass

Обращение к атрибуту экземпляра выглядит следующим образом:

In [15]:
obj.color

'blue'

Вызов метода экземпляра выглядит так:

In [16]:
obj.set_color('red')
obj.color

set color to red


'blue'

**Почему `color` внутри объекта не поменялся?**

Потому что обращение к атрибутам класса должно иметь форму `self.attribute_name`, а `color` в методе `set_color` -- просто локальная переменная :)

In [17]:
class MyLittleClass2:
    color = "blue"
    
    def set_color(self, new_color):
        self.color = new_color
        print('set color to', self.color)

In [18]:
obj = MyLittleClass2()
obj.color

'blue'

In [19]:
obj.set_color('red')
obj.color

set color to red


'red'

`self` - ссылка на "себя", на экземпляр класса, для которого хотим получить значение атрибута или вызвать метод. Является первым аргументом метода и используется внутри методов. 

Можем ли мы напрямую поменять значение атрибута экземпляра?

Можем, но это считается нехорошей практикой. Предпочтительнее писать т.н. методы-геттеры (для чтения значений атрибутов) и методы-сеттеры (для записи значений атрибутов)

In [20]:
obj.color = 'green'
obj.color

'green'

**Замечание** - в Python все является объектом, даже сам класс, поэтому важно разделять методы и атрибуты экземпляров класса и самого класса:

In [21]:
MyLittleClass2.color

'blue'

In [22]:
MyLittleClass2().color

'blue'

## Метод-конструктор

Чтобы каждый раз не устанавливать состояние (значения аргументов) экземпляра класса, можем воспользоваться **конструктором** - особым методом, который вызывается при создании экземпляра класса:

In [23]:
class MyLittleClass3:
    #color = "blue"
    
    def __init__(self, name, color):
        self.color = color
        self.name = name

    def set_color(self, new_color):
        self.color = new_color
        print('set color to', self.color)

In [25]:
obj = MyLittleClass3("Walter", "White")
obj.color

'White'

In [26]:
obj.name

'Walter'

In [27]:
obj.occupation

AttributeError: ignored

## Динамичность атрибутов

Мы также можем динамически определить атрибуты, которых вообще не было в определении класса:

In [None]:
obj.some_attribute = 42
obj.some_attribute

42

Поговорим об аргументе `self` в определении метода. Когда мы вызываем метод как `obj.methodname()`, неявно первым аргументом передается ссылка на `obj` в качестве аргумента `self`:

In [28]:
class MyLittleClass4:
    def method_without_self(arg):
        print(arg)
        
    def method_with_self(self, arg):
        print(arg)

In [29]:
obj = MyLittleClass4()
obj.method_with_self('i am an argument')
obj.method_without_self('i am another argument') # здесь мы на самом деле передаем по два аргумента, self и arg

i am an argument


TypeError: ignored

Как вызвать методы без `self`? Они не привязаны к экземпляру класса (потому что не имеют доступа к его локальным данным), зато привязаны к классу:

In [30]:
MyLittleClass4.method_without_self('i am another argument') # а здесь мы передаем только один аргумент

i am another argument


Поскольку все является объектом, то можно и "оторвать" метод от экземпляра:

In [33]:
func = MyLittleClass4.method_without_self
func("hello")

hello


In [34]:
func2 = MyLittleClass4.method_with_self
func2("hello") # передаем один аргумент

TypeError: ignored

Получили ошибку, т.к. не передали объект для аргумента `self`.

In [35]:
obj = MyLittleClass4()
func2(obj, "hello")

hello


А можем и наоборот привязать существующую функцию к объекту:

In [36]:
obj.get_color()

AttributeError: ignored

In [37]:
def get_color_function(self):
    return self.color

In [39]:
MyLittleClass4.get_color = get_color_function
obj = MyLittleClass4()
obj.get_color()

AttributeError: ignored

Ах да, цвета-то у нас нет. Не проблема - добавим атрибут `color` к экземпляру?

In [40]:
obj.color = 'pink'
obj.get_color()

'pink'

Но сейчас атрибут `color` есть только у объекта `obj`, создадим новый объект и посмотрим есть ли у него атрибут `color`:

In [41]:
obj2 = MyLittleClass4()
obj2.get_color()

AttributeError: ignored

Нужно добавить атрибут не к одному экземпляру класса, а ко всему классу:

In [42]:
MyLittleClass4.color = 'green'
obj3 = MyLittleClass4()
obj3.get_color()

'green'

In [43]:
obj3.color == MyLittleClass4.color

True

In [44]:
obj.color

'pink'

In [45]:
obj2.color

'green'

## Функция `dir`

Чтобы посмотреть методы и атрибуты любого объекта, можно воспользоваться функцией `dir`:

In [46]:
print(dir(obj3))

['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'color', 'get_color', 'method_with_self', 'method_without_self']


In [47]:
print(dir(MyLittleClass4))

['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'color', 'get_color', 'method_with_self', 'method_without_self']


In [55]:
obj3.extra = 17

In [56]:
print(dir(obj3))

['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'color', 'extra', 'get_color', 'method_with_self', 'method_without_self']


In [57]:
print(dir(MyLittleClass4))

['__class__', '__delattr__', '__dict__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__module__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', 'color', 'get_color', 'method_with_self', 'method_without_self']


Чтобы оставить только методы в выдаваемом списке, воспользуемся функцией `getattr` (для получения занчения атрибута по переменной) и функцией `callable` (проверяет можем ли "вызвать" объект как функцию):

In [59]:
print([name for name in dir(obj) if callable(getattr(obj, name))])

['__class__', '__delattr__', '__dir__', '__eq__', '__format__', '__ge__', '__getattribute__', '__gt__', '__hash__', '__init__', '__init_subclass__', '__le__', '__lt__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__sizeof__', '__str__', '__subclasshook__', 'get_color', 'method_with_self', 'method_without_self']


In [60]:
callable(obj3.color)

False

In [None]:
dir(obj3.color)

['__add__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__getnewargs__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__mod__',
 '__mul__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__rmod__',
 '__rmul__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'capitalize',
 'casefold',
 'center',
 'count',
 'encode',
 'endswith',
 'expandtabs',
 'find',
 'format',
 'format_map',
 'index',
 'isalnum',
 'isalpha',
 'isascii',
 'isdecimal',
 'isdigit',
 'isidentifier',
 'islower',
 'isnumeric',
 'isprintable',
 'isspace',
 'istitle',
 'isupper',
 'join',
 'ljust',
 'lower',
 'lstrip',
 'maketrans',
 'partition',
 'replace',
 'rfind',
 'rindex',
 'rjust',
 'rpartition',
 'rsplit',
 'rstrip',
 'split',
 'splitlines',
 'startswith',
 'strip',
 'swapcase',
 'title',
 'translate',
 'upper',


## Переопределение класса

Что будет, если сначала создадим экземпляр класса, а затем переопределим его атрибут? Проверим:

In [61]:
class MCLS:
    attr1 = 'hello'

In [62]:
obj = MCLS()
obj.attr1

'hello'

In [63]:
MCLS.attr1 = "Hola!"
obj.attr1

'Hola!'

In [64]:
class MCLS:
    attr1 = 'bye'

In [65]:
obj2 = MCLS()
obj2.attr1

'bye'

In [66]:
obj.attr1

'Hola!'

In [67]:
obj.__class__.attr1 = "Aloha"

In [68]:
obj.attr1

'Aloha'

In [69]:
MCLS = obj.__class__

In [70]:
del obj.__class__

TypeError: ignored

## Методы и атрибуты по умолчанию

Посмотрим какие методы и атрибуты создаются для класса и экземпляра по умолчанию. Для этого нам поможет функция `dir`:

In [71]:
help(dir)

Help on built-in function dir in module builtins:

dir(...)
    dir([object]) -> list of strings
    
    If called without an argument, return the names in the current scope.
    Else, return an alphabetized list of names comprising (some of) the attributes
    of the given object, and of attributes reachable from it.
    If the object supplies a method named __dir__, it will be used; otherwise
    the default dir() logic is used and returns:
      for a module object: the module's attributes.
      for a class object:  its attributes, and recursively the attributes
        of its bases.
      for any other object: its attributes, its class's attributes, and
        recursively the attributes of its class's base classes.



Создадим "пустой" класс:

In [72]:
#class ClassWithNothing(object):
class ClassWithNothing:
    pass

Создаем экземпляра "пустого" класса:

In [73]:
nobject = ClassWithNothing()

Напишем простую функцию для вывода атрибутов и методов:

In [74]:
def print_custom_attrs(obj=None):
    if obj is None:
        # в локальной области видимости!
        attrs = dir()
    else:
        attrs = dir(obj)
    print([name for name in attrs if not name.startswith('__')])  # Исключаем служебные методы

In [None]:
help(str.startswith)

Help on method_descriptor:

startswith(...)
    S.startswith(prefix[, start[, end]]) -> bool
    
    Return True if S starts with the specified prefix, False otherwise.
    With optional start, test S beginning at that position.
    With optional end, stop comparing S at that position.
    prefix can also be a tuple of strings to try.



Посмотрим на работу функции `print_custom_attrs`:

In [75]:
print_custom_attrs(ClassWithNothing)

[]


In [76]:
print_custom_attrs(nobject)

[]


In [80]:
nobject.my_instance_attribute = "my value 2"
print_custom_attrs(nobject)

['my_attribute', 'my_instance_attribute']


In [78]:
ClassWithNothing.my_attribute = 'my value'
print_custom_attrs(ClassWithNothing)

['my_attribute']


In [79]:
print_custom_attrs(nobject)

['my_attribute', 'my_instance_attribute']


## Приватность атрибутов

Во многих языках программирования можно регулировать доступ до атрибутов класса от внешнего кода и других классов. Обычно выделяют три уровня доступа:
- публичный - атрибуты доступны как внутри класса, так и из наружнего кода
- защищенный - атрибуты доступны внутри класса и для наследников класса
- приватный - атрибуты доступны только внутри класса

А есть ли в Python приватность атрибутов? Можем ли мы запретить читать и менять атрибуты объекта снаружи (внешним кодом)?

In [81]:
class VeryPrivateDataHolder:
    not_secret = 0     # public
    _secret = 1        # protected
    __very_secret = 2  # private

In [82]:
obj = VeryPrivateDataHolder()

In [83]:
obj.not_secret

0

In [84]:
obj._secret

1

In [85]:
obj.__very_secret

AttributeError: ignored

Казалось бы, в Python всё-таки есть приватность, но есть нюанс:

In [86]:
obj._VeryPrivateDataHolder__very_secret

2

Т.е. при желании все же можем получить доступ к "приватным" атрибутом, но делать так не рекомендуется, особенно не со своими классами!

In [87]:
obj._VeryPrivateDataHolder__very_secret = 'new secret'
obj._VeryPrivateDataHolder__very_secret

'new secret'

In [88]:
VeryPrivateDataHolder.__very_secret

AttributeError: ignored

## Наследование

Рассмотрим как работает наследование в Python с помощью следующих классов:

In [90]:
class Animal:  # неявно наследуется от класса object
    some_value = "animal"

    def __init__(self):
        print("i am an animal")
    
    def speak(self):
        raise NotImplementedError('i don\'t know how to speak')  # ошибка, показывающая что метод еще не реализован

In [91]:
class Cat(Animal):
    some_value = "cat"

    def __init__(self):
        super().__init__()
        print("i am a cat")
    
    def speak(self):
        print('meoooow')

In [92]:
class Dog(Animal):
    some_value = "dog"
    
    def __init__(self):
        super().__init__()
        print("i am a dog")

In [93]:
class Hedgehog(Animal):
    def __init__(self):
        super().__init__()
        print("i am a hedgehog")

In [94]:
animal = Animal()
print(animal.some_value)
animal.speak()

i am an animal
animal


NotImplementedError: ignored

In [95]:
cat = Cat()

i am an animal
i am a cat


In [None]:
cat.some_value # переопределено

'cat'

In [96]:
cat.speak()

meoooow


In [97]:
dog = Dog()

i am an animal
i am a dog


In [98]:
dog.some_value # переопределено

'dog'

In [99]:
dog.speak()

NotImplementedError: ignored

In [100]:
hedgehog = Hedgehog()

i am an animal
i am a hedgehog


In [101]:
hedgehog.some_value

'animal'

In [102]:
hedgehog.speak()

NotImplementedError: ignored

Ромбовидное наследование возможно, но не делайте так, пожалуйста!

In [None]:
#      Animal
#    /       \ 
#  Cat       Dog
#    \       /
#      CatDog

In [103]:
class CatDog(Cat, Dog): 
    def __init__(self):
        super().__init__()
        print("i am a CatDog!")

In [104]:
catdog = CatDog()
catdog.some_value

i am an animal
i am a dog
i am a cat
i am a CatDog!


'cat'

Порядок перечисления родителей важен!

In [105]:
class DogCat(Dog, Cat):  # теперь наоборот
    def __init__(self):
        super().__init__()
        print("i am a CatDog!")

dogcat = DogCat()
dogcat.some_value

i am an animal
i am a cat
i am a dog
i am a CatDog!


'dog'

Что с методами?

In [106]:
CatDog.__mro__

(__main__.CatDog, __main__.Cat, __main__.Dog, __main__.Animal, object)

In [107]:
DogCat.__mro__

(__main__.DogCat, __main__.Dog, __main__.Cat, __main__.Animal, object)

In [108]:
class A: pass
class B(A): pass
class C: pass
class D(B, C): pass

D.__mro__

(__main__.D, __main__.B, __main__.A, __main__.C, object)

Множественное наследование здорового человека - mixins.

# Подключение сторонних модулей

In [None]:
import math

In [None]:
math.pi

3.141592653589793

In [None]:
math.sin(math.pi / 2)

1.0

In [None]:
type(math)

module

In [None]:
dir(math)

['__doc__',
 '__loader__',
 '__name__',
 '__package__',
 '__spec__',
 'acos',
 'acosh',
 'asin',
 'asinh',
 'atan',
 'atan2',
 'atanh',
 'ceil',
 'copysign',
 'cos',
 'cosh',
 'degrees',
 'e',
 'erf',
 'erfc',
 'exp',
 'expm1',
 'fabs',
 'factorial',
 'floor',
 'fmod',
 'frexp',
 'fsum',
 'gamma',
 'gcd',
 'hypot',
 'inf',
 'isclose',
 'isfinite',
 'isinf',
 'isnan',
 'ldexp',
 'lgamma',
 'log',
 'log10',
 'log1p',
 'log2',
 'modf',
 'nan',
 'pi',
 'pow',
 'radians',
 'remainder',
 'sin',
 'sinh',
 'sqrt',
 'tan',
 'tanh',
 'tau',
 'trunc']

In [None]:
import math as m
import pandas as pd

print(m.pi)

3.141592653589793


In [None]:
from math import pi, sin, cos
from sklearn.linear_model import LinearRegression

print(pi)
print(sin(pi / 2))

3.141592653589793
1.0


In [None]:
lr = LinearRegression()

In [None]:
import sklearn

In [None]:
lr = sklearn.linear_model.LinearRegression

In [None]:
from math import * # импортирует всё в global пространство имён - НЕ ДЕЛАТЬ ТАК!

print(pi)
print(log2(pi / 2))

3.141592653589793
0.6514961294723187
