<center>

# Курс "Основы Python для анализа данных"

## Артамонов Игорь Михайлович
## Факультет "Прикладная математика" МАИ

### Занятие № 3.  Объектно ориентированное и функциональное программирование

</center>


## Общение / вопросы по курсу

Платформа для групповой работы Atlassian Confluence факультета "Прикладная математика"

https://mai.moscow/display/PYTML

* <b>Занятие 3. Объектно ориентированное и функциональное программирование</b>
       * Объектно ориентированное программирование
           * Общие понятия
           * ООП в Python
       * Функциональное программирование
           * Общие понятия
           * ФП в Python

## virtualenv + Jupyter notebook

```
<Ctrl> + <Alt> + T - новое окно терминала
```

```
$ conda -V

$ conda update conda

$ conda search "^python$"

$ conda create -n yourenvname python=x.x anaconda

$ source activate yourenvname

$ jupyter notebook

$ conda install -n yourenvname [package]
```

# Общее

* Python позволяет писать в рамках большинства подходов к программированию. Часто говорят, что он поддерживает несколько __парадигм__ программирования:
    - императивное
    - структурное
    - объектно-ориентированное
    - функциональное
* При наличии дополнительных пакетов (Kanren + SymPy) поддерживает даже логическое программирование
* Такие языки называют многопарадигменными (_multi-paradigm programming language_)

### Когда недостаточно императивного программирования:

* много (в том числе - очень) кода
* можно выделить структуру задачи через функции или объекты
* использование внешних библиотек, использующих определенный подход (например, почти все интерфейсные
  библиотеки используют объектно-ориентированный подход
* рефакторинг кода для улучшения его структуры
* хорошее понимание одной из парадигм и умение "раскладывать" в неё задачи

## <font color=blue>ВАЖНО!</font>

* наличие инструментов и использование парадигмы - это __разные__ вещи
* правильное понимание и использование парадигмы часто __важнее__, чем наличие инструментов
* многие инструменты могут успешно использоваться __вне__ "чистого" объектно-ориентированного или функционального кода

In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import scipy as sc
%matplotlib inline

# Объектно-ориентированное программирование

## Основные принципы

* способ __структурирования__ программы
* поведение и свойства (чего-то) помещены в индивидуальные __объекты__
* объект является представителем __класса__

__Класс__ - определяет поведение __группы объектов__

__Объект__ (__пример__ класса) - содержит реальные значения, относящиеся непосредственно к нему

```python
class my_class(superclass(es)):
    
    def __init__(self):
        my_list = []
        my_dict = {1:1}
        n = 0
        pass
    
    def method1(self, *args):
        pass
    
    def method2(self, *args)
        return x
    
    def __len__(self):
        return n
```

self - обращение к переменной объекта
var != self.var

In [None]:
class Gender:
    def __init__(self, gender):
        self.gender = gender

    def __str__(self):
        return self.gender
    
    def get():
        return self.gender
    
    def set(gender):
        self.gender = gender


In [None]:
class Human:
    
    population = 0
    
    def __init__(self, name, age, gender):
        self.name = name
        self.age = age
        self.gender = gender
        Human.population += 1
    
    def __str__(self):
        return 'Имя: {}, возраст: {}, пол: {}'.format(self.name, self.age, self.gender)
    
    def get_name(self):
        return self.name

    @classmethod
    def how_many(cls):
        return  Human.population


In [None]:
Human.how_many()

0

In [None]:
vasya = Human('Вася', 30, Gender('М'))
print(type(vasya), vasya)

<class '__main__.Human'> Имя: Вася, возраст: 30, пол: М


In [None]:
Human('Петя', 32, Gender('М'))

<__main__.Human at 0x7f85a4b07e48>

In [None]:
class Man(Human):
    def __init__(self, name, age, gender):
        Human.__init__(self, name, age, Gender('M'))
    
    def get_name(self):
        return 'Меня зовут ' + Human.get_name(self)

In [None]:
print(Human.how_many())

2


In [None]:
vasya = Man('Вася', 30, Gender('М'))

In [None]:
print(vasya)

Имя: Вася, возраст: 30, пол: M


In [None]:
print(vasya), type(vasya)

Имя: Вася, возраст: 30, пол: M


(None, __main__.Man)

In [None]:
isinstance(vasya, object)

True

In [None]:
isinstance(vasya, Man)

True

In [None]:
isinstance(vasya, list)

False

In [None]:
isinstance([1,2,3], list)

True

## <font color=red>ЗАДАНИЕ</font>

Реализуйте класс клеток (cell) со следующими функциями:<br>
* при создании у клетки задается имя (строка)
* hello - клетка печатает "Клетка:" плюс свое имя
* die - клетка погибает
* divide - возвращяет tuple из двух новых клеток, к имени старой клетки добавлются 0 и 1
    старая клетка погибает
* Надо сохранять количество клеток в переменной класса

In [62]:
class cell:
    count = 0

    def __init__(self, name):
        self.name = name
        self.died = False
        cell.count += 1

    def hello(self):
        if self.died:
            raise Exception('Cell is dead')
        print(f'Клетка: {self.name}')

    def die(self):
        if self.died:
            raise Exception('Cell is already dead')
        self.died = True
        cell.count -= 1

    def divide(self):
        if self.died:
            raise Exception('Cell is dead')
        self.die()
        return (cell(f'{self.name}0'), cell(f'{self.name}1'))

In [63]:
c = cell('kek')
c.hello()
a, b = c.divide()
a.hello()
b.hello()

Клетка: kek
Клетка: kek0
Клетка: kek1


In [64]:
c.die()

Exception: ignored

In [65]:
b.die()

In [66]:
print(cell.count)

1


#### Чего в Python нет:
    * Перегрузки функций

#### Что есть:
    * Перегрузка операторов
        * Арифметических
        * Сравнения
        * Как бинарных (+,-), так и унарных (-)
    * Определение "стандартных" функций (len, str)

In [None]:
class MyVector: 
    def __init__(self, a, b): 
        self.a = a 
        self.b = b 
    
    def __len__(self):
        return math.sqrt(self.a**2 + self.b**2)

    # adding two objects  
    def __add__(self, other): 
        return MyVector(self.a + other.a, self.b + other.b )
  
    def __neg__(self): 
        return MyVector(-self.a, -self.b)
  
    def __str__(self): 
        return f"({self.a}, {self.b})"
    
    def __lt__(self, other): 
        return self.__len__() < other.__len__()
        
    def __eq__(self, other):
        return self.a == other.a and self.b == other.b


In [None]:
a = MyVector(2,3)
b = MyVector(2,3)
c = MyVector(3,5)

print(a, b, c)

(2, 3) (2, 3) (3, 5)


In [None]:
a + b

<__main__.MyVector at 0x7fc13b8268d0>

In [None]:
z = b + c + c

In [None]:
print(z)

(8, 13)


In [None]:
-a

<__main__.MyVector at 0x7fc13b826ac8>

# Функциональное программирование

## Основные принципы

__"Чистое" функциональное программирование__<br>

* Функциональное программирование основано на испольовании функций и их композиций
* Переменные отсутствуют, только константы
* Используются только неизменяемые структуры данных
* Нет циклов, нелокальных переходов и исключений
* Нет побочных эффектов. Для операций с побочными эффектами используются монады

В начале оно кажется очень сложным и непонятным ...

### Чистота функций
* функция возвращает одинаковый результат при одинаковых значениях аргументов
* у функции отсутствуют побочные эффекты -> не зависит от контекста


In [None]:
def pure_func(x):
    return 2 * 3.1415926 * x 

y = 2
 
def impure_func(x):
    y = y + 2 * 3.1415926 * x
    return y

### Следствия
* могут выполняться (оцениваться) в любом порядке
* удобны для параллельного выполнения<br>

### Вызов чистой функции всегда может быть заменен на результат (ссылочная прозрачность)
* проще  тестирование (функция "изолирована")
* читаемость (не надо анализировать другие функции)
* возможность анализа и валидации кода

### Первоклассные функции

* Функции имеют те же свойства, что и остальные значения
* Им пожно присвоить имя или присвоить их объекту
* Их можно передать, как аргумент функции
* Их можно возвращать

## <font color=red>ЗАДАНИЕ</font>

Реализуйте класс, принимающий имя функции в виде строки и функцию, связанную с этой строкой. <br>
При выполнении метода __execute__ с кодом и переменной или значением выполняет функцию, связанную с кодом.<br>
Если кода нет, то методы генерирует прерывание __KeyError__

In [2]:
class FDict():
    def __init__(self):
        self.funcs = dict()

    # добавляет функцию с кодом
    def add(self, code, func):
        self.funcs[code] = func
    
    # удаляет функцию по коду
    def remove(self, code):
        if code not in self.funcs:
            raise KeyError('Func doesnt exist')
        self.funcs.pop(code)

    # выполняет функцию с аргументом
    def execute(self, code, arg):
        if code not in self.funcs:
            raise KeyError('Func doesnt exist')
        return self.funcs[code](arg)
    
    # возвращает функцию по коду
    def get_func(self, code):
        if code not in self.funcs:
            raise KeyError('Func doesnt exist')
        return self.funcs[code]
    
    # получает 2*N аргументов (код, значение, код, значение ..) и возвращает кортеж из значений
    def execute_many(self, *args):
        return tuple(self.funcs[i](j) for i, j in zip(args[::2], args[1::2]) if i in self.funcs)

Проверьте функционирование Вашего кода. Проверьте работу с отсутствующим кодом и добавьте обработку исключения.

In [3]:
import math
from math import sin, cos

x = math.pi / 3

func_dict = FDict()
func_dict.add('sin', math.sin)
func_dict.add('cos', math.cos)

y1 = func_dict.execute('sin', x)
y2 = func_dict.execute('cos', x)

print("1. sin({0:.4f})={1:.4f}, cos({0:.4f})={2:.4f}".format(x, y1, y2))

y1, y2 = func_dict.execute_many('sin', x*2, 'cos', x*3)
print("2. sin({0:4f})={1:4f}, cos({0:4f})={2:4f}".format(x, y1, y2))

1. sin(1.0472)=0.8660, cos(1.0472)=0.5000
2. sin(1.047198)=0.866025, cos(1.047198)=-1.000000


### Лямбда-функции (анонимные функции)

In [4]:
f = lambda x, y: sin(x**2) + cos(y**2)

def func(x,y):
    return sin(x**2) + cos(y**2)

f(math.pi/2, math.pi/2)

-0.15694593947078894

## <font color=green>ВСПОМИНАЕМ</font> генераторы списков, словарей и просто генераторы

In [None]:
import math

even_square_roots = [(lambda x: math.sqrt(x))(x) for x in range(37) if x % 2 == 0]
even_square_roots


[0.0,
 1.4142135623730951,
 2.0,
 2.449489742783178,
 2.8284271247461903,
 3.1622776601683795,
 3.4641016151377544,
 3.7416573867739413,
 4.0,
 4.242640687119285,
 4.47213595499958,
 4.69041575982343,
 4.898979485566356,
 5.0990195135927845,
 5.291502622129181,
 5.477225575051661,
 5.656854249492381,
 5.830951894845301,
 6.0]

## <font color=red>ЗАДАНИЕ</font>

1. Преобразуйте этот код в формирование словаря, в котором число - ключ, а корень из него - значение

In [5]:
## Ваш код
{i : i**2 for i in range(37)}

{0: 0,
 1: 1,
 2: 4,
 3: 9,
 4: 16,
 5: 25,
 6: 36,
 7: 49,
 8: 64,
 9: 81,
 10: 100,
 11: 121,
 12: 144,
 13: 169,
 14: 196,
 15: 225,
 16: 256,
 17: 289,
 18: 324,
 19: 361,
 20: 400,
 21: 441,
 22: 484,
 23: 529,
 24: 576,
 25: 625,
 26: 676,
 27: 729,
 28: 784,
 29: 841,
 30: 900,
 31: 961,
 32: 1024,
 33: 1089,
 34: 1156,
 35: 1225,
 36: 1296}

2. Преобразуйте этот код в формирование генератора и пройтиде по нему с помощью цикла for

In [6]:
## Ваш код
def sqrt_gen(n):
    for i in range(n):
        yield i, i**2

for i, j in sqrt_gen(37):
    print(i, j)

0 0
1 1
2 4
3 9
4 16
5 25
6 36
7 49
8 64
9 81
10 100
11 121
12 144
13 169
14 196
15 225
16 256
17 289
18 324
19 361
20 400
21 441
22 484
23 529
24 576
25 625
26 676
27 729
28 784
29 841
30 900
31 961
32 1024
33 1089
34 1156
35 1225
36 1296


### Функции для работы с итерируемыми

```python
    map()
    filter()
    reduce()
```

__map__ - выполняет функцию над всеми элементами итерируемого

In [None]:
squared =  map(lambda x: x**2, [1,2,3])
squared

<map at 0x7f8745c20320>

In [None]:
type(squared)

map

In [None]:
x = (i for i in range(10))
type(x)

generator

In [None]:
isinstance(squared, map)

True

__<font color=blue>??</font>__ Какой тип возвращает __map__? Почему?

## <font color=red>ЗАДАНИЕ</font>

Найдите длину самой длинной строки в списке с помощью __map__

In [7]:
l = ['abc', 'xyz', 'ab', 'qwer', 'trench', 'm', '17', 'www.mai.ru', 'd', 'plot']

In [9]:
# Ваш код
max(map(lambda x: len(x), l))

10

__filter__ - возвращает те значения из итерируемого, для которых верна функция

In [None]:
even = list(filter(lambda x:x % 2 == 0, range(20)))
even

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

## <font color=red>ЗАДАНИЕ</font>

Найдите все строки, в которых присутствует буква __'a'__

In [11]:
# Ваш код
list(filter(lambda x: 'a' in x, l))

['abc', 'ab', 'www.mai.ru']

__reduce()__ - сворачивает итерируемое в одно значение<br>
В отличие от map и filter у функции 2 аргумента

In [12]:
from functools import reduce

In [13]:
values = list(range(10))
summed = reduce( lambda x,y: x+y, values)
summed

45

## <font color=red>ЗАДАНИЕ</font>

Верните самую длинную строку из списка с помощью reduce<br><br>
__<font color=green>Уложившимся в 1 строку с lambda-функцией - 1 балл</font>__

In [14]:
# Ваш код
reduce(lambda x, y: x if len(x) > len(y) else y, l)

'www.mai.ru'

### Ещё полезности из __functools__

__functools__ - работа с функциями высшего порядка, то есть функциями, которые работают с функциями
или возвращают другие функции

In [None]:
from functools import partial

In [None]:
def f(a, b, c):
    return a + b + c

f(1, 2, 3)

6

In [None]:
part_f = partial(f, 100)
part_f(4, 5)

109

In [None]:
part_f = partial(f, b=10)
part_f(a=4, c=5)

19

## <font color=red>ДОМАШНЕЕ ЗАДАНИЕ</font>

Сделайте класс бинарного дерева, который наполняется строками. <br>
Все функции добавления, поиска, удаления, длины должны быть рекурсивными<br><br>
<font color=red>__deadline - 18:00 27.09__</font>

In [41]:
from difflib import ndiff


class Node:
    def __init__(self, key):
        self.key = key
        self.left = None
        self.right = None

class StrBinTree:
    '''
    Класс бинарного дерева с функциями поиска и выдачи расстояния до ближайшей сохраненной строки:
     '''
    def __init__(self):
        self.root = None
        self.size = 0
    
    def add(self, s):
        '''
        добавляет строку в дерево
        '''
        if self.root is None:
            self.root = Node(s)
        else:
            self.root = self._insert(self.root, s)
        self.size += 1
    
    # Каков смысл этой функции?
    def __add__(self, s):
        '''
        переопределение операции сложения
        '''
        add(self, s)
    
    def isin(self, s):
        '''
        возвращает True, если есть точно такая же строка, или False, если её нет
        '''
        return self._search(self.root, s)
        
    def remove(self, s):
        '''
        удаляет строку. Удаление производится только в случае точного совпадения
        строки с указанной. Возвращает 0, если удаление выполнено, и 1 в остальных случаях
        '''
        if not self.isin(s):
            return 1
        self.root = self._remove(self.root, s)
        self.size -= 1
        return 0
        
    def get(self, s):
        '''
        возвращает ближайшую с лексической точки зрения строку и расстояние строки-аргумента
        до нее
        '''
        neighbor = None
        nearest = self._nearest_node(self.root, s, neighbor).key
        return nearest, self._dist(s, nearest)

    def __len__(self):
        '''
        возвращает количество строк в дереве
        '''
        return self.size
    
    def to_list(self):
        '''
        возвращает все строки в виде упорядоченного списка
        '''
        all_nodes = []
        self._inorder(self.root, all_nodes)
        return all_nodes

    def _insert(self, node, key):
        if node is None:
            return Node(key)
        elif node.key <= key:
            node.right = self._insert(node.right, key)
        else:
            node.left = self._insert(node.left, key)
        return node

    def _search(self, node, key):
        if node is None:
            return False
        elif node.key < key:
            return self._search(node.right, key)
        elif node.key > key:
            return self._search(node.left, key)
        return True

    def _find_predecessor(self, node):
        while node.left is not None:
            node = node.left
        return node

    def _remove(self, node, key):
        if node is None:
            return None
        elif node.key < key:
            node.right = self._remove(node.right, key)
        elif node.key > key:
            node.left = self._remove(node.left, key)
        else:
            if node.left and node.right:
                pred = self._find_predecessor(node.right)
                node.key = pred.key
                node.right = self._remove(node.right, pred.key)
            elif node.left:
                node.key = node.left.key
                node.right = node.left.right
                node.left = node.left.left
            elif node.right:
                node.key = node.right.key
                node.left = node.right.left
                node.right = node.right.right
            else:
                del node
                return None
            return node

    def _inorder(self, node, lst):
        if node is None:
            return None
        self._inorder(node.left, lst)
        lst.append(node.key)
        self._inorder(node.right, lst)

    def _dist(self, key1, key2):
        return sum([1 for diff in ndiff(key1, key2) if '+' in diff or '-' in diff])

    def _nearest_node(self, node, key, neighbor):
        if node is None:
          return neighbor

        if node.key == key:
            return node

        if neighbor is None or self._dist(node.key, key) < self._dist(neighbor.key, key):
            neighbor = node

        if key < node.key:
            return self._nearest_node(node.left, key, neighbor)
        else:
            return self._nearest_node(node.right, key, neighbor)

In [32]:
import random
import string


def random_strings(n=1000):
    letters = string.ascii_lowercase
    res = []
    for _ in range(n):
        str_len = random.randint(3, 8)
        res.append(''.join(random.choice(letters) for _ in range(str_len)))
    return res

In [44]:
bst = StrBinTree()
keys = random_strings()
for i in keys:
    bst.add(i)

In [45]:
word, dist = bst.get('kek')
print(word, dist)
print(bst.isin(word))
bst.remove(word)
print(bst.isin(word))

kec 2
True
False


In [16]:
help( StrBinTree)

Help on class StrBinTree in module __main__:

class StrBinTree(builtins.object)
 |  Класс бинарного дерева с функциями поиска и выдачи расстояния до ближайшей сохраненной строки:
 |  
 |  Methods defined here:
 |  
 |  __add__(self, s)
 |      переопределение операции сложения
 |  
 |  __init__(self)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __len__(self)
 |      возвращает количество строк в дереве
 |  
 |  add(self, s)
 |      добавляет строку в дерево
 |  
 |  get(self, s)
 |      возвращает ближайшую с лексической точки зрения строку и расстояние строки-аргумента
 |      до нее
 |  
 |  isin(self, s)
 |      возвращает True, если есть точно такая же строка, или False, если её нет
 |  
 |  remove(self, s)
 |      удаляет строку. Удаление производится только в случае точного совпадения
 |      строки с указанной. Возвращает 0, если удаление выполнено, и 1 в остальных случаях
 |  
 |  to_list(self)
 |      возвращает все строки в виде упорядоченно

ДЗ посылать по адресу __mai-ml AT mail.ru__

## Экзаменационные вопросы:

* Объектно-оринетированное программирование. Основные положения
* Классы и объекты в Python
* Функциональное программирование. Основные положения
* Функциональное программирование в Python
* Генераторы списков, словарей и просто генераторы
* Функции отображения: map, filter, reduce

### К следующему занятию п(р)очитать:


* что такое объектно ориентированное програмирование
* что такое функциональное программирование