<center>

# Курс "Основы Python для анализа данных"

## Артамонов Игорь Михайлович
## Факультет "Прикладная математика" МАИ

### Занятие № 3.  Объектно ориентированное и функциональное программирование

</center>


## Общение / вопросы по курсу

Платформа для групповой работы Atlassian Confluence факультета "Прикладная математика"

https://mai.moscow/display/PYTML

* <b>Занятие 3. Объектно ориентированное и функциональное программирование</b>
       * Объектно ориентированное программирование
           * Общие понятия
           * ООП в Python
       * Функциональное программирование
           * Общие понятия
           * ФП в Python

## virtualenv + Jupyter notebook

```
<Ctrl> + <Alt> + T - новое окно терминала
```

```
$ conda -V

$ conda update conda

$ conda search "^python$"

$ conda create -n yourenvname python=x.x anaconda

$ source activate yourenvname

$ jupyter notebook

$ conda install -n yourenvname [package]
```

# Общее

* Python позволяет писать в рамках большинства подходов к программированию. Часто говорят, что он поддерживает несколько __парадигм__ программирования:
    - императивное
    - структурное
    - объектно-ориентированное
    - функциональное
* При наличии дополнительных пакетов (Kanren + SymPy) поддерживает даже логическое программирование
* Такие языки называют многопарадигменными (_multi-paradigm programming language_)

### Когда недостаточно императивного программирования:

* много (в том числе - очень) кода
* можно выделить структуру задачи через функции или объекты
* использование внешних библиотек, использующих определенный подход (например, почти все интерфейсные
  библиотеки используют объектно-ориентированный подход
* рефакторинг кода для улучшения его структуры
* хорошее понимание одной из парадигм и умение "раскладывать" в неё задачи

## <font color=blue>ВАЖНО!</font>

* наличие инструментов и использование парадигмы - это __разные__ вещи
* правильное понимание и использование парадигмы часто __важнее__, чем наличие инструментов
* многие инструменты могут успешно использоваться __вне__ "чистого" объектно-ориентированного или функционального кода

In [2]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import scipy as sc
%matplotlib inline

# Объектно-ориентированное программирование

## Основные принципы

* способ __структурирования__ программы
* поведение и свойства (чего-то) помещены в индивидуальные __объекты__
* объект является представителем __класса__

__Класс__ - определяет поведение __группы объектов__

__Объект__ (__пример__ класса) - содержит реальные значения, относящиеся непосредственно к нему

```python
class my_class(superclass(es)):
    
    def __init__(self):
        my_list = []
        my_dict = {1:1}
        n = 0
        pass
    
    def method1(self, *args):
        pass
    
    def method2(self, *args)
        return x
    
    def __len__(self):
        return n
```

self - обращение к переменной объекта
var != self.var

In [2]:
class Gender:
    def __init__(self, gender):
        self.gender = gender

    def __str__(self):
        return self.gender
    
    def get():
        return self.gender
    
    def set(gender):
        self.gender = gender


In [3]:
class Human:
    
    population = 0
    
    def __init__(self, name, age, gender):
        self.name = name
        self.age = age
        self.gender = gender
        Human.population += 1
    
    def __str__(self):
        return 'Имя: {}, возраст: {}, пол: {}'.format(self.name, self.age, self.gender)
    
    def get_name(self):
        return self.name
3
    @classmethod
    def how_many(cls):
        return  Human.population


In [4]:
Human.how_many()

0

In [5]:
vasya = Human('Вася', 30, Gender('М'))
print(type(vasya), vasya)

<class '__main__.Human'> Имя: Вася, возраст: 30, пол: М


In [6]:
Human('Петя', 32, Gender('М'))

<__main__.Human at 0x7f8745ef4278>

In [7]:
class Man(Human):
    def __init__(self, name, age, gender):
        Human.__init__(self, name, age, Gender('M'))
    
    def get_name(self):
        return 'Меня зовут ' + Human.get_name(self)

In [8]:
print(Human.how_many())

2


In [9]:
vasya = Man('Вася', 30, Gender('М'))

In [10]:
print(vasya)

Имя: Вася, возраст: 30, пол: M


In [11]:
print(vasya), type(vasya)

Имя: Вася, возраст: 30, пол: M


(None, __main__.Man)

In [12]:
isinstance(vasya, object)

True

In [13]:
isinstance(vasya, Man)

True

In [14]:
isinstance(vasya, list)

False

In [15]:
isinstance([1,2,3], list)

True

## <font color=red>ЗАДАНИЕ</font>

Реализуйте класс клеток (cell) со следующими функциями:<br>
* при создании у клетки задается имя (строка)
* hello - клетка печатает "Клетка:" плюс свое имя
* die - клетка погибает
* divide - возвращяет tuple из двух новых клеток, к имени старой клетки добавлются 0 и 1
    старая клетка погибает
* Надо сохранять количество клеток в переменной класса

In [77]:
class cell:
    total_count = 0
    
    def __init__(self, name):
        self.alive = True
        self.name = name
        
        cell.total_count += 1
        
    def hello(self):
        if self.alive:
            print("Cell: {}".format(self.name))
        else:
            print("Cell is dead")
    
    def die(self):
        if self.alive:
            cell.total_count -= 1
            self.alive = False
    
    def divide(self):
        res = None
        
        if self.alive:
            res = (cell(self.name + "0"), cell(self.name + "1"))
        
        return res

cells = [cell("1")]
cells = cells + list(cells[0].divide())

for c in cells:
    c.hello()

print(cell.total_count)

cells[0].die()
cells[0].hello()

print(cell.total_count)

Cell: 1
Cell: 10
Cell: 11
3
Cell is dead
2


#### Чего в Python нет:
    * Перегрузки функций

#### Что есть:
    * Перегрузка операторов
        * Арифметических
        * Сравнения
        * Как бинарных (+,-), так и унарных (-)
    * Определение "стандартных" функций (len, str)

In [78]:
class MyVector: 
    def __init__(self, a, b): 
        self.a = a 
        self.b = b 
    
    def __len__(self):
        return math.sqrt(self.a**2 + self.b**2)

    # adding two objects  
    def __add__(self, other): 
        return MyVector(self.a + other.a, self.b + other.b )
  
    def __neg__(self): 
        return MyVector(-self.a, -self.b)
  
    def __str__(self): 
        return f"({self.a}, {self.b})"
    
    def __lt__(self, other): 
        return self.__len__() < other.__len__()
        
    def __eq__(self, other):
        return self.a == other.a and self.b == other.b


In [79]:
a = MyVector(2,3)
b = MyVector(2,3)
c = MyVector(3,5)

print(a, b, c)

(2, 3) (2, 3) (3, 5)


In [83]:
a + b

<__main__.MyVector at 0xe38250>

In [84]:
z = b + c + c

In [85]:
print(z)

(8, 13)


In [88]:
-a

<__main__.MyVector at 0xe383f0>

# Функциональное программирование

## Основные принципы

__"Чистое" функциональное программирование__<br>

* Функциональное программирование основано на испольовании функций и их композиций
* Переменные отсутствуют, только константы
* Используются только неизменяемые структуры данных
* Нет циклов, нелокальных переходов и исключений
* Нет побочных эффектов. Для операций с побочными эффектами используются монады

В начале оно кажется очень сложным и непонятным ...

### Чистота функций
* функция возвращает одинаковый результат при одинаковых значениях аргументов
* у функции отсутствуют побочные эффекты -> не зависит от контекста


In [14]:
def pure_func(x):
    return 2 * 3.1415926 * x 

y = 2
 
def impure_func(x):
    y = y + 2 * 3.1415926 * x
    return y

### Следствия
* могут выполняться (оцениваться) в любом порядке
* удобны для параллельного выполнения<br>

### Вызов чистой функции всегда может быть заменен на результат (ссылочная прозрачность)
* проще  тестирование (функция "изолирована")
* читаемость (не надо анализировать другие функции)
* возможность анализа и валидации кода

### Первоклассные функции

* Функции имеют те же свойства, что и остальные значения
* Им пожно присвоить имя или присвоить их объекту
* Их можно передать, как аргумент функции
* Их можно возвращать

## <font color=red>ЗАДАНИЕ</font>

Реализуйте класс, принимающий имя функции в виде строки и функцию, связанную с этой строкой. <br>
При выполнении метода __execute__ с кодом и переменной или значением выполняет функцию, связанную с кодом.<br>
Если кода нет, то методы генерирует прерывание __KeyError__

In [117]:
class FDict():
    def __init__(self):
        self.functions = dict()

    # добавляет функцию с кодом
    def add(self, code, func):
        self.functions[code] = func
    
    # удаляет функцию по коду
    def remove(self, code):
        self.functions.pop(code, None)

    # выполняет функцию с аргументом
    def execute(self, code, arg):          
        return self.get_func(code)(arg)
    
    # возвращает функцию по коду
    def get_func(self, code):
        fun = self.functions.get(code, None)
        
        if fun == None:
            raise KeyError("No code found in dict") 
        
        return fun
    
    # получает 2*N аргументов (код, значение, код, значение ..) и возвращает кортеж из значений
    def execute_many(self, *args):
        return tuple([self.execute(args[2 * i], args[2 * i + 1]) for i in range(0, len(args) // 2)])

Проверьте функционирование Вашего кода. Проверьте работу с отсутствующим кодом и добавьте обработку исключения.

In [126]:
import math
from math import sin, cos

x = math.pi / 3

func_dict = FDict()
func_dict.add('sin', math.sin)
func_dict.add('cos', math.cos)

y1 = func_dict.execute('sin', x)
y2 = func_dict.execute('cos', x)

print("1. sin({0:.4f})={1:.4f}, cos({0:.4f})={2:.4f}".format(x, y1, y2))

y1, y2 = func_dict.execute_many('sin', x*2, 'cos', x*3)
print("2. sin({0:4f})={1:4f}, cos({0:4f})={2:4f}".format(x, y1, y2))


try:
    code = 'tan'
    y3 = func_dict.execute(code, x)
except KeyError:
    print("Exception found: func_dict doesn't contain \"{}\" code".format(code))

1. sin(1.0472)=0.8660, cos(1.0472)=0.5000
2. sin(1.047198)=0.866025, cos(1.047198)=-1.000000
Exception found: func_dict doesn't contain "tan" code


### Лямбда-функции (анонимные функции)

In [17]:
f = lambda x, y: sin(x**2) + cos(y**2)

def func(x,y):
    return sin(x**2) + cos(y**2)

f(math.pi/2, math.pi/2)

-0.15694593947078894

## <font color=green>ВСПОМИНАЕМ</font> генераторы списков, словарей и просто генераторы

In [127]:
import math

even_square_roots = [(lambda x: math.sqrt(x))(x) for x in range(37) if x % 2 == 0]
even_square_roots


[0.0,
 1.4142135623730951,
 2.0,
 2.449489742783178,
 2.8284271247461903,
 3.1622776601683795,
 3.4641016151377544,
 3.7416573867739413,
 4.0,
 4.242640687119285,
 4.47213595499958,
 4.69041575982343,
 4.898979485566356,
 5.0990195135927845,
 5.291502622129181,
 5.477225575051661,
 5.656854249492381,
 5.830951894845301,
 6.0]

## <font color=red>ЗАДАНИЕ</font>

1. Преобразуйте этот код в формирование словаря, в котором число - ключ, а корень из него - значение

In [128]:
## Ваш код
even_square_roots = {x: (lambda x: math.sqrt(x))(x) for x in range(37) if x % 2 == 0}
even_square_roots

{0: 0.0,
 2: 1.4142135623730951,
 4: 2.0,
 6: 2.449489742783178,
 8: 2.8284271247461903,
 10: 3.1622776601683795,
 12: 3.4641016151377544,
 14: 3.7416573867739413,
 16: 4.0,
 18: 4.242640687119285,
 20: 4.47213595499958,
 22: 4.69041575982343,
 24: 4.898979485566356,
 26: 5.0990195135927845,
 28: 5.291502622129181,
 30: 5.477225575051661,
 32: 5.656854249492381,
 34: 5.830951894845301,
 36: 6.0}

2. Преобразуйте этот код в формирование генератора и пройтиде по нему с помощью цикла for

In [130]:
## Ваш код
even_square_roots = ((lambda x: math.sqrt(x))(x) for x in range(37) if x % 2 == 0)

for val in even_square_roots:
    print(val)

0.0
1.4142135623730951
2.0
2.449489742783178
2.8284271247461903
3.1622776601683795
3.4641016151377544
3.7416573867739413
4.0
4.242640687119285
4.47213595499958
4.69041575982343
4.898979485566356
5.0990195135927845
5.291502622129181
5.477225575051661
5.656854249492381
5.830951894845301
6.0


### Функции для работы с итерируемыми

```python
    map()
    filter()
    reduce()
```

__map__ - выполняет функцию над всеми элементами итерируемого

In [133]:
squared =  map(lambda x: x**2, [1,2,3])
squared

<map at 0xe5dff0>

In [40]:
type(squared)

map

In [41]:
x = (i for i in range(10))
type(x)

generator

In [140]:
isinstance(squared, map)

True

__<font color=blue>??</font>__ Какой тип возвращает __map__? Почему?

## <font color=red>ЗАДАНИЕ</font>

Найдите длину самой длинной строки в списке с помощью __map__

In [143]:
l = ['abc', 'xyz', 'ab', 'qwer', 'trench', 'm', '17', 'www.mai.ru', 'd', 'plot']

In [147]:
print(max(map(len, l)))

10


__filter__ - возвращает те значения из итерируемого, для которых верна функция

In [44]:
even = list(filter(lambda x:x % 2 == 0, range(20)))
even

[0, 2, 4, 6, 8, 10, 12, 14, 16, 18]

## <font color=red>ЗАДАНИЕ</font>

Найдите все строки, в которых присутствует буква __'a'__

In [148]:
# Ваш код
list(filter(lambda x: 'a' in x, l))

['abc', 'ab', 'www.mai.ru']

__reduce()__ - сворачивает итерируемое в одно значение<br>
В отличие от map и filter у функции 2 аргумента

In [149]:
from functools import reduce

In [150]:
values = list(range(10))
summed = reduce( lambda x,y: x+y, values)
summed

45

## <font color=red>ЗАДАНИЕ</font>

Верните самую длинную строку из списка с помощью reduce<br><br>
__<font color=green>Уложившимся в 1 строку с lambda-функцией - 1 балл</font>__

In [420]:
max_len = reduce(max, map(len, l))
print(max_len)

10


### Ещё полезности из __functools__

__functools__ - работа с функциями высшего порядка, то есть функциями, которые работают с функциями
или возвращают другие функции

In [46]:
from functools import partial

In [47]:
def f(a, b, c):
    return a + b + c

f(1, 2, 3)

6

In [48]:
part_f = partial(f, 100)
part_f(4, 5)

109

In [51]:
part_f = partial(f, b=10)
part_f(a=4, c=5)

19

## <font color=red>ДОМАШНЕЕ ЗАДАНИЕ</font>

Сделайте класс бинарного дерева, который наполняется строками. <br>
Все функции добавления, поиска, удаления, длины должны быть рекурсивными<br><br>
<font color=red>__deadline - 18:00 27.09__</font>

In [421]:
def levenshtein_distance(a, b):
    n, m = len(a), len(b)
    if n > m:
        a, b = b, a
        n, m = m, n

    current_row = range(n + 1)
    for i in range(1, m + 1):
        previous_row, current_row = current_row, [i] + [0] * n
        for j in range(1, n + 1):
            add, delete, change = previous_row[j] + 1, current_row[j - 1] + 1, previous_row[j - 1]
            if a[j - 1] != b[i - 1]:
                change += 1
            current_row[j] = min(add, delete, change)

    return current_row[n]

class StrBinNode:
    '''
    Класс вершины бинарного дерева
    '''
    def __init__(self, divisor, left, right, parent):
        self.divisor = divisor
        self.left = left
        self.right = right
        self.parent = parent
    
    def find(self, s):
        if s == self.divisor:
            return self
        elif self.left != None and s < self.divisor:
            return self.left.find(s)
        elif self.right != None and s > self.divisor:
            return self.right.find(s)
        else:
            return self
    
    def traverse(self, res):
        if self.left != None:
            self.left.traverse(res)
            
        res.append(self.divisor)
        
        if self.right != None:
            self.right.traverse(res)

class StrBinTree:
    '''
    Класс бинарного дерева с функциями поиска и выдачи расстояния до ближайшей сохраненной строки:
    '''
    def __init__(self):
        self.root = None
    
    def add(self, s):
        '''
        добавляет строку в дерево
        '''
        if self.root == None:
            self.root = StrBinNode(s, None, None, None)
            return True
        
        node = self.root.find(s)
        
        if s == node.divisor:
            return False
        elif s < node.divisor:
            node.left = StrBinNode(s, None, None, node)
        else:
            node.right = StrBinNode(s, None, None, node)
        
    
    # Каков смысл этой функции?
    def __add__(self, s):
        '''
        выполняет конкатенацию текущего дерева с новой строкой s
        '''
        self.add(s)
    
    def isin(self, str):
        '''
        возвращает True, если есть точно такая же строка, или False, если её нет
        '''
        if self.root == None:
            return False
        
        node = self.root.find(str)
        
        return node.divisor == str
        
    def remove(self, str):
        '''
        удаляет строку. Удаление производится только в случае точного совпадения
        строки с указанной. Возвращает 0, если удаление выполнено, и 1 в остальных случаях
        '''
        if self.root == None:
            return 1
        
        node = self.root.find(str)
        if node.divisor != str:
            return 1
              
        if node.left == None:
            if node.parent == None:
                node.right.parent = None
                self.root = node.right
            elif node == node.parent.left:
                node.parent.left = node.right
            else:
                node.parent.right = node.right
        elif node.right == None:
            if node.parent == None:
                node.left.parent = None
                self.root = node.left
            elif node == node.parent.left:
                node.parent.left = node.left
            else:
                node.parent.right = node.left
        else:
            curNode = node.right
            while curNode.left != None:
                curNode = curNode.left
                
            node.divisor = curNode.divisor
            
            if curNode == curNode.parent.left:
                curNode.parent.left = curNode.right
                if curNode.right != None:
                    curNode.right.parent = curNode.parent
            else:
                curNode.parent.right = curNode.right
                if curNode.left != None:
                    curNode.left.parent = curNode.parent
        return 0
        
    def get(self, str):
        '''
        возвращает ближайшую с лексической точки зрения строку и расстояние строки-аргумента
        до нее
        '''
        if self.root == None:
            return None
        
        node = self.root.find(str)
        
        return (node.divisor, levenshtein_distance(str, node.divisor))

    def __len__(self):
        '''
        возвращает количество строк в дереве
        '''
        return len(self.to_list())
    
    def to_list(self):
        '''
        возвращает все строки в виде упорядоченного списка
        '''
        res = []
        if self.root != None:
            self.root.traverse(res)
        return res

In [423]:
import string
import random

num = 1000
words = []

for _ in range(num):
    words.append("".join([random.choice(string.ascii_lowercase) for _ in range(random.randint(3, 9))]))
words = sorted(words)

tree = StrBinTree()

for word in words:
    tree.add(word)
    
print("tree size: {}".format(len(tree)))

words_list = tree.to_list()
print(words_list[:10])



word = words[0]
print("Removing {}".format(word))
print(tree.remove(word))
print(tree.to_list()[:10])

print(tree.remove("Non Existing String"))

closest_word = tree.get(words_list[0])
print("Closest string to \"{}\" is \"{}\". Levenstein distance = {}".format(word, closest_word[0], closest_word[1]))


tree size: 1000
['aaq', 'abzwrjkmn', 'acks', 'adpngunz', 'advb', 'afflm', 'afhtju', 'afqe', 'ahnpplk', 'ahs']
Removing aaq
0
['abzwrjkmn', 'acks', 'adpngunz', 'advb', 'afflm', 'afhtju', 'afqe', 'ahnpplk', 'ahs', 'aictqwryx']
1
Closest string to "aaq" is "abzwrjkmn". Levenstein distance = 8


In [422]:
help( StrBinTree)

tree size: 1000
['aaaupm', 'aanwpbdw', 'aaviam', 'abj', 'abv', 'acscr', 'acyhejj', 'adfrswzi', 'adtjg', 'ahuwgdeeq']
Removing aaaupm
0
['aanwpbdw', 'aaviam', 'abj', 'abv', 'acscr', 'acyhejj', 'adfrswzi', 'adtjg', 'ahuwgdeeq', 'ajluaga']
1
Closest string to "aaaupm" is "aanwpbdw". Levenstein distance = 5


In [46]:
help( StrBinTree)

Help on class StrBinTree in module __main__:

class StrBinTree(builtins.object)
 |  Класс бинарного дерева с функциями поиска и выдачи расстояния до ближайшей сохраненной строки:
 |  
 |  Methods defined here:
 |  
 |  __add__(self, s)
 |      ваше описание
 |  
 |  __init__(self)
 |      Initialize self.  See help(type(self)) for accurate signature.
 |  
 |  __len__(self)
 |      возвращает количество строк в дереве
 |  
 |  add(self, s)
 |      добавляет строку в дерево
 |  
 |  get(self, str)
 |      возвращает ближайшую с лексической точки зрения строку и расстояние строки-аргумента
 |      до нее
 |  
 |  isin(self, str)
 |      возвращает True, если есть точно такая же строка, или False, если её нет
 |  
 |  remove(self, str)
 |      удаляет строку. Удаление производится только в случае точного совпадения
 |      строки с указанной. Возвращает 0, если удаление выполнено, и 1 в остальных случаях
 |  
 |  to_list(self)
 |      возвращает все строки в виде упорядоченного списка
 |  

ДЗ посылать по адресу __mai-ml AT mail.ru__

## Экзаменационные вопросы:

* Объектно-оринетированное программирование. Основные положения
* Классы и объекты в Python
* Функциональное программирование. Основные положения
* Функциональное программирование в Python
* Генераторы списков, словарей и просто генераторы
* Функции отображения: map, filter, reduce

### К следующему занятию п(р)очитать:


* что такое объектно ориентированное програмирование
* что такое функциональное программирование