# Технические средства анализа данных

## Управление порядком исполнения (control flow)

### Обработка исключений

In [1]:
# Еще один генератор - с обработкой исключения

def datagen(max_value = 121):
    a = [i for i in range(max_value)]
    idx = 0
    while True:
        value = None
        try:
            value = a[idx]
        except:
            raise StopIteration("there are no more values in me")
        yield value
        idx = idx + 1

In [10]:
gen2 = datagen(5)
i2 = 0
while True:
    try:
        i2 = i2+1
        new_value = next(gen2)
        print(new_value)
    except:
        print("generator raised an exception. breaking the execution.")
        break

0
1
2
3
4
generator raised an exception. breaking the execution.


In [11]:
i2

6

In [12]:
dir(gen2)

['__class__',
 '__del__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__name__',
 '__ne__',
 '__new__',
 '__next__',
 '__qualname__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'close',
 'gi_code',
 'gi_frame',
 'gi_running',
 'gi_yieldfrom',
 'send',
 'throw']

### map, lambda-функции и list comprehensions

#### list comprehensions - вычисления на списках

In [16]:
def square(x):
    return x*x

In [20]:
[square(x) for x in range(1,5)]

[1, 4, 9, 16]

In [23]:
import math

In [25]:
[d+p for (d,p) in zip([2,4,8,16,32,64,128], [1,1/2,1/3,1/4,1/5,1/6,1/7])]

[3, 4.5, 8.333333333333334, 16.25, 32.2, 64.16666666666667, 128.14285714285714]

In [31]:
def sqr(x):
    v = x**2
    return v

In [35]:
a = range(10)

#### map - применение функции ко всем элементам перечислимого аргумента

In [33]:
map(sqr, a)

<map at 0x7fc7e8bcf0b8>

In [34]:
[d for d in map(sqr, a)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

#### lambda-функции

In [36]:
[d for d in map(lambda x: x**2, a)]

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]

In [37]:
import numpy as np

In [39]:
dot = lambda x,theta: sum([x[i]*theta[i] for i in range(len(x))])

In [40]:
type(dot)

function

In [42]:
x = np.array([[1., 22.],[1., 25.],[1., 34.]])
x

array([[ 1., 22.],
       [ 1., 25.],
       [ 1., 34.]])

In [43]:
x.shape

(3, 2)

In [44]:
theta = np.array([[3.],[28.]])

In [46]:
theta

array([[ 3.],
       [28.]])

In [45]:
theta.shape

(2, 1)

In [47]:
[dot(x[i], np.squeeze(theta)) for i in range(x.shape[0])]

[619.0, 703.0, 955.0]

## Классы

**Класс** (**class**) - шаблон для экземпляров (**instances**) объектов.

Класс задает поведение экземпляров с помощью **методов**.

Методы экземпляров (или просто методы объекта, methods) - действия, которые описаны для объектов.

Методы класса (class methods) - действия, которые описаны для класса, безотносительно конкретного объекта этого класса.

In [48]:
import numbers

In [75]:
class ObjectsOfSomeKind:
    def __init__(self, name, arg2, arg3):
        assert isinstance(name, str), "name should be of string type"
        assert isinstance(arg2, numbers.Number), "arg2 should be of numeric type"
        assert isinstance(arg3, numbers.Number), "arg3 should be of numeric type"
        
        self.my_name = name
        if name == 'Albert':
            self.var2 = arg2+arg3
    
    def do_something(this, arg147, arg122):
        assert isinstance(arg147, numbers.Number), "arg147 should be of numeric type"
        assert isinstance(arg122, numbers.Number), "arg122 should be of numeric type"
        
        this.var2 = this.var2 + (arg147+arg122)
        return True

In [78]:
obj1 = ObjectsOfSomeKind("Albert", 42.4, 456)

In [79]:
obj2 = ObjectsOfSomeKind("Уштыеушт", 37, 0)

In [64]:
print(obj1.var2)
print(obj2.var2)

498.4
37


In [80]:
obj1.var2

498.4

In [81]:
obj2.var2

AttributeError: 'ObjectsOfSomeKind' object has no attribute 'var2'

In [82]:
obj2.do_something(32, 47)

AttributeError: 'ObjectsOfSomeKind' object has no attribute 'var2'

In [83]:
ObjectsOfSomeKind.do_something(obj1, 32, 47)

True

In [84]:
obj1.do_something(32, 47)

True

In [65]:
obj1.my_name

'Albert'

Следующая строка выполнится с ошибкой, потому что при выполнении метода `do_something` не пройдет проверку первое условие

In [66]:
obj1.do_something('45.34', 3.14)

AssertionError: arg147 should be of numeric type

А вот в таком вариенте метод выполнится без ошибок: обе проверки в методе `do_something` пройдут без ошибок, и без ошибок будут выполнены остальные действия, описанные в методе

In [67]:
obj1.do_something(45.34, 3.14)

True

Обратите внимание на то, что значения атрибутов в объекте `obj2` не изменились. Потому что метод `do_something` был вызван только для экземпляра `obj1`, но не для `obj2`.

In [68]:
print(obj1.var2)
print(obj2.var2)

48.480000000000004
37


In [85]:
obj1.do_something(arg122 = 45.34, arg147 = 3.14)

True

In [86]:
obj1.var2

704.88

In [87]:
class Aggregator:
    def __init__(self, name, arg1):
        assert isinstance(name, str), "name should be of string type"
        assert isinstance(arg1, numbers.Number), "arg1 should be of numeric type"
        
        self.my_name = name
        self.my_value = arg1
    
    def add(self, value_to_add):
        assert isinstance(value_to_add, numbers.Number), "value_to_add should be of numeric type"
        
        self.my_value = self.my_value + value_to_add
        return self.my_value

In [88]:
agg1 = Aggregator('Mister Bean', 0.0)

In [89]:
agg1.my_value

0.0

In [90]:
for i in range(100):
    _ = agg1.add(i)

In [91]:
agg1.my_value

4950.0

### Наследование (inheritance)

Класс может быть описан как наследник другого класса - "родителя". Тогда говорят о наследовании класса от родителя.

В этом случае его поведение по умолчанию определяется описанием (методами), заданном в родительском классе. В классе-наследнике можно определить новое поведение двумя способами:

- Описанием нового метода
- Переопределением методов родителя (override)

In [93]:
class AverageAggregator(Aggregator):
    def __init__(self, name, arg1):
        super(AverageAggregator, self).__init__(name, arg1)
        self.counter = 0
    
    def add(self, value_to_add):
        assert isinstance(value_to_add, numbers.Number), "value_to_add should be of numeric type"
        
        self.my_value += value_to_add
        self.counter += 1
        return self.my_value/self.counter
    
    def average_value(self):
        v1 = self.my_value/self.counter
        return v1

In [94]:
agg2 = AverageAggregator('agg2', 0.0)

In [95]:
agg2.my_value

0.0

In [96]:
for i in range(100):
    agg2.add(i)

In [97]:
agg2.counter

100

In [98]:
agg2.my_value

4950.0

In [99]:
agg2.average_value()

49.5