# Урок 4. Эмпирическая оценка алгоритмов на Python

## Виды алгоритмов, оценка сложности, *timeit*, *profiler*

### Что такое сложность алгоритма?
**Временна'я сложность алгоритма** определяет время работы, используемое алгоритмом, как функции от длины строки, представляющей входные данные.
$$t = f(n)$$

### Классификация алгоритмов по сложности
| **Название**                          | **Обозначение** | **Пример** |
|:--------------------------------- |:-----------:| ------:|
| Постоянная сложность              | O(1)        | Определение четности числа |     
| Логарифмическая сложность         | O(log n)    | Бинарный поиск |
| Линейно-логарифмическая сложность | O(n log n)  | Быстрая сортировка Хоара (среднее время) |
| Линейная сложность                | O(n)        | Поиск наименьшего элемента в неотсортированном массиве |
| Квадратичная сложность | O(n<sup>2</sup>) | Сортировка пузырьком |
| Экспотенциальная сложность | 2<sup>O(n)</sup> | Решение задачи о рюкзаке методом прямого перебора |

### Измерения времени работы с использованием `timeit`

In [1]:
import timeit

x = 2 + 2
print(timeit.timeit('x = 2 + 2'))

0.058986199999999656


In [2]:
print(timeit.timeit('x = sum(range(10))'))

0.7475415999999999


In [3]:
%%timeit
x = sum(range(10))

718 ns ± 43.3 ns per loop (mean ± std. dev. of 7 runs, 1000000 loops each)


### Измерения времени работы с использованием `cProfile`

In [4]:
def get_len(array) -> int:
    """ Возвращает длину переданного массива """
    return len(array)


def get_sum(array) -> int:
    """ Возвращает сумму всех элементов переданного массива """
    s = 0
    for i in array:
        s += i
    return s


def main():
    lst = [i for i in range(10 * 10**6)]
    a = get_len(lst)
    b = get_sum(lst)

In [5]:
import cProfile

cProfile.run('main()')

         8 function calls in 2.570 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-4-a2e30767634c>:1(get_len)
        1    0.000    0.000    2.359    2.359 <ipython-input-4-a2e30767634c>:14(main)
        1    1.418    1.418    1.418    1.418 <ipython-input-4-a2e30767634c>:15(<listcomp>)
        1    0.940    0.940    0.940    0.940 <ipython-input-4-a2e30767634c>:6(get_sum)
        1    0.212    0.212    2.570    2.570 <string>:1(<module>)
        1    0.000    0.000    2.570    2.570 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {built-in method builtins.len}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




## Рекурсивный поиск чисел Фибоначчи

In [35]:
import pandas as pd

pd.DataFrame([[0, 1, 1, 2, 3, 5, 8, 13, 21, 34]],
             columns=[i for i in range(10)],
             index=['значение']).rename_axis('индекс', axis="columns")

индекс,0,1,2,3,4,5,6,7,8,9
значение,0,1,1,2,3,5,8,13,21,34


### Оптимизация алгоритма на примере чисел Фибоначчи

In [37]:
def test_fib(func):
    lst = [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]
    for i, item in enumerate(lst):
        assert item == func(i)
        print(f'Test {i} OK')


def fib(n):
    if n < 2:
        return n
    return fib(n - 1) + fib(n - 2)

### Практическое использование `timeit` и `cProfile`

In [54]:
for i in [10, 15, 20, 25]:
    print(f'{"-"*50}\ni={i}')
    %timeit fib(i)

--------------------------------------------------
i=10
42.3 µs ± 4.2 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=15
565 µs ± 122 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)
--------------------------------------------------
i=20
5.56 ms ± 763 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
--------------------------------------------------
i=25
56.8 ms ± 2.92 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


---

In [17]:
import cProfile

cProfile.run('fib(10)')

         180 function calls (4 primitive calls) in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
    177/1    0.000    0.000    0.000    0.000 <ipython-input-6-cffbe3c6a2ba>:8(fib)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




In [18]:
cProfile.run('fib(15)')

         1976 function calls (4 primitive calls) in 0.001 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
   1973/1    0.001    0.000    0.001    0.001 <ipython-input-6-cffbe3c6a2ba>:8(fib)
        1    0.000    0.000    0.001    0.001 <string>:1(<module>)
        1    0.000    0.000    0.001    0.001 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




In [47]:
cProfile.run('fib(20)')

         21894 function calls (4 primitive calls) in 0.018 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
  21891/1    0.017    0.000    0.017    0.017 <ipython-input-37-beb93b87c3b2>:8(fib)
        1    0.000    0.000    0.017    0.017 <string>:1(<module>)
        1    0.000    0.000    0.018    0.018 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




## Поиск чисел Фибоначчи с сохранением в `list` и `dict`
**Мемоизация** - сохранение результатов выполнения функции для предотвращения повторных вычислений

### Продолжение. Оптимизация алгоритма на примере чисел Фибоначчи

### Использование технологии мемоизации (memoization)

In [48]:
def fib_dict(n):
    fib_d = {0: 0, 1: 1}

    def _fib_dict(n):
        if n in fib_d:  # проверка, вычисляли ли мы уже число или нет
            return fib_d[n]
        else:
            fib_d[n] = _fib_dict(n - 1) + _fib_dict(n - 2)
        return fib_d[n]

    return _fib_dict(n)

In [56]:
def fib_list(n):
    fib_l = [None] * 1000
    fib_l[:2] = [0, 1]

    def _fib_list(n):
        if fib_l[n] is None:  # проверка, вычисляли ли мы уже число или нет
            fib_l[n] = _fib_list(n - 1) + _fib_list(n - 2)
        return fib_l[n]

    return _fib_list(n)

### Практическое использование `timeit` и `cProfile`

In [53]:
for i in [10, 15, 100, 200, 500]:
    print(f'{"-"*50}\ni={i}')
    %timeit fib_dict(i)

--------------------------------------------------
i=10
7.98 µs ± 460 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
--------------------------------------------------
i=15
13.1 µs ± 923 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
--------------------------------------------------
i=100
79 µs ± 4.35 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=200
153 µs ± 2.25 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=500
426 µs ± 8.08 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


---

In [57]:
for i in [10, 200, 100, 500]:
    print(f'{"-"*50}\ni={i}')
    cProfile.run(f'fib_dict({i})')

--------------------------------------------------
i=10
         23 function calls (5 primitive calls) in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-48-9776d1c8832d>:1(fib_dict)
     19/1    0.000    0.000    0.000    0.000 <ipython-input-48-9776d1c8832d>:4(_fib_dict)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}


--------------------------------------------------
i=200
         403 function calls (5 primitive calls) in 0.001 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.001    0.001 <ipython-input-48-9776d1c8832d>:1(fib_dict)
    399/1    0.001    0.000    0.001   

In [58]:
for i in [10, 15, 100, 200, 500]:
    print(f'{"-"*50}\ni={i}')
    %timeit fib_list(i)

--------------------------------------------------
i=10
17.9 µs ± 2.32 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=15
19.2 µs ± 1.27 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=100
78.2 µs ± 3.07 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=200
153 µs ± 10.5 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=500
418 µs ± 18.7 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [59]:
for i in [10, 20, 100, 500]:
    print(f'fib_list({i}){"-"*50}')
    cProfile.run(f'fib_list({i})')

fib_list(10)--------------------------------------------------
         23 function calls (5 primitive calls) in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-56-622a85d2621b>:1(fib_list)
     19/1    0.000    0.000    0.000    0.000 <ipython-input-56-622a85d2621b>:5(_fib_list)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}


fib_list(20)--------------------------------------------------
         43 function calls (5 primitive calls) in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-56-622a85d2621b>:1(fib_list)
     39/1    0.000    0.000

## Нерекурсивный поиск чисел Фибоначчи. `lru.cashe()`

In [60]:
def fib_loop(n):
    if n < 2:
        return n
    
    first, second = 0, 1
    
    for i in range(2, n + 1):
        first, second = second, first + second
    return second

In [63]:
for i in [10, 100, 500, 200, 50000]:
    print(f'{"-"*50}\ni={i}')
    %timeit fib_loop(i)

--------------------------------------------------
i=10
1.63 µs ± 212 ns per loop (mean ± std. dev. of 7 runs, 100000 loops each)
--------------------------------------------------
i=100
12.7 µs ± 1.51 µs per loop (mean ± std. dev. of 7 runs, 100000 loops each)
--------------------------------------------------
i=500
71.5 µs ± 3.44 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=200
24.3 µs ± 3.27 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)
--------------------------------------------------
i=50000
44.8 ms ± 2.37 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


In [64]:
for i in [10, 1000]:
    print(f'fib_list({i}){"-"*50}')
    cProfile.run(f'fib_loop({i})')

fib_list(10)--------------------------------------------------
         4 function calls in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-60-f3f808464db0>:1(fib_loop)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}


fib_list(1000)--------------------------------------------------
         4 function calls in 0.000 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
        1    0.000    0.000    0.000    0.000 <ipython-input-60-f3f808464db0>:1(fib_loop)
        1    0.000    0.000    0.000    0.000 <string>:1(<module>)
        1    0.000    0.000    0.000    0.000 {built-in method builtins.exec}
        1    

In [70]:
# task_3
import cProfile
import functools


def test_fib(func):
    lst = [0, 1, 1, 2, 3, 5, 8, 13, 21, 34]
    for i, item in enumerate(lst):
        assert item == func(i)
        print(f'Test {i} OK')

@functools.lru_cache( )
def fib(n):
    if n < 2:
        return n
    return fib(n - 1) + fib(n - 2)

In [68]:
# "task_3.fib(10)"
# 1000 loops, best of 5: 134 nsec per loop

# "task_3.fib(100)"
# 1000 loops, best of 5: 225 nsec per loop

In [71]:
cProfile.run('fib(10)')

         14 function calls (4 primitive calls) in 0.001 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
     11/1    0.001    0.000    0.001    0.001 <ipython-input-70-47b31d69d2ae>:12(fib)
        1    0.000    0.000    0.001    0.001 <string>:1(<module>)
        1    0.000    0.000    0.001    0.001 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




In [72]:
cProfile.run('fib(100)')

         93 function calls (4 primitive calls) in 0.006 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
     90/1    0.006    0.000    0.006    0.006 <ipython-input-70-47b31d69d2ae>:12(fib)
        1    0.000    0.000    0.006    0.006 <string>:1(<module>)
        1    0.000    0.000    0.006    0.006 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}




In [73]:
cProfile.run('fib(200)')

         103 function calls (4 primitive calls) in 0.004 seconds

   Ordered by: standard name

   ncalls  tottime  percall  cumtime  percall filename:lineno(function)
    100/1    0.004    0.000    0.004    0.004 <ipython-input-70-47b31d69d2ae>:12(fib)
        1    0.000    0.000    0.004    0.004 <string>:1(<module>)
        1    0.000    0.000    0.004    0.004 {built-in method builtins.exec}
        1    0.000    0.000    0.000    0.000 {method 'disable' of '_lsprof.Profiler' objects}


