In [1]:
import time

In [2]:
import numpy as np
from tqdm import tqdm_notebook as tqdm

In [3]:
from SimpleExample.Python.PythonFunc import PythonFunc

In [4]:
from SimpleExample.Cython.CythonFunc import CythonFunc, CythonOpenMPFunc, CythonTypedFunc

In [5]:
from SimpleExample.Nuitka.NuitkaFuncPack.NuitkaFunc import NuitkaFunc

In [6]:
from SimpleExample.Numba.NumbaFunc import NumbaFunc

# Базовый пример

В данном пункте приведем пример простой функции на языке python. В качестве функции рассматривалась функция, которая суммирует числа от $0$ до $N$. В эксперименте сравнивается скорость работы данной функции в следующих случаях: 
* PythonFunc --- функция реализована на python без предварительной компиляции;
* NumbaFunc --- функция реализована на python с использованием Numba;
* PyPyFunc --- функция реализована на pypy;
* CythonFunc --- функция реализована на python но предварительно скомпилирована;
* CythonTypedFunc --- функция реализована на cython с типизацией объектов;
* CythonOpenMPFunc --- функция реализована на cython с типизацией объектов а также распаралеливанием на OpenMP;
* NuitkaFunc --- функция которая компилируется с помощью Nuitka

## Comparison
Для сравнения рассматривается $N = 100000000$ для всех моделей, а также каждая функция вызывается $200$ раз для усреднения результата.

In [7]:
N = 100000000
number_of_experiment = 200

### Python Func
Время работы функции для базовой реализации на python.

In [8]:
%%time
list_of_times = []
############################################

iterable = tqdm(range(number_of_experiment))
for _ in iterable:
    start = time.time()
    ret = PythonFunc(N)
    end = time.time()
    
    list_of_times.append(end-start)
    
    iterable.set_postfix_str('(time={})'.format(np.mean(list_of_times)))
    
print('(time={}±{})'.format(np.mean(list_of_times), np.std(list_of_times)))

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  after removing the cwd from sys.path.


HBox(children=(FloatProgress(value=0.0, max=200.0), HTML(value='')))


(time=4.443214026689529±0.04191041901652995)
CPU times: user 14min 49s, sys: 107 ms, total: 14min 49s
Wall time: 14min 48s


### Numba Func
Время работы функции для компиляции при помощи Numba.

In [9]:
_ = NumbaFunc(10)

The keyword argument 'parallel=True' was specified but no transformation for parallel execution was possible.

To find out why, try turning on parallel diagnostics, see http://numba.pydata.org/numba-doc/latest/user/parallel.html#diagnostics for help.

File "SimpleExample/Numba/NumbaFunc.py", line 4:
@jit(nopython=True, parallel=True)
def NumbaFunc(N):
^

  state.func_ir.loc))


In [10]:
%%time
list_of_times = []
############################################

iterable = tqdm(range(number_of_experiment))
for _ in iterable:
    start = time.time()
    ret = NumbaFunc(N)
    end = time.time()
    
    list_of_times.append(end-start)
    
    iterable.set_postfix_str('(time={})'.format(np.mean(list_of_times)))
    
print('(time={}±{})'.format(np.mean(list_of_times), np.std(list_of_times)))

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  after removing the cwd from sys.path.


HBox(children=(FloatProgress(value=0.0, max=200.0), HTML(value='')))


(time=1.794099807739258e-06±1.286121285770796e-06)
CPU times: user 109 ms, sys: 16 ms, total: 125 ms
Wall time: 111 ms


### Cython Func
Время работы функции для базовой реализации с компиляцией на cython.

In [11]:
%%time
list_of_times = []
############################################

iterable = tqdm(range(number_of_experiment))
for _ in iterable:
    start = time.time()
    ret = CythonFunc(N)
    end = time.time()
    
    list_of_times.append(end-start)
    
    iterable.set_postfix_str('(time={})'.format(np.mean(list_of_times)))
    
print('(time={}±{})'.format(np.mean(list_of_times), np.std(list_of_times)))

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  after removing the cwd from sys.path.


HBox(children=(FloatProgress(value=0.0, max=200.0), HTML(value='')))


(time=3.19112242937088±0.06787856737809259)
CPU times: user 10min 40s, sys: 853 ms, total: 10min 40s
Wall time: 10min 38s


### Cython Typed Func
Время работы функции для базовой реализации и ее типизации с компиляцией на cython.

In [12]:
%%time
list_of_times = []
############################################

iterable = tqdm(range(number_of_experiment))
for _ in iterable:
    start = time.time()
    ret = CythonTypedFunc(N)
    end = time.time()
    
    list_of_times.append(end-start)
    
    iterable.set_postfix_str('(time={})'.format(np.mean(list_of_times)))
    
print('(time={}±{})'.format(np.mean(list_of_times), np.std(list_of_times)))

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  after removing the cwd from sys.path.


HBox(children=(FloatProgress(value=0.0, max=200.0), HTML(value='')))


(time=0.031920006275177±0.0010647294523333558)
CPU times: user 6.58 s, sys: 4.02 ms, total: 6.58 s
Wall time: 6.55 s


### Cython Open MP Func
Время работы функции для базовой реализации с распаралеливанием на OpenMP компиляцией на cython.

In [13]:
%%time
list_of_times = []
############################################

iterable = tqdm(range(number_of_experiment))
for _ in iterable:
    start = time.time()
    ret = CythonOpenMPFunc(N)
    end = time.time()
    
    list_of_times.append(end-start)
    
    iterable.set_postfix_str('(time={})'.format(np.mean(list_of_times)))
    
print('(time={}±{})'.format(np.mean(list_of_times), np.std(list_of_times)))

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  after removing the cwd from sys.path.


HBox(children=(FloatProgress(value=0.0, max=200.0), HTML(value='')))


(time=0.010022884607315064±0.003041635490902328)
CPU times: user 7.63 s, sys: 28 ms, total: 7.66 s
Wall time: 2.16 s


### Nuitka Func
Время работы функции для базовой реализации с распаралеливанием на OpenMP компиляцией на cython.

In [14]:
%%time
list_of_times = []
############################################

iterable = tqdm(range(number_of_experiment))
for _ in iterable:
    start = time.time()
    ret = NuitkaFunc(N)
    end = time.time()
    
    list_of_times.append(end-start)
    
    iterable.set_postfix_str('(time={})'.format(np.mean(list_of_times)))
    
print('(time={}±{})'.format(np.mean(list_of_times), np.std(list_of_times)))

Please use `tqdm.notebook.tqdm` instead of `tqdm.tqdm_notebook`
  after removing the cwd from sys.path.


HBox(children=(FloatProgress(value=0.0, max=200.0), HTML(value='')))


(time=4.160540078878403±0.07879066212458087)
CPU times: user 13min 52s, sys: 95.7 ms, total: 13min 52s
Wall time: 13min 52s


В данном простом примере получили следующие оценки времени работы функций:

| Функция  | Время |
| ------------- | ------------- |
| PythonFunc  | 4421±42 ms  |
| NumbaFunc  | 0.002±0.001 ms  |
| CythonFunc  | 3191±69 ms  |
| CythonTypedFunc  | 31±1 ms  |
| CythonOpenMPFunc  | 10±3 ms  |
| NuitkaFunc  | 4161±79 ms  |
