In [2]:
import numpy as np
import numba
import cython

%load_ext cython

Генерируем случайную матрицу $1000 \times 1000$

In [3]:
matr = np.random.random(size=(1000, 1000))

## Чистый Python

In [4]:
def func_python(a):
    s = 0
    for y in range(1, a.shape[0]):
        for x in range(1, a.shape[1]):
            s += a[y, x] * a[y, x-1] + a[y-1, x-1] 
            
    return s

## Numba

JIT-компилятор, умеет транлировать `Python` (в основном `NumPy`-ориентированный) в машинный код для выполнения на CPU/GPU.

In [5]:

func_numba = numba.jit(func_python)

## Cython

Специализированный язык для написания нативных расширений для `Python` (`Cython` -> `C` -> `Python Module`)

In [7]:
%%cython

cimport numpy 


def func_cython(numpy.ndarray['double', ndim=2] a):
    cdef int x
    cdef int y 
    cdef double s = 0.0
    
    for y in range(1, a.shape[0]):
        for x in range(1, a.shape[1]):
            s += a[y, x] * a[y, x-1] + a[y-1, x-1]
    
    return s

## Результаты

In [10]:
%%timeit
func_python(matr)

770 ms ± 22.4 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [13]:
%%timeit
func_numba(matr)

2.96 ms ± 106 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [12]:
%%timeit
func_cython(matr)

2.75 ms ± 676 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
