In [1]:
import numpy as np
import numba
import cython

%load_ext cython

Генерируем случайную матрицу $1000 \times 1000$

In [2]:
matr = np.random.random(size=(1000, 1000))

## Чистый Python

In [3]:
def func_python(a):
    s = 0
    for y in range(1, a.shape[0]):
        for x in range(1, a.shape[1]):
            s += a[y, x] * a[y, x-1] + a[y-1, x-1] 
            
    return s

## Numba

JIT-компилятор, умеет транлировать `Python` (в основном `NumPy`-ориентированный) в машинный код для выполнения на CPU/GPU.

In [4]:
func_numba = numba.jit(func_python)

## Cython

Специализированный язык для написания нативных расширений для `Python` (`Cython` -> `C` -> `Python Module`)

In [5]:
%%cython

cimport numpy 

def func_cython(numpy.ndarray['double', ndim=2] a):
    cdef int x
    cdef int y 
    cdef double s = 0.0
    
    for y in range(1, a.shape[0]):
        for x in range(1, a.shape[1]):
            s += a[y, x] * a[y, x-1] + a[y-1, x-1]
    
    return s

## Результаты

In [6]:
%%timeit
func_python(matr)

877 ms ± 25.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


In [7]:
%%timeit
func_numba(matr)

1.18 ms ± 23.1 µs per loop (mean ± std. dev. of 7 runs, 1000 loops each)


In [8]:
%%timeit
func_cython(matr)

2.16 ms ± 38.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)
