# Numba

In [7]:
import numpy as np
from numba import jit
from numpy.typing import ArrayLike

In [8]:
def without_numba(x: ArrayLike) -> ArrayLike:
    trace = .0
    for i in range(x.shape[0]):
        trace += np.tanh(x[i, i])
    return x + trace

In [9]:
@jit(nopython=True)
def with_numba(x: ArrayLike) -> ArrayLike:
    trace = .0
    for i in range(x.shape[0]):
        trace += np.tanh(x[i, i])
    return x + trace

In [10]:
x = np.arange(1000000).reshape(1000, 1000)

Первый запуск

In [11]:
%%time
_ = without_numba(x)

CPU times: user 17.2 ms, sys: 202 μs, total: 17.4 ms
Wall time: 15.9 ms


Второй запуск быстрее из за кэширования

In [12]:
%%timeit
_ = without_numba(x)

6.77 ms ± 514 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Первый запуск numba компилирует функцию, что занимает время. Поэтому первый запуск будет медленнее, чем последующие.

In [13]:
%%time
_ = with_numba(x)

CPU times: user 984 ms, sys: 43.5 ms, total: 1.03 s
Wall time: 1.06 s


Второй запуск значительно быстрее, так как функция уже скомпилирована

In [14]:
%%timeit
_ = with_numba(x)

3.38 ms ± 181 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [15]:
%%timeit
_ = with_numba(x)

3.42 ms ± 122 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)
