# Numba

In [1]:
import numpy as np
from numba import jit
from numpy.typing import ArrayLike

In [2]:
def without_numba(x: ArrayLike) -> ArrayLike:
    trace = .0
    for i in range(x.shape[0]):
        trace += np.tanh(x[i, i])
    return x + trace

In [3]:
@jit(nopython=True)
def with_numba(x: ArrayLike) -> ArrayLike:
    trace = .0
    for i in range(x.shape[0]):
        trace += np.tanh(x[i, i])
    return x + trace

In [4]:
x = np.arange(1000000).reshape(1000, 1000)

Первый запуск

In [5]:
%%time
_ = without_numba(x)

CPU times: user 10 ms, sys: 222 μs, total: 10.2 ms
Wall time: 8.12 ms


In [24]:
%%time
_ = without_numba(x)

CPU times: user 7.53 ms, sys: 3.51 ms, total: 11 ms
Wall time: 10.5 ms


Второй запуск быстрее из за кэширования # отредактировать

In [31]:
%%timeit
_ = without_numba(x)

8.81 ms ± 228 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Первый запуск numba компилирует функцию, что занимает время. Поэтому первый запуск будет медленнее, чем последующие.

In [30]:
%%time
_ = with_numba(x)

CPU times: user 1.55 ms, sys: 0 ns, total: 1.55 ms
Wall time: 1.57 ms


Второй запуск значительно быстрее, так как функция уже скомпилирована

In [26]:
%%timeit
_ = with_numba(x)

3.55 ms ± 166 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)


In [27]:
%%timeit
_ = with_numba(x)

3.49 ms ± 57.1 μs per loop (mean ± std. dev. of 7 runs, 100 loops each)
