## get_max_before_zero

In [1]:
import numpy as np

In [2]:
%load_ext line_profiler

### Fully vectorized

In [3]:
def get_max_before_zero(x):
    cnt_zeros = x.shape[0] - np.count_nonzero(x)
    if cnt_zeros == 0 or cnt_zeros == 1 and x[-1] == 0:
        return None
    idx_after_zero = np.where(np.concatenate([[1], x]) == 0)[0]
    idx_after_zero[idx_after_zero > x.shape[0] - 1] = idx_after_zero[0]
    return np.max(x[idx_after_zero])

In [4]:
%%timeit
x = np.random.randint(-1000, 1000, 1_000_000)
get_max_before_zero(x)

27.3 ms ± 4.34 ms per loop (mean ± std. dev. of 7 runs, 10 loops each)


### Non vectorized

In [5]:
def get_max_before_zero_non_vectorized(x):
    result = -np.inf
    for idx in range(1, x.shape[0]):
        if x[idx - 1] == 0:
            result = max(result, x[idx])
    return result

In [6]:
%%timeit
x = np.random.randint(-1000, 1000, 1_000_000)
get_max_before_zero_non_vectorized(x)

500 ms ± 18.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


### Partition vectorized

In [7]:
def get_max_before_zero_partition_vectorized(x):
    cnt_zeros = 0
    for idx in range(x.shape[0]):
        cnt_zeros += x[idx] == 0
    if cnt_zeros == 0 or cnt_zeros == 1 and x[-1] == 0:
        return None
    idx_after_zero = np.where(np.concatenate([[1], x]) == 0)[0]
    idx_after_zero[idx_after_zero > x.shape[0] - 1] = idx_after_zero[0]
    result = -np.inf
    for idx in idx_after_zero:
        result = max(x[idx], result)
    return result

In [8]:
%%timeit
x = np.random.randint(-1000, 1000, 1_000_000)
get_max_before_zero_partition_vectorized(x)

4.23 s ± 22.6 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


## Results

* Как и ожидалось полностью векторизованное решение работает значительно быстрее 2 других вариантов.
* При этом, частично векторизованное решение, полученное заменой вычисления предподсчёта с помощью numpy функции на pure python код стало работать значительно медленнее даже решения без векторизации. Как видно, if statements внутри циклов значительно влияют на производительность.
* Как итог, можно сказать, что неполная (неэффективная) векторизация может значительно снизить производительность, тогда как правильно векторизованное решение ускоряет исполнение на несколько порядков. 