# Vetorização


Muitas vezes em computação cientifíca, aprendizado de máquinas e análise de dados, nós temos de executar operações em listas, vetores ou matrizes.

Por exemplo o somatório a seguir:

$\sum_{i=1}^N x_i$ 

In [9]:
X = [1, 4, 6]

In [11]:
# TODO: Fazer a versão iterative (não vetorizada)
def soma_interativa(X):
    soma = 0
    for x_i in X:
        soma += x_i

    return soma

soma_interativa(X)

11

In [12]:
# TODO: versão vetorizada utilizando função sum do python
sum(X)

11

In [13]:
# TODO: versão vetorizada com numpy
import numpy as np

np.sum(X)

11

In [14]:
X = np.random.randint(0, 1000, 10000000)

# TODO: Exibir o tempo de execução

%timeit soma_interativa(X)
%timeit sum(X)
%timeit np.sum(X)

  """


1.49 s ± 56.8 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)


  """Entry point for launching an IPython kernel.


1.18 s ± 2.79 ms per loop (mean ± std. dev. of 7 runs, 1 loop each)
5.78 ms ± 48.3 µs per loop (mean ± std. dev. of 7 runs, 100 loops each)


Além do somatório, nós poderíamos querer elevar todos o números ao quadrado ou tirar o log deles.
Na simbologia matemática seria assim, supondo que $X = \{x_1, ..., x_N\}$ seja um vetor com $N$ elementos.
Queremos que $X^2 = \{x_1^2, x_2^2, x_3^2, ..., x_N^2\}$ e $\log(X) = \{\log(x_1), \log(x_2), \log(x_3), ..., \log(x_N)\}$. 

Vamos ver como ficaria vetorizado.

In [1]:
X = [1, 4, 6]

In [2]:
# TODO: Fazer a versão iterative (não vetorizada)
import math

print([x_i**2 for x_i in X])
print([math.log(x_i) for x_i in X])

[1, 16, 36]
[0.0, 1.3862943611198906, 1.791759469228055]


In [3]:
# TODO: versão vetorizada com numpy
import numpy as np

np.log(X)

array([0.        , 1.38629436, 1.79175947])