![CC-BY-SA](https://mirrors.creativecommons.org/presskit/buttons/88x31/svg/by-sa.svg)
This notebook was created by [Bernardo Freitas Paulo da Costa](http://www.im.ufrj.br/bernardofpc),
and is licensed under Creative Commons BY-SA

# Funções em `ndarrays`

Tendo vetores NumPy (e arrays, e etc.), chamar funções neles pode ser feito de duas formas:
1. operando elemento por elemento explicitamente; ou
2. operando "no array inteiro".

A segunda forma é o análogo das "operações vetorizadas", para funções.
Vejamos a diferença...

In [None]:
import numpy as np

As duas linhas abaixo constróem, respectivamente:
1. uma lista com os elementos de 1 a 10^6.
2. um vetor com os mesmos elementos.

In [None]:
l = list(range(1,int(1e6)+1))
v = np.arange(1,1e6+1)

### Exercício

Compare o tempo que leva para calcular o seno de todos estes números, usando
1. A lista com `np.sin`
2. O array com `np.sin`
3. Uma list-compreension que aplica `np.sin` em cada elemento da lista

In [None]:
### Resposta aqui


# Escrevendo funções vetoriais

Muitas vezes vamos escrever funções que recebem um único valor.
Entretanto, às vezes, pode ser útil que nossas funções recebam um vetor e retornem o vetor que é o resultado de aplicar a função em cada elemento do vetor.

O exemplo anterior mostra que, se a nossa função chamar operações vetorizadas,
é MUITO melhor usar diretamente o vetor do que percorrer elemento a elemento.

### Exercício

Escreva uma função que, dado um vetor, retorna a soma dos desvios em relação à média.
Em fórmula:
$$\sum_i |v_i - m|$$
onde $m$ é a média dos $v_i$.

Compare a versão que calcula a soma iterativamente, com uma que cria o vetor $w$ tal que $w_i = |v_i - m|$.
(Dica: use a função `abs` do numpy.)

In [None]:
v = np.random.rand(70000)

In [None]:
def desvios_for(v):
    """Versão que calcula cada valor absoluto separadamente, num for."""
    ### Resposta aqui


In [None]:
def desvios_sum(v):
    """Versão que calcula cada valor absoluto numa list comprehension, e usa sum."""
    ### Resposta aqui


In [None]:
def desvios_np(v):
    """Versão com np.abs()"""
    ### Resposta aqui


In [None]:
%timeit desvios_for(v)
%timeit desvios_sum(v)
%timeit desvios_np(v)

# Duas ferramentas para vetorizar

## Axis

Provavelmente você já deve ter conhecido o argumento `axis=...`
que indica ao NumPy que a operação deve ser feita apenas numa dimensão,
e não em todas.
Muitas vezes, a possibilidade de transformar um código "escalar" num código _vetorizado_
passa por usar funções do NumPy com um eixo bem escolhido.

In [None]:
A = np.random.rand(5,4,2,6,3)
B = np.sum(A, axis=(1,3,4))
B

## shape

A segunda dica é usar `.shape` para descobrir as dimensões de uma matriz.
Em geral, as operações só fazem sentido quando os operandos tem a mesma dimensão,
ou quando uma das dimensões tem apenas um elemento (caso particular, a multiplicação por escalar!).
Isso pode ser (bastante!) explorado durante a construção do código no Notebook:
vá observando ao longo do algoritmo como a `shape` das matrizes e vetores evolui.
Ao verificar que as dimensões que você está usando são sempre compatíveis,
você já terá dado um grande passo em direção ao uso vetorizado dos `ndarrays`.

In [None]:
A.shape

In [None]:
B.shape