# Arrays numpy

## Por que usar numpy?

Em Python temos nativamente várias ferramentas para cálculo numérico:

- Tipos numéricos: `int`, `float`, `complex`.
- Containers: listas, tuplas, dicionários, conjuntos, etc.
- Funções matemáticas com o pacote `math`.

Entretanto, tudo isso é executado dentro do interpretador. Existem muitos gargalos nos paradigmas usados no interpretador Python, não vamos entrar em detalhes aqui. Apenas fique sabendo que um programa puramente Python é extremamente ineficiente se comparado a uma linguagem compilada, como C ou Fortran, e o nosso curso acabaria bem aqui.

Uma das características da linguagem Python é a imensa biblioteca de pacotes, aliada à facilidade em *linkar* código compilado em outras linguagens. Com isso, não demorou muito para surgirem vários pacotes voltados ao cálculo numérico. O `numpy` é pacote que emergiu desse esforço. Ele está por trás da grande maioria dos pacotes de alto nível para computação científica, como `scipy`, `matplotlib`, `pandas`, etc.

O `numpy` fornece:

- Arrays multidimensionais.
- Aritmética de arrays.
- Computação mais próxima ao hardware (sem interpretador).

A [documentação oficial](https://numpy.org/doc/stable/) do `numpy` contém muito mais detalhes do que veremos aqui.

## Criando arrays manualmente

A forma mais simples de criar um array é usando algum container em Python, como uma lista.

In [None]:
import numpy as np

In [None]:
a = np.array([0.0, 1.0, 2.0, 3.0, 4.0])
print(type(a), a)

O array `a` é unidimensional. Podemos criar arrays com mais dimensões usando listas aninhadas.

In [None]:
b = np.array([[0, 1, 2], [3, 4, 5]])
c = np.array([[[1, 2, 3], [4, 5, 6]], [[7, 8, 9], [10, 11, 12]]])

In [None]:
b

In [None]:
c

Diferente de uma lista, os arrays só podem conter dados de um único tipo, e o tamanho do arrays é fixo. Tente criar um array multidimensional com formato inconsistente, não vai funcionar!

Arrays possuem algumas propriedades:
- Número de dimensões (`ndim`).
- Formato (`shape`).
- Tipo de dados (`dtype`).
- Flags internas (`flags`).

In [None]:
print(f'ndim: {c.ndim}')
print(f'shape: {c.shape}')
print(f'dtype: {c.dtype}')
print(f'flags: {c.flags}')

## Funções para criar arrays

Na prática, raramente escrevemos o conteúdo de um array manualmente. Temos funções para criar os arrays mais comuns:

### Arrays vazios, com zeros, uns ou valores constantes

Nestas funções, o primeiro argumento é o formato ou tamanho (*shape*), do array. Para um array unidimensional, use um inteiro. Se quiser criar um array multidimensional, use uma tupla para especificar o shape.

In [None]:
b = np.zeros(10)

In [None]:
b

In [None]:
c = np.ones((5, 4))

In [None]:
c

In [None]:
d = np.full(10, 5.9)

In [None]:
d

### Faixas de valores

Similares às funções que já programamos.

In [None]:
a = np.arange(10) # similar à função range do Python.

In [None]:
a

In [None]:
b = np.arange(0, 1, 0.01) # espaçamento definido.

In [None]:
b

In [None]:
c = np.linspace(0, 1, 20) # Número de divisões igualmente espaçadas.

In [None]:
c

### Outros arrays comuns

In [None]:
a = np.eye(3) # matriz diagonal "identidade".

In [None]:
a

In [None]:
b = np.arange(1, 5)
c = np.diag(b) # matriz diagonal com elementos dados.

In [None]:
c

### Números aleatórios

A linguagem Python tem um gerador de números pseudo-aleatórios interno.

In [None]:
np.random.seed(1234) # Semente do gerador de números aleatórios.
a = np.random.rand(10) # distribuição uniforme em [0, 1].

In [None]:
a

In [None]:
b = np.random.randn(4) # distribuição normal (gaussiana centrada em zero).

In [None]:
b

## Tipos de dados

Podemos ter vários tipos de dados necessários para aplicações diferentes. Existem tipos numéricos inteiros (`int`), de ponto flutuante (`float`) e complexos (`complex`). Os tipos inteiros podem ser com ou sem sinal. Além disso, podemos escolher a precisão ou tamanho do tipo, com 32, 64 ou 128 bits (depende do computador). Os tipos de dados são geralmente detectados pelo `numpy` quando vamos criar um array, mas podemos forçar um tipo específico usando o argumento `dtype='tipo'`.

In [None]:
a = np.array([1, -2, 3], dtype='float32')

In [None]:
a

In [None]:
a.dtype

Podemos ter também arrays booleanos (`bool`) e com strings. As strings têm tamanho fixo, pode ser um pouco inconveniente trabalhar com elas.

In [None]:
b = np.array([True, False, False, True])

In [None]:
b

In [None]:
b.dtype

In [None]:
np.ones(5, dtype='bool')

In [None]:
c = np.array(['Hello', 'World', '!'])

In [None]:
c

In [None]:
c.dtype

## Aritmética de arrays

Até agora vimos como arrays são contêiners muito convenientes quando tratamos de dados homogêneos. Se você nunca usou `numpy` ou linguagens como IDL e Matlab, o que veremos aqui vai te deixar de boca aberta.

Quando fizems operações com arrays, tivemos que realizar os cálculos com cada elemento desses arrays. Geralmente a abordagem é fazer alguns laços indexando os arrays para ler e modificar os seus elementos. Logicamente não temos como fugir disso, mas podemos delegar esta tarefa para quem sabe iterar arrays de forma eficiente. As operações que veremos a seguir ocultam vários desses laços, que são executados em código compilado, geralmente Fortran ou C/C++, dependendo da biblioteca por trás das funções.

### Aritmética básica

As operações aritméticas do Python podem ser aplicadas aos arrays. Podem envolver array com array, ou array com escalar.

#### Array com escalar

Aplica a operação a cada elemento do array, e resulta em um array do mesmo shape.

In [None]:
a = np.arange(10)

In [None]:
a

In [None]:
b = a + 1

In [None]:
b

In [None]:
2**a

Além de ser mais legível, a aritmética de arrays é muito mais rápida do que laços explícitos em Python.

In [None]:
# Aritmética de arrays.
%timeit a + 1

In [None]:
# Laço explícito.
b = np.zeros_like(a) # Array com zeros do mesmo tamanho e tipo de a.
%timeit for i in a: b[i] = a[i] + 1

A diferença é pouca quando o array é pequeno. Experimente mudar o tamanho do array `a` para 1000 ao invés de 10.

#### Array com array

As operações são feitas elemento por elemento.

In [None]:
b = np.arange(10)
c = np.arange(10, 110, 10)

In [None]:
print(c)
print(b)
print(c - b)

Podemos misturar muitas operações, exatamente como faríamos com escalares.

In [None]:
d = 2**(b + 1) - c

In [None]:
d

**Atenção:** Aritmética de arrays **não** é aritmética de matrizes! A multiplicação de dois arrays ocorre elemento a elemento. Quer dizer, para arrays bidimensionais, a operação `e = c * d` significa

$$
e_{ij} = c_{ij} \times d_{ij}.
$$

In [None]:
c = np.ones((3, 3))

In [None]:
c

In [None]:
d = np.diag(np.arange(3))

In [None]:
d

In [None]:
e = c * d

In [None]:
e

A multiplicação de matrizes

$$
f_{ij} = \sum_k c_{ik}\ d_{kj}
$$

pode ser feita usando a função `np.matmul()`.

In [None]:
f = np.matmul(c, d)

#### Exercício 1

Vamos calcular valores do polinômio de Legendre de quinto grau,

$$
P_5(x) = \frac{1}{8} \left(63 x^5 - 70 x^3 + 15 x \right).
$$

Defina `x` como um array igualmente espaçado tal que $-1 \leq x \leq 1$, e calcule todos os valores de $P_5(x)$ usando aritmética de arrays numpy. Faça o gráfico da função.

### Funções transcendentais

Temos as várias funções transcendentais (e mais uma penca de funções de conveniência) presentes no pacote `math` em versão `numpy`, prontas para serem usadas junto com a aritmética de arrays.

In [None]:
x = np.linspace(0, 2 * np.pi, 20)
y = 5 * np.cos(x)

In [None]:
y

In [None]:
np.log(x)

In [None]:
np.exp(x)

In [None]:
np.sqrt(x)

#### Exercício 2

Faça o gráfico de um oscilador amortecido, dado por

$$
x(t) = A\,e^{-\gamma t} \cos \omega t,
$$

onde $A = 1$, $\gamma = 1$, e $\omega = 10$.

### Reduções

Existem algumas operações que agem sobre arrays, mas retornam arrays menores, ou mesmo um escalar. Chamamos essas operações de *reduções*.

#### Somatórios

In [None]:
# Soma de todos os números de 1 a 100
x = np.arange(1, 101)

In [None]:
np.sum(x)

Notação alternativa, usando o método `.sum()` dos arrays.

In [None]:
x.sum()

Os somatórios podem ser feitos por linha ou coluna (ou por alguma dimensão maior, em arrays multidimensionais.

In [None]:
x = np.array([[1, 1], [2, 2]])

In [None]:
x

In [None]:
# Somar colunas, desaparece o eixo 0 (linhas)
x.sum(axis=0)

In [None]:
# Somar linhas, desaparece o eixo 1 (colunas)
x.sum(axis=1)

#### Extremos

In [None]:
x = np.array([1, 3, 2])

In [None]:
x.min()

In [None]:
x.max()

In [None]:
x.argmin()  # índice do mínimo.

In [None]:
x.argmax()  # índice do máximo.

#### Estatística básica

In [None]:
x = np.array([1, 2, 3, 1])
y = np.array([[1, 2, 3], [5, 6, 1]])

In [None]:
# Média
x.mean()

In [None]:
# Mediana
np.median(x)

In [None]:
# Desvio padrão
x.std()

Podemos selecionar sobre qual dimensão queremos a estatísica.

In [None]:
np.median(y, axis=1)