# Numpy

- Extenso pacote para arrays multi-dimensionais.
- Mais próximo do hardware (eficiência)
- [Numpy website](http://www.numpy.org/)

Convencionalmente o módulo **numpy** é importado da seguinte forma:

In [None]:
import numpy as np

## Criando NumPy Arrays

In [None]:
# criar um array de uma dimensão
a = np.array([1,2,3,4])

In [None]:
# verificar tipo de estruta de dados
type(a)

In [None]:
# verificar tipo dos elementos dentro do array
a.dtype

In [None]:
# retornar o comprimento do array em cada dimensão
a.shape # o mesmo que shape(a)

In [None]:
# retornar o número total de elementos, considerando todas as dimensões
a.size # o mesmo que size(a)

In [None]:
# retornar o número de dimensões
a.ndim

In [None]:
# verificar bytes por elementos
a.itemsize

In [None]:
# verificar o total de bytes usados pela elementos do array
a.nbytes

In [None]:
b = np.array([2, 3, 0, 1], dtype='complex64')
b.dtype

In [None]:
b = np.array([3.2 + 2.0j, 5.4 - 0.3j])
b.dtype

## Operações matemáticas

In [None]:
a = np.array([1,2,3,4])
b = np.array([2,3,4,5])

In [None]:
a + b

In [None]:
a * b

In [None]:
a ** b

In [None]:
# somar com um escalar
a + 2

In [None]:
# elevar ao quadrado todos os elementos
a ** 2

In [None]:
# criar um vetor de 0 a 10
x = np.arange(11)

In [None]:
# multiplicar o vetor inteiro por um escalar
c = x * (np.pi)/10

In [None]:
# acplicar função a um array
s = np.sin(c)
s

## Atribuindo valores a elementos de um array

In [None]:
# Indexação como em listas
a[0]

In [None]:
# atribuição como em listas
a[0] = 11
a

In [None]:
# atribuir zero para todos os elementos
a.fill(0)
a

### Atenção ao tipo dos dados

In [None]:
a.dtype

In [None]:
# neste exemplo, numpy irá truncar o 10.6, resultando em 10
a[0] = 10.6
a

## Slicing

**`var[inferior:superior:passo]`**  

Extrai uma porção de uma sequência por meio da especificação de um limite inferior e um limite superior.  
O limite inferior está incluso, mas o limite inferior **não** está incluso. Matematicamente: [inferior,superior)  
O passo especifica um salto entre os elementos.

In [None]:
a = np.array([10, 11, 12, 13, 14])

In [None]:
# retorna um array formado pelos elementos de índice 1 e 2
a[1:3]

In [None]:
# índices negativos também funcionam
a[1:-2]

### Omitindo índices

In [None]:
# retorna os 3 primeiros elementos
a[:3]

In [None]:
# retorna os 2 últimos elementos
a[-2:]

In [None]:
# retorna os elemtos com salto de 2 em 2 elementos
a[::2]

## Arrays Multi-Dimensionais

In [None]:
# reparar que existem duas listas dentro de uma outra lista
a = np.array([[0, 1, 2, 3], [10, 11, 12, 13]])
a

In [None]:
# shape = (linhas, colunas)
a.shape

In [None]:
# número de elementos
a.size

In [None]:
# número de dimensões
a.ndim

In [None]:
# retornar elemento
a[1,2]

In [None]:
# atribuir elemento
a[1,2] = 24
a

In [None]:
# retornar linha inteira
a[1]

## I/O de arquivos

In [None]:
# ler as primeiras linha do arquivo
!head 'data_files/matrix_example.txt'

In [None]:
# ler os dados do arquivo e armazenar no array
f = np.loadtxt('data_files/matrix_example.txt')
f

In [None]:
# ler os dados do arquivo e armazenar no array
f = np.loadtxt('data_files/matrix_example.txt', dtype='int32')
f

## Atividade

- Carrege os dados do arquivo `matrix_example.txt` em um array com `dtype` inteiro;
- Mude o `shape` da matrix;
- Salve a nova matrix com o nome `matrix_example_reshaped.txt` (elementos com o tipo inteiro);
- Carrege o cabeçalho do novo arquivo para verificar o resultado.

In [None]:
# formato do array
f.shape

In [None]:
# número de elementos do array
f.size

In [None]:
# mudar o formato do array
g = f.reshape(14, 4)
g

In [None]:
np.savetxt('data_files/matrix_example_reshaped.txt', g)

In [None]:
!head 'data_files/matrix_example_reshaped.txt'

In [None]:
np.savetxt('data_files/matrix_example_reshaped.txt', g, fmt='%d')

In [None]:
!head 'data_files/matrix_example_reshaped.txt'

## I/O em diferentes formatos

<img src='images_files/file_formats.png'>

## Um pouco mais de slicing

<img src='images_files/slicing.png'>

In [None]:
f

In [None]:
f[0, 3:5]

In [None]:
f[4:, 4:]

In [None]:
f[:, 2]

In [None]:
f[2::2, ::2]

## Slices são referências!

Slices são referências para a memória do array original.  
Mudar valores em slices também mudam valores no array original.

In [None]:
a = np.arange(5)
a

In [None]:
# cria um slice contendo os 3 primeiros elementos de a
b = a[:3]
b

In [None]:
# modifica o primeiro elemento de b
b[0] = 10
b

In [None]:
# modificando b, estamos modificando a, 
# pois eles são o mesmo array, apenas vizualizado diferentemente
a

In [None]:
# usando slice, mas atribuindo a um novo array
a = np.arange(5)
b = a[:3].copy()
b[0] = 200
b

In [None]:
a

## Fancy Indexing

In [None]:
a = np.arange(0, 70, 10)
a

In [None]:
# determinando manualmente quais elementos serão selecionados
indices = [0, 2, -1]
y = a[indices]
y

In [None]:
# indexing com booleanos (mascara criada manualmente)
mask = np.array([0, 1, 1, 0, 0, 1, 0], dtype=bool)
z = a[mask]
z

In [None]:
# criando mascara condicionalmente
mask2 = a < 40
mask2

In [None]:
# indexing com booleanos (condicionalmente)
w = a[mask2]
w

In [None]:
# where
# encontra os índices no array onde a expressão é verdadeira
loc = np.where(a > 20)
loc

In [None]:
# aplicando a mascara
q = a[loc]
q

## Atividade

- Carregue os dados do arquivo '`data_files/stockholm.dat`' - (cuidado com o cabeçalho - veja o parametro skiprows da função `np.loadtxt`);
- Calcule a temperatura diária média desde do ano 1800 - (veja a função np.mean);
- Calcule o desvio padrão e variância da temperatura média desde 1800 - (veja as funções np.std e np.var);
- Calcule a maior e a menor temperatura no ano 1990 - (veja a função np.max e np.min e rever fancy indexing).

In [None]:
!head 'data_files/stockholm.dat'

In [None]:
data = np.loadtxt('data_files/stockholm.dat', dtype='float32', skiprows=1)
data

In [None]:
data[:,3]

In [None]:
data[:,3].mean(), data[:,3].std(), data[:,3].var()

In [None]:
mask = data[:,0] >= 1900
mask

In [None]:
mask1 = np.where(data[:,0] >= 1900)
mask1

In [None]:
data[mask1,3].max(), data[mask1,3].min()

## Outras funções para criar arrays

#### linspace and logspace

In [None]:
# retorna números igualmente espaçados
# ambos os limites são inclusos
np.linspace(0, 10, 20)

In [None]:
# retorna números igualmente espaçados em escala logarítimica
# ambos os limites são inclusos
np.logspace(0, 10, 20, base=np.e)

#### mgrid

In [None]:
# similar ao meshgrid do MATLAB
x, y = np.mgrid[0:5, 0:5]

In [None]:
x

In [None]:
y

#### random data

In [None]:
# distribuição uniforme de números randômicos [0,1]
np.random.rand(5,5)

In [None]:
# distribuição normal de números randômicos - média 0 e variância 1
np.random.randn(5,5)

#### diag

In [None]:
# retorna uma matrix diagonal
np.diag([1,2,3])

In [None]:
# matrx diagonal com offset da diagonal principal
np.diag([1,2,3], k=1) 

#### zeros and ones

In [None]:
np.zeros((3,3))

In [None]:
np.ones((3,3))

In [None]:
# faz uma cópia do array x (mesmo shape), porém com todos elementos iguais a 0
a = np.zeros_like(x)
a

In [None]:
# faz uma cópia do array x (mesmo shape), porém com todos elementos iguais a 1
b = np.ones_like(a)
b

## Operações Matriciais

In [None]:
# criar uma matrix quadrada (3,3)
m = np.arange(9).reshape(3,3)
m

In [None]:
# criar um vetor linha
v = np.arange(3)
v

In [None]:
# multiplicação matricial
np.dot(m, m)

In [None]:
# multiplicação matricial
np.dot(m, v)

In [None]:
# produto interno
np.inner(v, v)

In [None]:
# produto externo
np.outer(v, v)

Alternativamente, podemos usar a função `matrix`. Isso muda o comportamento padrão e permite que os operadores aritméticos `+, -, *` possam ser usados em álgebra matricial.

In [None]:
m2 = np.matrix(m)
v2 = np.matrix(v).T # make it a column vector

In [None]:
v2

In [None]:
m2 * m2

In [None]:
m2 * v2

In [None]:
# produto interno
v2.T * v2

In [None]:
# with matrix objects, standard matrix algebra applies
v2 + m2*v2

#### Inversa

In [None]:
# inversa da matrix a
a = np.array([[1., 2.], [3., 4.]])
ainv = np.linalg.inv(a)
ainv

In [None]:
# inversa da matrix a
a1 = np.matrix(a)
a1.I

#### Determinant

In [None]:
np.linalg.det(a)