# Aula 02 - [NumPy](http://www.numpy.org/)

**Objetivos**

- Apresentar o objeto *array* de N-dimensões
- Guia de funções sofisticadas (*broadcasting*)
- Tour nos sub-módulos para: Álgebra Linear, transformada de Fourier, números aleatórios, etc
- Uso para integrar código C/C++ e Fortran

In [None]:
a = [0.1, 0.25, 0.03]
b = [400, 5000, 6e4]
c = a + b
c

In [None]:
[e1+e2 for e1, e2 in zip(a, b)]

In [None]:
import math

try:
    math.tanh(c)
except TypeError as e:
    print(e)

In [None]:
[math.tanh(e) for e in c]

In [None]:
import numpy as np
np.set_printoptions(precision=3 , suppress= True)

a = np.array(a)
b = np.array(b)
c = a + b
c

In [None]:
np.tanh([a, b])

In [None]:
a * b

In [None]:
np.dot(a, b)

In [None]:
np.matrix(a) * np.matrix(b).T

In [None]:
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
fmt = 'shape: {!r}\nndim: {!r}\nsize: {!r}'.format
print(fmt(a.shape, a.ndim, a.size))

In [None]:
# Exercícios (slices)
# 1) Primeira linha.
# 2) Primeira coluna.
# 3) Terceiro elemento (ordem Fortran)
# 4) Terceiro elemento (ordem C)
# 5) Apenas a diagonal.
a

In [None]:
# Qual a diferença? (Olhe também `np.eye`, `np.ones` e `np.empty`)

np.zeros(a.shape) == np.zeros_like(a)

In [None]:
np.arange(1, 2, 0.2)

In [None]:
np.linspace(1, 2, 5)  # Olhe também `np.logspace`

In [None]:
mask = np.where(a <= 5)  # Para quem ainda vive em MatlabTM world.
mask

In [None]:
mask = a <= 5  # Melhor não?
mask

In [None]:
a[mask]

In [None]:
import numpy.ma as ma

ma.masked_array(a, mask)

Salvando e carregando novamente os dados:

- np.save
- np.savez
- np.load

In [None]:
a = np.random.rand(10)

b = np.linspace(0, 10, 10)

np.save('arquivo_a', a)

np.save('arquivo_b', b)

np.savez('arquivo_ab', a=a, b=b)


In [None]:
%%bash
ls *.np*

In [None]:
c = np.load('arquivo_ab.npz')
c.files

In [None]:
# Operações: +, -, *, /, //, **, %
c['b'] // c['a']

In [None]:
a = np.array([1, 2, 3])
a **= 2
a

In [None]:
A = np.arange(25, dtype=float).reshape(5, 5)
A

In [None]:
A[A<12] = np.NaN
A

## Manipulando dados reais

Vamos utilizar os dados do programa de observação do oceano Pirata.

http://www.goosbrasil.org/pirata/dados/

In [None]:
np.loadtxt("./data/dados_pirata.csv", delimiter=',')

In [None]:
!head ./data/dados_pirata.csv

In [None]:
data = np.loadtxt("./data/dados_pirata.csv", skiprows=1, usecols=range(2, 16), delimiter=',')

data.shape, data.dtype

Você pode "designar" valores (como criar uma máscara para dados ruins).

In [None]:
data[data == -99999.] = np.NaN
data

In [None]:
data.max(), data.min()

In [None]:
np.nanmax(data), np.nanmin(data)

In [None]:
np.nanargmax(data), np.nanargmin(data)

In [None]:
np.unravel_index(np.nanargmax(data), data.shape), np.unravel_index(np.nanargmin(data), data.shape)

<img  height="300" src="files/anatomyarray.png" >

In [None]:
np.nanmean(data), np.nanmedian(data)

Fatiar (ou *slicing*) funciona da mesma forma que Lista ou Tuples.

In [None]:
%matplotlib inline

import matplotlib.pyplot as plt

fig, ax = plt.subplots()

ax.plot(data[:, 0])
ax.plot(data[:, -1])

Dados com máscara (Masked arrays)

In [None]:
plt.pcolormesh(data)

In [None]:
import numpy.ma as ma

data = ma.masked_invalid(data)

In [None]:
plt.pcolormesh(np.flipud(data.T))
plt.colorbar()

In [None]:
data.max(), data.min(), data.mean()

In [None]:
data.shape

In [None]:
z = [1, 10, 100, 120, 13, 140, 180, 20, 300, 40,5, 500, 60, 80]

fig, ax = plt.subplots()
ax.plot(data[42, :], z, 'ko')
ax.invert_yaxis()