## NumPy em 50 células de notebook Júpiter
adaptado do trabalho de Numan Yilmaz, 10 May 2017
Originalmente postado [aqui.][1].
Uma execlente referência mais aprofundada pode se encontrada [aqui.][2], que além do NumPy cobre Pandas, matplotlib, seaborn, SciPy e scikit-learn.

Este tutorial consiste nas seguintes partes:

 - O que é o NumPy?
 - Como criar matrizes NumPy
 - Indexação, Indexação Mascarada
 - Fatiamento
 - Funções universais (ufuncs)
 - Transmissão
 - Mascaramento, classificação e comparação
 - Aprendizagem adicional
 
 [1]:https://datascientistnotebook.com/2017/04/01/numpy-in-50-cells-of-notebook/
 [2]:https://amzn.to/3dpy97a

### 1- O que é o array NumPy?
O NumPy (https://numpy.org/) é a base do Pandas e de muitos outros pacotes. O que torna o NumPy um pacote tão incrível é o seu tipo de dados (ndarray). ndarray significa array n-dimensional, que basicamente se parece com uma lista Python. No entanto, é muito mais rápido que uma lista Python comum. Uma lista Python pode conter tipos diferentes de tipos de dados, como números inteiros, seqüências de caracteres, booleano, verdadeiro, falso e até listas. Por outro lado, as matrizes NumPy podem conter apenas um tipo de dados e, portanto, não precisam verificar o tipo de dados para cada elemento único da matriz quando estão fazendo os cálculos. Esse recurso faz do NumPy uma ótima ferramenta para pesquisas e projetos de ciência de dados.

Antes de começarmos, vamos verificar a versão do NumPy e Python.

In [None]:
# import numpy
import numpy as np

# sys foi importado para verificar a versão do python
import sys 

# verificando a versão do python e numpy
print('NumPy version:', np.__version__)
print('Python version',sys.version)

### 2- Como criar matrizes NumPy

Existem várias maneiras de criar matrizes no NumPy. Vamos dar uma olhada em alguns deles aqui.

In [None]:
# criar uma matriz numpy unidimensional
a=[1,2,3]
#np.array([1, 2, 3])
np.array(a)

In [None]:
# Matriz de zeros
np.zeros(3)

In [None]:
# Matriz de 1s
np.ones(3)

In [None]:
# matriz de 3 números inteiros aleatórios entre 1 e 10
np.random.randint(1,10, 3)

In [None]:
np.random.randint(50,80,10)

In [None]:
# criar matriz espaçada linearmente. 
np.linspace(0, 10, 5 )

In [None]:
# criar matriz bidimensional
np.array([[1,2,3],
         [4,5,6],
         [7,8,9]])

In [None]:
# criar valores de matriz 3x4 entre 0 e 1
np.random.random((3,4))

In [None]:
# criar matrizes a (1D) e b(2D)
a = np.array([1,2,3])
b = np.random.randint(0,10, (3,3))

print(a)
print(b)

In [None]:
# adicionando valores 
a = np.append(a, 4)
a

In [None]:
# imprimir a forma e a dimensão das matrizes
print("Forma de a:", np.shape(a))
print("Forma de b:", np.shape(b))

print('Dimensão de a:', np.ndim(a))
print('Dimensão de b:', np.ndim(b))

In [None]:
# número de elementos nas matrizes
print('Número de elementos em a:', np.size(a))
print('Número de elementos em b:', np.size(b))

### Indexação e indexação mascarada

In [None]:
# a é uma matriz 1D, criamos antes
a

In [None]:
# b é uma matriz 2D criada em uma célula anterior
b

In [None]:
# obter o primeiro elemento de a 
# essas duas instruções de impressão resultam o mesmo
print(a[0])
print(a[-4])

In [None]:
# obter o último elemento de a
# essas duas instruções de impressão resultam o mesmo
print(a[-1])
print(a[3])

In [None]:
# obter a primeira linha de b
# essas duas instruções de impressão resultam o mesmo
print(b[0]) 
print(b[0,:])

In [None]:
# obter a segunda coluna de b
b[:,1]

In [None]:
# para entender melhor a indexação mascarada. criaremos 2 novas matrizes.
x = np.array(['a', 'b', 'c'])
y = np.array([['d','e','f'], 
              ['g', 'h', 'k']])

print(x)
print(y)

In [None]:
# indexação mascarada na matriz 1D
# obtém o valor de c na matriz x
ind = [2]
x[ind]

In [None]:
# indexação mascarada em array 2D
# obtém os valores e, h na matriz y
ind2 = [[0,1],[1]]
y[tuple(ind2)] # ao invés de y[ind2] que vai ser descontinuado
#y[ind2]

### 4- Fatiando
###### use: para cortar

In [None]:
# crie uma matrizum de números inteiros de matriz de 1 a 10
X = np.arange(1, 11, dtype=int)
X

In [None]:
# obtenha os dois primeiros elementos de X
X[:2]

In [None]:
# obter o número 3,4 e 5
X[2:5]

In [None]:
# obter os números ímpares
X[::2]

In [None]:
# obtenha os números pares
X[1::2]

In [None]:
# criar matriz 2D
Y= np.arange(1,10).reshape(3,3)
Y

In [None]:
# pegue a primeira e a segunda linha
Y[:2,:]

In [None]:
# obter a segunda e terceira coluna
Y[:, 1:]

In [None]:
# obter o elemento de 5 e 6
Y[1,1:]

### 5- Funções universais (ufuncs)

##### pressione TAB após np. para ver a lista de ufuncs disponíveis. np. {TAB}

Permitir computação rápida em matrizes NumPy.

In [None]:
# use a mesma matriz que criamos anteriormente
X

In [None]:
# encontre o elemento máximo de X
np.max(X)

In [None]:
# média de valores no array X
np.mean(X)

In [None]:
# obter a quarta potência de cada valor
np.power(X, 4)

In [None]:
# funções trigonométricas
print(np.sin(X))
print(np.cos(X))
print(np.sin(X)/np.cos(X))
print(np.tan(X))

In [None]:
# x2 + y2 = 1
np.square(np.sin(X)) + np.square(np.cos(X))

In [None]:
# mesmas regras se aplicam à matriz 2D
Y

In [None]:
np.multiply(Y, 2)

In [None]:
# dividir Y em 3 subarrays
np.split(Y, 3)

### 6- Broadcasting

 Broadcasting é poder usar ufuncs e muitas outras operações em diferentes tamanhos de matrizes

In [None]:
X=np.array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [None]:
# adicione 5 a cada elemento
X + 5

In [None]:
# ou 
np.add(X, 5)

In [None]:
# criar nova matriz Z
Z = np.arange(3)[:, np.newaxis]
Z

In [None]:
# multiplicar Y e Z
np.multiply(Y, Z)

### 7- Classificação, Comparação e Mascaramento

In [None]:
# crie uma matriz de 10 elementos entre 1 e 5
x = np.random.randint(1,5, 10)
x

In [None]:
# criar matriz (3,3) com elementos entre 1 e 5
y = np.random.randint(1,5, (3,3))
y

In [None]:
# ordenar elementos da matriz x
np.sort(x)

In [None]:
# classificar valores ao longo das linhas
np.sort(y, axis=0)

In [None]:
# classificar valores ao longo das colunas
np.sort(y, axis=1)

In [None]:
# operações == , !=, < , >, >=, <= em matrizes
# isso retorna um boolean
x > 3

In [None]:
# use o recurso de mascaramento para obter os valores das comparações
x[x>3]

In [None]:
# outro exemplo
x[(x <= 3) & (x>1)]

## Exercícios

Substitua todos os números ímpares em arr por -1. 

In [None]:
# Input
arr = np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
arr

#arr[1::2] = -1
#arr

arr[arr % 2 == 1] = -1
arr

Empilhe os arrays `a` e `b` verticalmente

In [None]:
# Input
a = np.arange(10).reshape(2,-1)
b = np.repeat(1, 10).reshape(2,-1)

print(a,"\n\n",b)

# Método 1:
# np.concatenate([a, b], axis=0)

# Método 2:
np.vstack([a, b])

# Método 3:
#np.r_[a, b]

Obter os itens comuns entre `a` e `b`

In [None]:
# Input
a = np.array([1,2,3,2,3,4,3,4,5,6])
b = np.array([7,2,10,2,7,4,9,4,9,8])

np.intersect1d(a,b)

Obtenha as posições em que os elementos de `a` e `b` correspondem

In [None]:
np.where(a == b)

Substitua todas as ocorrências de `nan` por 0 na matriz

In [None]:
# Input
arq = 'IRIS.csv'
iris_2d = np.genfromtxt(arq, delimiter=',', dtype='float', usecols=[0,1,2,3])
iris_2d[np.random.randint(150, size=20), np.random.randint(4, size=20)] = np.nan
iris_2d

iris_2d[np.isnan(iris_2d)] = 0
iris_2d[:4]