# Numpy

Hoje, vamos começara ver a biblioteca matemática mais importante pro ecossistema 
científico do Python: O Numpy.

Vamos relembrar alguns conceitos

In [None]:
lista = ["a", 2, 2.4, True, [1, 3], {"a": 1}]

In [None]:
lista.append("Olá")

In [None]:
lista

In [None]:
a = 42.5

In [None]:
a = 'aaaaa'

A biblioteca **NumPy** _(Numerical Python)_ proporciona uma forma eficiente de armazenagem e processamento de conjuntos de dados, e é utilizada como base para a construção da biblioteca Pandas, que estudaremos a seguir.

O diferencial do Numpy é sua velocidade e eficiência, o que faz com que ela seja amplamente utilizada para computação científica e analise de dados. 

A velocidade e eficiência é possível graças à estrutura chamada **numpy array**, que é um forma eficiente de guardar e manipular matrizes, que serve como base para as tabelas que iremos utilizar.

In [None]:
# A gente importa o numpy sempre chamando ele de "np"
import numpy as np

In [None]:
# Vamos fazer uma comparação com uma lista de Python
py_array = [[1,   2,  3]]

print(py_array)
print(type(py_array))

In [None]:
# Uma lista com 2 dimensões é uma lista de listas
print(type(py_array[0]))

In [None]:
# Nota como o tipo da variável muda para "ndarray"
np_array = np.array(py_array)

print(np_array)
print(type(np_array))

In [None]:
# Mas no  numpy, um ndarray continua sendo formado de ndarrays.
print(type(np_array[0]))

In [None]:
# 3 atributos básicos pra um ndarray
print(np_array.shape)   # O formato dele
print(np_array.ndim)    # Quantas dimensões ele tem
print(np_array.dtype)   # O "dtype", que é o tipo dos elementos (número, letra, ...) dele

In [None]:
x = np.array([1, 2, 3]) # Um vetor também é um ndarray
print(type(x))
print(x.dtype)

In [None]:
# O dtype de um array do numpy pode ser controlado na hora que a gente cria.
py_array = [[1,   2,  3]]

array_int = np.array(py_array, dtype=np.float64)

In [None]:
print(novo_array)
print(novo_array.dtype)

In [None]:
# Mas quando a gente não define, ele infere a partir dos nossos dados.
py_array_2 = [[1.0,   2,  3.0]]

array_float = np.array(py_array_2)

print(array_float)
print(array_float.dtype)

In [None]:
# Para selecionar um elemento de uma tabela no Python e no Numpy, tem uma ligeira diferença.
print((array_int[0][0])) # Python: Pega a primeira linha. Dela, pega o primeiro elemento.
print((array_float[0,0]))  # Numpy: Pega o elemento da linha 0, coluna 0.

In [None]:
print((array_int[0][1])) # Python: Pega a primeira linha. Dela, pega o segundo elemento.
print((array_float[0,1]))  # Numpy: Pega o elemento da linha 0, coluna 1.

**Revisando**

In [None]:
# No Python, existe o conceito de "indexing", que é pegar elementos pelo seu índice (a sua posição) 
lista = [1, 2, 3, 4, 5, 6, 7, 8, 9]
print(lista[0])
print(lista[3])
print(lista[-1]) # Aqui a gente também pode indexar negativamente. Aí o Python conta de trás pra frente.
print(lista[-3]) # -3 vai ser o terceiro elemento, de trás pra frente

# OBS: Lembre-se que as "posições" no Python sempre começam a contar do zero!!!

In [None]:
print(lista[0] == lista[-9]) # Nota que o primeiro elemento é o -9, pois é o nono de trás pra frente.

In [None]:
# Também existe uma forma de pegar um subconjunto da lista.
# A gente chama isso de "slicing". Nota que o último elemento não entra!
print(lista[:])
print(lista[:3])
print(lista[:-3]) # A gente pode usar nossa indexação negativa aqui.

In [None]:
# Podemos definir um início também pro slicing.
# Quando não colocamos nada, ele assume que o início é 0.
# No caso do fim, se não colocamos nada, ele assume que o fim é o último elemento.
print(lista[2:])
print(lista[2:3])
print(lista[2:-3]) # A gente pode usar nossa indexação negativa aqui.

In [None]:
# O poder do slicing é que a gente pode definir diferentes tamanhos de passo.
print(lista[0:9:2])
print(lista[-1:-5:-2]) # Agora ele anda de trás pra frente!
print(lista[1:5:-1]) # Se eu for subtraindo 1, é impossível ir de 1 até 5. Logo, gera uma lista vazia.

Também podemos aplicar o conceito do slicing no numpy

In [None]:
print(array_int)
print(array_int[:,2]) # Pegando o terceiro elemento
print(array_int[:,-1:-5:-2]) # Invertendo o array

**Funções numpy**  
O numpy também tem diversas funções para facilitar criação de arrays.

In [None]:
print(np.zeros((1,10)), end='\n\n') # O "end" muda o que o Python encaixa no fim do que ele mostra pra gente.
print(np.ones((1, 5)), end='\n\n') # \n é pular linha, e é o default. \n\n pula 2 linhas.
# Alguns spoilers
print(np.identity(4), end='\n\n')
print(np.eye(4, 3), end='\n\n')

In [None]:
# Também podemos fazer listas de números.
print(np.arange(10, 30, 2)) # Lista de números inteiros pulando de 2 em 2. Mas até aqui, seria igual a Python.
print('')
print(np.arange(10.5, 30.5, 2))  # Lista de números de ponto flutuant, pulando de 2 em 2.
print('')
print(np.linspace(10, 30, 10)) # Lista de 10 números, igualmente espaçados entre 10 e 30.

# Operações Básicas

In [None]:
# Se a força do numpy é ter tudo operando como vetores, 
# então ele tem que ter operações de vetores.
vec1 = np.arange(0, 10, 1)
vec2 = np.arange(0, 20, 2)

print(vec1)
print(vec2)

In [None]:
# Soma por elemento
print(vec1 + vec2)

# Multiplicação elemento por elemento
print(vec1 * vec2)

# produto de matrizes (neste caso, produto escalar)
# Isso é multiplicar elemento por elemento, e depois somar
print(vec1 @ vec2)
print((vec1 * vec2).sum()) # Todo ndarray tem um método "sum" pra somar seus elementos

# produto de matrizes (neste caso, produto escalar)
# Outra forma de escrever a mesma coisa
print(vec1.dot(vec2))

## Bora praticar!

Fonte: https://github.com/rougier/numpy-100/blob/master/100_Numpy_exercises.ipynb


1) Inverta um vetor (o primeiro elemento vira o último). Para testar crie um vetor a partir da seguinte lista [0, 5, 1, 9, 9, 87]

2) Crie um vetor com valores que vão de 1 até 21 de dois em dois, a partir da função arange

3) Ache os índices dos elementos não-zero a partir do array [1,2,0,0,4,0]

E se a gente quisesse pegar os elementos diferentes de zero?

4) Crie uma matriz identidade 3x3 (★☆☆)

5) Crie um array de 10 com valores aleatórios

6) Crie um array 100 com valores aleatórios e ache os valores máximo e mínimo

7) Crie um array 2D (bidimensional) com 1 na borda e 0 dentro

8 - Como adicionar uma borda de 0's ao redor de um array existente?

A gente consegue usar uma lógica semelhante à de cima.

9) Crie uma matriz 5x5 com valores 1, 2, 3, 4 logo abaixo da diagonal