<img src="https://s3-sa-east-1.amazonaws.com/preditiva.ai/diversos/preditiva_assinatura.jpg">

# Introdução ao Numpy 

Vamos falar sobre o Numpy, a biblioteca que é, basicamente, o coração de todo o ecosistema de ferramentas de Data Science do Python. O Numpy possibilita armazenar e manipular dados de forma muito mais eficiente do que Python com seus tipos de dados padrões (como as listas). Isso porque o Numpy utiliza linguagens com melhor performance em sua construção, como a linguagem C e Fortran, por exemplo.

![image.png](attachment:c1e48aa6-a1ae-45a8-82d6-b16ce11d7c8d.png)

## Criando Arrays (matrizes) através de Listas

Uma array, ou matriz, é uma estrutura de dados com linhas e colunas. Já vimos essas estruturas nas aulas de Álgebra Linear. O Numpy é uma biblioteca que permite criar matrizes numéricas de qualquer tipo de forma eficiente. Vejamos como isso é feito.

In [2]:
import numpy as np # np é a forma habital de chamar a biblioteca

In [3]:
lista = [1,2,3,4,5,6,7,8,9]
lista

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [6]:
array = np.array(lista)

In [7]:
array

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

Ao contrário das listas do Python, as matrizes do Numpy só podem ter um tipo de dados. Ex: Todos inteiros, todos Floats etc.

In [5]:
np.array(lista,dtype='float32') # forçando que os número da lista sejam float

array([1., 2., 3., 4., 5., 6., 7., 8., 9.], dtype=float32)

Podemos também criar matrizes com mais de uma linha. Vejamos:

In [None]:
lista2 = [x*2 for x in lista] #List Comprehension
lista2

In [None]:
np.array([lista,lista2]) # cria uma matriz 2 x 9 (2 linhas e 9 colunas)

## Criando Arrays do zero

In [8]:
# Cria uma matriz de zeros
np.zeros(10)

array([0., 0., 0., 0., 0., 0., 0., 0., 0., 0.])

In [9]:
# Cria uma matrix de n linhas e m colunas de numeros 1. Ex: Matriz 3 x 4
np.ones( (3,4) )

array([[1., 1., 1., 1.],
       [1., 1., 1., 1.],
       [1., 1., 1., 1.]])

In [10]:
# Cria uma matrix de n linhas e m colunas de valores escolhidos. Ex: Matriz 3 x 4
np.full((3,4),10,dtype='float32')

array([[10., 10., 10., 10.],
       [10., 10., 10., 10.],
       [10., 10., 10., 10.]], dtype=float32)

In [12]:
# a mesma matriz acima poderia ser criada multiplicando por 10 a matriz np.ones
np.ones((3,4))*10

array([[10., 10., 10., 10.],
       [10., 10., 10., 10.],
       [10., 10., 10., 10.]])

In [15]:
# Cria uma matriz que contém números em uma data sequencia. Ex: Numeros de 0 a 10 pulando de 2 em 2.
np.arange(0,10,3)

array([0, 3, 6, 9])

### Podemos criar matrizes usando distribuições de probabilidade também. Vejamos alguns exemplos.

In [24]:
# Cria matriz 2x5 usando a distribuição Uniforme (valores de 0 a 1)
np.random.random((2,5))

array([[0.24875591, 0.16306678, 0.78364326, 0.80852339, 0.62562843],
       [0.60411363, 0.8857019 , 0.75911747, 0.18110506, 0.15016932]])

In [28]:
# Cria matriz 3x3 de números inteiros usando a distribuição Uniforme (com valores de 5 a 20)
np.random.randint(5,200,(3,3))

array([[ 90, 139,  49],
       [ 49,  54, 176],
       [144,  26,  95]])

In [40]:
# Cria matriz usando 2x2 a distribuição Normal (média 2 e desvio padrao 5)
matriz = np.random.normal(2,5,10000)

In [41]:
matriz.mean()

1.964134213292311

<strong>Dica</strong>: Lembre-se que essas distribuições de probabilidade retornar números aleatórios. Se precisar que suas matriz retornem sempre os mesmos valores, é necessário determinar a semente. No Numpy, a função para isso é np.random.seed(). Veja:

In [None]:
np.random.seed(546546546)
np.random.random((2,5))

## Acessando elementos da matriz

Vamos falar agora de uma série de formas de se acessar determinados elementos de uma matriz. Veja:

In [42]:
linha = np.arange(10)+10
linha

array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19])

In [43]:
linha[:3] # acessa os primeiros 3 elementos (da esquerda para a direita)

array([10, 11, 12])

In [45]:
linha[3:5] # acessa o elemento de indice 3 até o elemento de indice 4 (o elemento 5 não é incluído)

array([13, 14])

In [None]:
linha[5:] # acessa a partir do elemento de indice 5

In [None]:
np.random.seed(3)
matriz = np.random.randint(5,50,(3,3))
matriz

In [None]:
matriz[0,0] # elemento da linha 0 e coluna 0. Lembrando que os índices das linhas e colunas começam no 0 (zero).

In [None]:
matriz[1,2]

In [None]:
matriz[:2,:] # acessa as primeiras duas linhas e todas as colunas

In [None]:
matriz[2:,:2] # acessa a partir da linha de indice 2 (2:) até a coluna de indice 1 (:2). Ou seja, a coluna de indice 2 não é incluída

## Concatenando elementos da matriz

Uma operação importante em matriz é a concatenação, ou seja, o empilhamento de linhas e colunas de matrizes diferentes para formar uma só. Veja:

In [None]:
linha1 = np.array([1,2,3])
linha2 = np.array([4,5,6])

In [None]:
linha1

In [None]:
linha2

In [None]:
np.concatenate([linha1,linha2]) # junta as linhas uma ao lado da outra

In [None]:
np.vstack([linha1,linha2]) # junta as linhas uma embaixo da outra

# Operações matemáticas e de comparação no Numpy

Como qualquer linguagem de programação, precisamos realizar contas e operações de comparação com os tipos de dados. Veja as principais:

## Operações matemáticas

In [None]:
lista = np.arange(-5,5,1)
lista

In [None]:
# soma 2 a cada elemento da matriz
lista + 2 

In [None]:
# multiplica 2 a cada elemento da matriz
lista * 2 

In [None]:
# divide por 2 a cada elemento da matriz
lista / 2 

In [None]:
# eleva ao quadrado (potencia de 2) a cada elemento da matriz
lista ** 2 

In [None]:
# retorna o valor absoluto
abs(lista)

In [None]:
lista = np.arange(1,10)
lista

In [None]:
# retorna o logaritmo natural ln(x) de cada número
np.log(lista)


<br>
Existem várias outras funções matemáticas. Seguem algumas:

<br>Funções trigonométricas:

- np.sin(x)
- np.cos(x)
- np.tan(x)

Funções logarítmicas:

- np.log2(x)
- np.log10(x)

## Operações de comparação

In [46]:
lista = np.arange(10)
lista

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [47]:
lista > 4 # Com o operador > (maior) o Numpy faz a comparação em cada elemento da matriz "linha" retorna uma nova matriz com os resultados

array([False, False, False, False, False,  True,  True,  True,  True,
        True])

A mesma lógica funciona para todos os outros operadores de comparação. São eles:

- "<" (menor)
- "<=" (menor ou igual)
- ">=" (maior ou igual)
- "==" (igual)
- "!=" (diferente)

Podemos inclusive contar os valores <b>True</b> de uma matriz. Veja:

In [48]:
np.sum(lista > 4) # Usamos a função de agregação "sum" (soma) para isso. Vamos entender quais funções de agregação estão disponíveis abaixo.

5

# Funções de Agregação no Numpy

Nesta última seção, vamos falar das funções de agregação (em geral, as medidas resumo da estatística). Vejamos:

In [49]:
np.random.seed(0)
lista = np.random.randint(1,10,5)

In [50]:
lista

array([6, 1, 4, 4, 8])

In [51]:
np.sum(lista) # soma os elementos da matriz

23

In [52]:
np.mean(lista) # retorna a média dos elementos da matriz

4.6

In [53]:
np.percentile(lista,75) # retorna o percentil 75% (ou Q3) da matriz

6.0

Seguem outra funções de agregação:

| Função | Descrição |
| ------ | ------ |
| np.median(M) | Retorna a mediana dos elementos da matrix M |
| np.prod(M) | Retorna o produto dos elementos da matrix M |
| np.var(M) | Retorna a variancia dos elementos da matrix M |
| np.std(M) | Retorna o desvio padrao dos elementos da matrix M |
| np.min(M) | Retorna o mínimo da matrix M |
| np.max(M) | Retorna o máximo da matrix M |

As funções de agregação também funciona nas linhas ou colunas de uma matriz. Veja:

In [None]:
np.random.seed(0)
lista = np.random.randint(1,10,(2,4))
lista

In [None]:
np.sum(lista,axis=0) # retorna uma matriz com a soma dos elementos de cada coluna (axis = 0) da matriz 

In [None]:
np.sum(lista[:1],axis=1) # retorna uma matriz com a soma dos elementos de cada linha (axis = 1) da matriz 

Chegamos ao fim de mais uma seção. O Numpy tem uma série de outras características que não foram cobertas aqui. Eventualmente, ao longo do curso vamos nos deparar com novas funções deste pacote. Quando for necessário, acesse a documentação original em https://numpy.org/doc/stable/ ou busque sua dúvida no StackOverflow (uma das maiores fontes de conhecimento em programação da internet).

Na próxima aula, vamos falar sobre o <b>Pandas</b>! Até lá !!!