# NumPy e Representação de Dados

O pacote **[NumPy](https://numpy.org/)** é a base da análise de dados, *machine learning* e computação científica no ecossistema **Python**. Simplifica bastante a manipulação de vetores e matrizes. Alguns dos principais pacotes do Python contam com o NumPy como uma peça fundamental de sua infraestrutura (exemplos incluem Scikit-Learn, SciPy, Pandas e Tensorflow). Além da capacidade de dividir e cortar dados numéricos, o domínio de **NumPy** fornecerá uma vantagem ao lidar e depurar com casos de uso avançados nessas bibliotecas.

Começamos importando a biblioteca necessária para as demonstrações

In [1]:
import numpy as np

### Criando Arrays

Podemos criar uma matriz **NumPy** (também conhecida como o poderoso **ndarray**) passando uma lista Python para a função `np.array ()`

In [127]:
x = np.array([1,2,3])
x

array([1, 2, 3])

Veja como ele nos retorna um objeto do tipo **numpy.ndarray**

In [128]:
type(x)

numpy.ndarray

Geralmente, há casos em que queremos que o **NumPy** inicialize os valores da matriz para nós. O **NumPy** fornece métodos como `ones()`, `zeros()` e `random.random()` para esses casos. Apenas passamos a eles o número de elementos que desejarmos que ele gere

In [3]:
np.ones(3)

array([1., 1., 1.])

In [129]:
np.zeros(5)

array([0., 0., 0., 0., 0.])

In [130]:
np.random.random(8)

array([0.6664358 , 0.40425497, 0.44749025, 0.04235985, 0.52422784,
       0.05865532, 0.864587  , 0.39709288])

### Aritmética de Arrays

Vamos agora criar dois **arrays NumPy** para testarmos operações matemáticas

In [35]:
dados = np.array([2,4])
um = np.ones(2)

print(f'{dados} , {um}')

[2 4] , [1. 1.]


In [31]:
# Soma
dados + um

array([3., 5.])

In [12]:
# Subtração
dados - um

array([1., 3.])

In [13]:
# Multiplicação
dados * dados

array([ 4, 16])

In [14]:
# Divisão
dados / dados

array([1., 1.])

Geralmente, há casos em que queremos realizar uma operação entre uma matriz e um único número (também podemos chamar isso de operação entre um vetor e um escalar)

In [15]:
# Multiplicação por escalar (1.3)
dados * 1.3

array([2.6, 5.2])

### Indexando Arrays

Podemos indexar e dividir **matrizes NumPy** de todas as maneiras que podemos dividir as listas Python

In [19]:
arr = np.array([1,2,3,4,5])

In [20]:
arr[0]

1

In [21]:
arr[1]

2

In [22]:
arr[0:2]

array([1, 2])

In [23]:
arr[1:]

array([2, 3, 4, 5])

### Agregação de Arrays

Benefícios adicionais que o NumPy nos fornece são as funções de agregação

In [24]:
# Maior número do array
arr.max()

5

In [25]:
# Menor número do array
arr.min()

1

In [26]:
# Soma de todos os valores do array
arr.sum()

15

In [132]:
# Calcula a média dos valores do array
arr.mean()

3.0

In [134]:
# Nos retorna o resultado da multiplicação de todos os elementos
arr.prod()

120

In [136]:
# Computa o Desvio Padrão
arr.std()

1.4142135623730951

In [138]:
# Computa a Variância
arr.var()

2.0

### Trabalhando com mais Dimensões

Todos os exemplos que analisamos lidam com vetores em uma dimensão. Uma parte essencial da beleza do NumPy é sua capacidade de aplicar tudo o que examinamos até agora a qualquer número de dimensões.

Vamos então trabalhar com Matrizes que possuem 2 Dimensões

#### Criando uma Matriz

Para criarmos uma matriz podemos passar uma lista de listas Python para a função `np.array()`

In [29]:
matriz = np.array([[1,2,3],[4,5,6]])

In [30]:
matriz

array([[1, 2, 3],
       [4, 5, 6]])

Podemos utilizar todos os métodos vistos anteriormente com vetores

In [36]:
np.ones((3,2))

array([[1., 1.],
       [1., 1.],
       [1., 1.]])

In [37]:
np.zeros((3,2))

array([[0., 0.],
       [0., 0.],
       [0., 0.]])

In [38]:
np.random.random((3,2))

array([[0.11037176, 0.2709964 ],
       [0.49119163, 0.20484127],
       [0.0323987 , 0.05944261]])

#### Aritmética de Matrizes

Podemos adicionar e multiplicar matrizes usando operadores aritméticos `(+ - * /)` se as duas matrizes tiverem o mesmo tamanho. O NumPy lida com eles como operações de posição

In [62]:
# Começamos definindo duas matrizes
m = np.array([[1,2],[4,8]])
u = np.ones((2,2))
v = np.array([2,2])

In [63]:
# Matriz m
m

array([[1, 2],
       [4, 8]])

In [64]:
# Matriz u
u

array([[1., 1.],
       [1., 1.]])

In [65]:
# Vetor v
v

array([2, 2])

In [66]:
# Adição
m + u

array([[2., 3.],
       [5., 9.]])

In [67]:
m + v

array([[ 3,  4],
       [ 6, 10]])

In [68]:
# Subtração
m - u

array([[0., 1.],
       [3., 7.]])

In [69]:
# Multiplicação
m * u

array([[1., 2.],
       [4., 8.]])

In [70]:
m * v

array([[ 2,  4],
       [ 8, 16]])

In [71]:
# Divisão 
m / u

array([[1., 2.],
       [4., 8.]])

In [72]:
m / v

array([[0.5, 1. ],
       [2. , 4. ]])

### Produto Escalar

Uma distinção importante a ser feita com aritmética é o caso da multiplicação de matrizes usando o produto escalar. O **NumPy** fornece a cada matriz um método `dot()` que podemos usar para executar operações de produtos com outras matrizes

In [74]:
# Matriz m
m 

array([[1, 2],
       [4, 8]])

In [75]:
# Matriz u
u

array([[1., 1.],
       [1., 1.]])

In [76]:
# Matriz v
v

array([2, 2])

In [77]:
np.dot(m, u)

array([[ 3.,  3.],
       [12., 12.]])

In [86]:
m.dot(u)

array([[ 3.,  3.],
       [12., 12.]])

In [78]:
np.dot(m, v)

array([ 6, 24])

In [87]:
m.dot(v)

array([ 6, 24])

In [79]:
np.dot(u, v)

array([4., 4.])

In [88]:
u.dot(v)

array([4., 4.])

In [83]:
sum(m)

array([ 5, 10])

In [84]:
sum(u)

array([2., 2.])

In [85]:
sum(v)

4

### Indexando Matrizes

In [89]:
m

array([[1, 2],
       [4, 8]])

In [96]:
m[0,1] # elemento: primeira linha, segunda coluna

2

In [97]:
m[1:3] # todos os elementos da segunda linha

array([[4, 8]])

In [98]:
m[0] # todos os elementos da primeira linha

array([1, 2])

In [95]:
m[0,0] # elemento: primeira linha, primeira coluna

1

In [99]:
m[0:2, 0] # todos os elementos da primeira coluna

array([1, 4])

In [103]:
m[0:2, 1] # todos os elementos da segunda coluna

array([2, 8])

### Agregação de Matrizes

In [107]:
m

array([[1, 2],
       [4, 8]])

In [108]:
m.max()

8

In [111]:
m.max(axis=0)

array([4, 8])

In [109]:
m.min()

1

In [113]:
m.min(axis=1)

array([1, 4])

In [110]:
m.sum()

15

In [114]:
m.sum(axis=0)

array([ 5, 10])

In [115]:
m.sum(axis=1)

array([ 3, 12])

### Transposição e Remodelação

Uma necessidade comum ao lidar com matrizes é a necessidade de rotacioná-las. Geralmente, esse é o caso quando precisamos pegar o produto escalar de duas matrizes e alinhar a dimensão que elas compartilham. As matrizes NumPy têm uma propriedade conveniente chamada `T` para obter a transposição de uma matriz

In [116]:
matrix = np.array([[1,2],[3,4],[5,6]])

In [117]:
matrix

array([[1, 2],
       [3, 4],
       [5, 6]])

In [118]:
matrix.T

array([[1, 3, 5],
       [2, 4, 6]])

In [119]:
vetor = np.array([1,2,3,4,5,6])

In [120]:
vetor

array([1, 2, 3, 4, 5, 6])

Em casos de uso mais avançados, você pode precisar mudar as dimensões de uma determinada matriz. Esse é geralmente o caso em aplicativos de **machine learning** em que um determinado modelo espera uma certa forma para as entradas diferentes do seu conjunto de dados. O método `reshape()` do **NumPy** é útil nesses casos. Você apenas passa as novas dimensões que deseja para a matriz. Você pode passar -1 para uma dimensão e o NumPy pode inferir a dimensão correta com base na sua matriz:

In [121]:
vetor.reshape(2,3)

array([[1, 2, 3],
       [4, 5, 6]])

In [125]:
vetor.reshape(3,2)

array([[1, 2],
       [3, 4],
       [5, 6]])