<!--NAVIGATION-->
< [Módulos](15.Modulos.ipynb) | [Sumario](00.Sumario.ipynb) | [Pandas](17.Pandas.ipynb) >

<a href="https://colab.research.google.com/github/psloliveirajr/Introducao_a_Python3/blob/master/16.Numpy.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>

## Numpy

NumPy (abreviação de Numerical Python) fornece um tipo de objeto eficiente para armazenar e operar uma quantidade densa de dados. Esse novo tipo de objeto são chamados de matrizes (**arrays**) que podem ter n-dimensões.

### Relembrando  listas

As listas (**list**) são sequências mutáveis, podendo conter multiplos elementos.

In [None]:
# Nos podemos criar uma listas de numeros do tipo inteiro
L1 = list(range(10))
L1

In [None]:
type(L1),type(L1[0])

In [None]:
# Podemos criar também uma lista de stings
L2 = ["0", "1", "2", "3", "4", "5", "6", "7", "8", "9"]
L2

In [None]:
type(L2),type(L2[0])

In [None]:
# Por ser uma lingugem de tipagem dinamica podemos criar uma lista heterogenia
L3 = [True, "2", 3.0, 4]
type(L3),type(L3[0]),type(L3[1]),type(L3[2]),type(L3[3])

Mas essa flexiblidade tem um custo que acaba por diminuir a eficiência dessa estrutura de armazenamento de dados, então em casos onde se é necessário utilizar somente um só tipo de objeto é mais eficiente armazenar esses elementos em uma matriz de tipo fixo.

### Criando matrizes


In [None]:
# Primeiro devemos importar o modulo
import numpy as np

#### Matrizes a partir de lista

Podemos criar uma array com uma lista do python:

In [None]:
np.array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

Lembre-se de que, ao contrário das listas do Python, NumPy é restrito a matrizes que contêm o mesmo tipo. Se os tipos não corresponderem, o NumPy fará, se possível, a conversão dos valores:

In [None]:
# Os inteiros são convertidos em ponto flutuante
np.array([1.5,2,3,4])

Se quisermos definir explicitamente o tipo de dados da matriz resultante, podemos usar a palavra-chave **dtype**:

In [None]:
np.array([1, 2, 3, 4], dtype='float')

#### Matrizes do zero

Especialmente para matrizes maiores, é mais eficiente criar matrizes do zero usando funções integradas ao NumPy. Aqui estão vários exemplos:

In [None]:
# Cria uma matriz de 10 valores 0 do tipo inteiro
np.zeros(10, dtype=int)

In [None]:
# Cria uma matriz 3x5 de valores 1 do tipo float
np.ones((3, 5), dtype=float)

In [None]:
# Cria uma matriz 3x5 de valores 3.14 
np.full((3, 5), 3.14)

In [None]:
# Cria uma matriz com uma sequencia de valores lineares
# Começando em 0, terminando em 20, com passo de 2
# (e similar a funcao range())
np.arange(0, 20, 2)

In [None]:
# Crie uma matriz de cinco valores uniformemente espaçados entre 0 e 1
np.linspace(0, 1, 5)

In [None]:
# Cria uma matriz 3x3 de valores aleatorios
# valores aleatorios entre 0 e 1
np.random.random((3, 3))

In [None]:
# Crie uma matriz 3x3 de valores aleatórios normalmente distribuídos
# com média 0 e desvio padrão 1, neste caso que dizer valores possivelmente entre -1 e 1
np.random.normal(0, 1, (3, 3))

In [None]:
# Crie uma matriz 3x3 de valores inteiros aleatórios no intervalo [0, 10)
np.random.randint(0, 10, (3, 3))

In [None]:
# Crie uma matriz de identidade 3x3
np.eye(3)

In [None]:
# Crie uma matriz sem inicializar entradas.
np.empty(1)

### O básico de matrizes NumPy

A manipulação de dados em Python é quase sinônimo de manipulação de matrizes NumPy: mesmo as ferramentas mais recentes como Pandas são construídas em torno do array NumPy. Vamos ver alguns exemplos de como usar a manipulação de matrizes NumPy para acessar dados e submatrizes e para dividir, remodelar e unir as matrizes.

Cobriremos algumas categorias de manipulações básicas de matrizes aqui:

- *Atributos de matrizes*: Determinar o tamanho, forma, consumo de memória e tipos de dados de matrizes
- *Indexação de matrizes*: obter e definir o valor de elementos individuais da matriz
- *Fatiamento de matrizes*: obtenção e configuração de submatrizes menores em uma matriz maior
- *Remodelagem de matrizes*: Alterar a forma de uma determinada matriz
- *Junção e divisão de matrizes*: combinar várias matrizes em uma e dividir uma matriz em várias

#### Atributos de matriz NumPy

Começaremos definindo três matrizes aleatórios, um matrizes unidimensional, bidimensional e tridimensional. Usaremos o gerador de número aleatório do NumPy

In [None]:
import numpy as np

x1 = np.random.randint(10, size=6)  # matriz unidimensional
x2 = np.random.randint(10, size=(3, 4))  # matriz bidimensional
x3 = np.random.randint(10, size=(3, 4, 5))  # matriz tridimensional

Cada matriz tem atributos ``ndim`` (o número de dimensões), ``shape`` (o tamanho de cada dimensão) e ``size`` (o tamanho total das matrizes):

In [None]:
print("x3 ndim: ", x3.ndim)
print("x3 shape:", x3.shape)
print("x3 size: ", x3.size)

Outro atributo útil é o **dtype**, o tipo de dados da matriz.

In [None]:
print("dtype:", x3.dtype)

#### Indexação de matriz: acessando elementos únicos

Em uma matriz unidimensional, o valor $ i ^ {th} $ (contando a partir do zero) pode ser acessado especificando-se o índice desejado entre colchetes, assim como nas listas Python:

In [None]:
x1

In [None]:
x1[0]

In [None]:
x1[4]

Para indexar a partir do final da matriz, você podemos usar índices negativos:

In [None]:
x1[-1]

In [None]:
x1[-2]

Em uma matriz multidimensional, os itens podem ser acessados usando uma tupla de índices separados por vírgulas:

In [None]:
x2

In [None]:
x2[0, 0]

In [None]:
x2[2, 0]

In [None]:
x2[2, -1]

Os valores também podem ser modificados usando qualquer uma das notações de índice acima:

In [None]:
x2[0, 0] = 12
x2

Lembre-se de que, ao contrário das listas Python, os as matrizes NumPy têm um tipo fixo. Isso significa, por exemplo, que se você tentar inserir um valor de ponto flutuante em uma matriz de inteiros, o valor será truncado silenciosamente. Não seja pego de surpresa por esse comportamento!

In [None]:
x1[0] = 3.14159  # isso será truncado!
x1

#### Fatiamento de matriz: acessando submatrizes

Assim como podemos usar colchetes para acessar elementos individuais da matriz, também podemos usá-los para acessar submatrizes com a notação de *fatiamento*, marcada pelo caractere dois pontos (``:``). A sintaxe de fatiamento NumPy segue aquela da lista Python padrão; para acessar uma fatia de um array `` x``, use isto:
``` python
x [iniciar: parar: passo]
```
Se algum deles não for especificado, eles assumem os valores `` iniciar = 0``, `` parar = `` *``tamanho da dimensão``*, `` passo = 1``. Vamos dar uma olhada no acesso a submatrizes em uma dimensão e em várias dimensões.

##### Submatrizes unidimensionais

In [None]:
x = np.arange(10)
x

In [None]:
x[:5]  # primeiros cinco elementos

In [None]:
x[5:]  # elementos após o índice 5

In [None]:
x[4:7]  # meio da matriz

In [None]:
x[::2]  # todos os elemento a cada 2 passos

In [None]:
x[1::2]  # todos os elemento a cada 2 passos, começando do indice 1

Um caso potencialmente confuso é quando o valor ``passo`` é negativo. Neste caso, os padrões para ``iniciar`` e `` parar`` são trocados. Esta se torna uma maneira conveniente de reverter uma matriz:

In [None]:
x[::-1]  # todos elementos, inversos

In [None]:
x[5::-2]  # elementos inversos a partir do 5, a cada 2 passos

##### Submatrizes multidimensionais

As fatias multidimensionais funcionam da mesma maneira, com várias fatias separadas por vírgulas. Por exemplo:

In [None]:
x2

In [None]:
x2[:2, :3]  # duas linhas, três colunas

In [None]:
x2[:3, ::2]  # todas as linhas, todas as outras colunas a cada 2 passos

Finalmente, as dimensões do subarray podem ser revertidas juntas:

In [None]:
x2[::-1, ::-1]

##### Acessando linhas e colunas da matriz

Podemos acessar as linhas ou colunas únicas de um array. Isso pode ser feito combinando indexação e fracionamento, usando uma fatia vazia marcada por um único dois pontos (``:``):

In [None]:
print(x2[:, 0])  # primeira coluna de x2

In [None]:
print(x2[0, :])  # primeira linha de x2

No caso de acesso à linha, a fatia vazia pode ser omitida para uma sintaxe mais compacta:

In [None]:
print(x2[0])  # equivalent to x2[0, :]

##### Submatrizes como visualizações sem cópia

Uma coisa importante - e extremamente útil - a saber sobre as fatias da matriz é que elas retornam *visualizações* em vez de *cópias* dos dados da matriz. Esta é uma área em que o fatiamento da matriz NumPy difere do fatiamento de lista do Python: nas listas, as fatias serão cópias. Considere nossa matriz bidimensional anterior:

In [None]:
print(x2)

Vamos extrair um submatriz $2\times 2$ deste:

In [None]:
x2_sub = x2[:2, :2]
print(x2_sub)

Agora, se modificarmos esta submatriz, veremos que a matriz original foi alterado! Observar:

In [None]:
x2_sub[0, 0] = 84
print(x2_sub)

In [None]:
print(x2)

Na verdade, esse comportamento padrão é bastante útil: significa que, quando trabalhamos com grandes conjuntos de dados, podemos acessar e processar partes desses conjuntos de dados sem a necessidade de copiar o buffer de dados subjacente.

##### Criando cópias de matrizes

Apesar dos recursos interessantes das visualizações de matrizes, às vezes é útil copiar explicitamente os dados dentro de um array ou subarray. Isso pode ser feito mais facilmente com o método `` copy () ``:

In [None]:
x2_sub_copy = x2[:2, :2].copy()
print(x2_sub_copy)

Se agora modificarmos esta submatriz, a matriz original não será tocada:

In [None]:
x2_sub_copy[0, 0] = 42
print(x2_sub_copy)

In [None]:
print(x2)

#### Remodelagem de matrizes

Outro tipo de operação útil é a remodelagem de matrizes.
A maneira mais flexível de fazer isso é com o método `` reshape``.

Por exemplo, se você deseja colocar os números de 1 a 9 em uma grade $ 3 \times 3 $, você pode fazer o seguinte:

In [None]:
grid = np.arange(1, 10).reshape((3, 3))
print(grid)

#### Concatenação e divisão de matriz

Tudo oque fizemos anteriormente funcionaram em matrizes únicas. Também é possível combinar vários matrizes em um e, inversamente, dividir uma única matriz em várias matrizes. Vamos dar uma olhada nessas operações aqui.

##### Concatenação de matrizes

A concatenação, ou junção de duas matrizes em NumPy, é realizada principalmente usando as funções `` np.concatenate``, `` np.vstack`` e `` np.hstack``.

`` np.concatenate`` recebe uma tupla ou lista de matrizes como seu primeiro argumento, como podemos ver:

In [None]:
x = np.array([1, 2, 3])
y = np.array([3, 2, 1])
np.concatenate([x, y])

Você também pode concatenar mais de duas matrizes de uma vez:

In [None]:
z = [99, 99, 99]
print(np.concatenate([x, y, z]))

Também pode ser usado para matrizes bidimensionais:

In [None]:
grid = np.array([[1, 2, 3],
                 [4, 5, 6]])

In [None]:
# concatenar ao longo da linha
np.concatenate([grid, grid],axis=0)

In [None]:
# concatenar ao longo da coluna
np.concatenate([grid, grid], axis=1)

Para trabalhar com matrizes de dimensões mistas, pode ser mais claro usar as funções `` np.vstack`` (pilha vertical) e `` np.hstack`` (pilha horizontal):

In [None]:
x = np.array([1, 2, 3])
grid = np.array([[9, 8, 7],
                 [6, 5, 4]])

# empilhar verticalmente as matrizes
np.vstack([x, grid])

In [None]:
y = np.array([[99],
              [99]])
# empilhar horizontalmente as matrizes
np.hstack([grid, y])

Da mesma forma, `` np.dstack`` irá empilhar arrays ao longo do terceiro eixo.

##### Divisão de matrizes

O oposto da concatenação é a divisão, que é implementada pelas funções `` np.split``, `` np.hsplit`` e `` np.vsplit``. Para cada um deles, podemos passar uma lista de índices dando os pontos de divisão:

In [None]:
x = [1, 2, 3, 99, 99, 3, 2, 1]
x1, x2, x3 = np.split(x, [3, 5])
print(x1, x2, x3)

Observe que *N* pontos de divisão leva a *N + 1* submatrizes.

As funções relacionadas `` np.hsplit`` e `` np.vsplit`` são semelhantes:

In [None]:
grid = np.arange(16).reshape((4, 4))
grid

In [None]:
# divide a vertical das matrizes
upper, lower = np.vsplit(grid, [2])
print(upper)
print()
print(lower)

In [None]:
# divide o horizontal das matrizes
left, right = np.hsplit(grid, [2])
print(left)
print()
print(right)

Da mesma forma, `` np.dsplit`` irá dividir matrizes ao longo do terceiro eixo.

### Operações em matrizes

Todas as operações tem funções universais (funções que funciona em qualquer matriz de n-dimensões).

#### Aritmética de matriz

A adição, subtração, multiplicação e divisão padrão podem ser usados em matrizes:

In [None]:
x = np.arange(4)
print("x     =", x)
print("x + 5 =", x + 5)
print("x - 5 =", x - 5)
print("x * 2 =", x * 2)
print("x / 2 =", x / 2)
print("x // 2 =", x // 2)

Há também unário para negação e um operador `` ** `` para exponenciação e um operador ``% `` para resto:

In [None]:
print("-x     = ", -x)
print("x ** 2 = ", x ** 2)
print("x % 2  = ", x % 2)

Além disso, eles podem ser amarrados da maneira que você desejar, e a ordem padrão das operações é respeitada:

In [None]:
-(0.5*x + 1) ** 2

A tabela a seguir lista os operadores aritméticos implementados no NumPy:

| Operador | Ufunc equivalente | Descrição
| --------------- | --------------------- | ----------- ---------------------------- |
| `` + `` | `` np.add`` | Adição (por exemplo, `` 1 + 1 = 2``) |
| `` -`` | `` np.subtract`` | Subtração (por exemplo, `` 3 - 2 = 1``) |
| `` -`` | `` np.negative`` | Negação unária (por exemplo, `` -2``) |
| `` * `` | `` np.multiply`` | Multiplicação (por exemplo, `` 2 * 3 = 6``) |
| `` / `` | `` np.divide`` | Divisão (por exemplo, `` 3/2 = 1,5``) |
| `` // `` | `` np.floor_divide`` | Divisão inteira (por exemplo, `` 3 // 2 = 1``) |
| `` ** `` | `` np.power`` | Exponenciação (por exemplo, `` 2 ** 3 = 8``) |
| ``% `` | `` np.mod`` | Módulo / resto (por exemplo, `` 9% 4 = 1``) |

#### Comparação em matriz

NumPy também implementa operadores de comparação como `` <`` (menor que) e ``> `` (maior que).
O resultado desses operadores de comparação é sempre uma matriz com um tipo de dados booleano.
Todas as seis operações de comparação padrão estão disponíveis:

In [None]:
x = np.array([1, 2, 3, 4, 5])

In [None]:
x < 3  # menor que

In [None]:
x > 3  # maior que

In [None]:
x <= 3  # menor ou igual

In [None]:
x >= 3  # maior ou igual

In [None]:
x != 3  # não igual

In [None]:
x == 3  # equal

Também é possível fazer uma comparação de elementos de duas matrizes e incluir expressões compostas:

In [None]:
(2 * x) == (x ** 2)

Um resumo dos operadores de comparação e seu ufunc equivalente é mostrado aqui:

| Operador | Ufunc equivalente |
| -- | -- |
| `` == `` | `` np.equal`` |
| `` <`` | `` np.less`` |
| ``> `` | `` np.greater`` |
| ``! = `` | `` np.not_equal`` |
| `` <= `` | `` np.less_equal`` |
| ``> = `` | `` np.greater_equal`` |

<!--NAVIGATION-->
< [Módulos](15.Modulos.ipynb) | [Sumario](00.Sumario.ipynb) | [Pandas](17.Pandas.ipynb) >

<a href="https://colab.research.google.com/github/psloliveirajr/Introducao_a_Python3/blob/master/16.Numpy.ipynb"><img align="left" src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open in Colab" title="Open and Execute in Google Colaboratory"></a>