# Numpy

O Numpy (ou Numerical Python) é a biblioteca de Python de álgebra linear. Pela qual será possível trabalhar com vetores e matrizes. Eu falei brevemente de Numpy no material de Módulos, porém aqui me profundarei mais em algumas das coisas que podemos fazer com este módulo, apresentando também algumas das funções que o acompanham. <br><br> 

Caso deseje ter acesso à documentação do Numpy, onde você poderá encontrar a respeito de tudo que é possível fazer com essa biblioteca, favor visite:

**[Documentação Oficial do Numpy](http://docs.scipy.org/doc/numpy-1.10.1/user/install.html)**

## Utilizando o Numpy

Após seguir as orientações sobre como fazer o download de pacotes no outro material. Você poderá importar o Numpy da seguinte forma:

In [2]:
import numpy as np

## Arrays

Arrays são os principais objetos que abordaremos, podendo ser divididos em vetores ou matrizes (1d e 2d, respectivamente). <br><br>

Vamos falar de algumas formas pelas quais podemos criar arrays:

In [3]:
# Arrays podem ser criados a partir de listas:
lista = [1, 2, 3, 4, 5]
arr = np.array(lista)

In [4]:
arr

array([1, 2, 3, 4, 5])

In [5]:
type(arr)

numpy.ndarray

In [6]:
# Acima criei um array unidimensional
# Matrizes 2d são criadas a partir de lista de listas, veja:
lista_de_listas = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
mat = np.array(lista_de_listas)
mat

array([[1, 2, 3],
       [4, 5, 6],
       [7, 8, 9]])

In [7]:
type(mat)

numpy.ndarray

## Funções para criar arrays

Como eu havia dito, vou apresentar algumas funções que vem junto com o numpy. Algumas delas podem ser usadas para criar diferentes tipos de arrays:

In [8]:
# A função arange funciona semelhante à função range, do Python Vanilla
np.arange(0,10)

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [9]:
np.arange(0,11,2)

array([ 0,  2,  4,  6,  8, 10])

In [10]:
# Função Zeros e Ones para criar arrays com zeros e uns:
np.zeros(2)

array([0., 0.])

In [11]:
np.zeros((5,5))

array([[0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.],
       [0., 0., 0., 0., 0.]])

In [12]:
np.ones((4,6))

array([[1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.],
       [1., 1., 1., 1., 1., 1.]])

Essas funções são interessantes para quando quisermos criar algum array de um número repetido qualquer, veja como isso pode ser feito:

In [13]:
np.ones((5,5)) * 5

array([[5., 5., 5., 5., 5.],
       [5., 5., 5., 5., 5.],
       [5., 5., 5., 5., 5.],
       [5., 5., 5., 5., 5.],
       [5., 5., 5., 5., 5.]])

In [14]:
np.zeros((3,3)) + 5

array([[5., 5., 5.],
       [5., 5., 5.],
       [5., 5., 5.]])

Temos a função **linspace()** que nos retorna números igualmente espaçados dentro de um intervalo. Veja:

In [15]:
np.linspace(0.01,1,100)

array([0.01, 0.02, 0.03, 0.04, 0.05, 0.06, 0.07, 0.08, 0.09, 0.1 , 0.11,
       0.12, 0.13, 0.14, 0.15, 0.16, 0.17, 0.18, 0.19, 0.2 , 0.21, 0.22,
       0.23, 0.24, 0.25, 0.26, 0.27, 0.28, 0.29, 0.3 , 0.31, 0.32, 0.33,
       0.34, 0.35, 0.36, 0.37, 0.38, 0.39, 0.4 , 0.41, 0.42, 0.43, 0.44,
       0.45, 0.46, 0.47, 0.48, 0.49, 0.5 , 0.51, 0.52, 0.53, 0.54, 0.55,
       0.56, 0.57, 0.58, 0.59, 0.6 , 0.61, 0.62, 0.63, 0.64, 0.65, 0.66,
       0.67, 0.68, 0.69, 0.7 , 0.71, 0.72, 0.73, 0.74, 0.75, 0.76, 0.77,
       0.78, 0.79, 0.8 , 0.81, 0.82, 0.83, 0.84, 0.85, 0.86, 0.87, 0.88,
       0.89, 0.9 , 0.91, 0.92, 0.93, 0.94, 0.95, 0.96, 0.97, 0.98, 0.99,
       1.  ])

In [16]:
np.linspace(0,10,3)

array([ 0.,  5., 10.])

A função **eye()** nos retorna uma matriz indentidade do tamanho especificado no argumento:

In [17]:
np.eye(5)

array([[1., 0., 0., 0., 0.],
       [0., 1., 0., 0., 0.],
       [0., 0., 1., 0., 0.],
       [0., 0., 0., 1., 0.],
       [0., 0., 0., 0., 1.]])

Podemos criar arrays a partir de números aleatórios, com as funções **random()** do Numpy, porém se atente a diferença entre cada uma delas:

Podemos utilizar a função **rand** que irá popuplar o array com números aleatórios de acordo com uma distribuição normal entre 0 e 1 (excluindo o 1).

In [18]:
np.random.rand(5)

array([0.98590413, 0.85097754, 0.13482916, 0.11975051, 0.34775685])

In [19]:
np.random.rand(99)

array([0.02903352, 0.14206223, 0.06825756, 0.25536811, 0.70561961,
       0.64590931, 0.72100191, 0.35287837, 0.6890631 , 0.30882296,
       0.11314225, 0.43813551, 0.41303591, 0.09929779, 0.76942701,
       0.89185142, 0.40063014, 0.18861776, 0.80013134, 0.03631475,
       0.42829885, 0.72761901, 0.01591744, 0.73447487, 0.21306678,
       0.49076708, 0.67423458, 0.97287727, 0.99489662, 0.7888689 ,
       0.16761041, 0.87630266, 0.15155076, 0.17277257, 0.75854609,
       0.37176206, 0.31484488, 0.52261331, 0.82876004, 0.76299678,
       0.29568491, 0.67517053, 0.96907579, 0.11775392, 0.61907386,
       0.24834965, 0.23111242, 0.2448093 , 0.80251861, 0.54484913,
       0.1450257 , 0.98317509, 0.81620996, 0.20446944, 0.76904937,
       0.02613625, 0.10125309, 0.06671228, 0.7057066 , 0.45653628,
       0.70270228, 0.58609068, 0.12707305, 0.85888888, 0.652105  ,
       0.12128514, 0.1607398 , 0.46404363, 0.03862218, 0.46271776,
       0.80760286, 0.32953312, 0.96359519, 0.20808641, 0.79260

Temos também a função **randn** que nos retorna amostras de números de acordo com uma distribuição normal, em vez de ser uma distribuição uniforme:

In [20]:
np.random.randn(5)

array([ 0.40977161, -0.17601697, -2.74558742,  0.76933166,  0.01290651])

In [21]:
np.random.randn(100)

array([ 0.75960003, -0.43871084,  0.11678507,  1.1415057 ,  0.68824637,
       -0.45395235, -0.4315624 , -0.80256225,  0.20201707,  1.23925821,
       -0.33123448,  0.16175343,  1.02622221, -0.80760497, -1.1718749 ,
       -0.30991773, -1.12653839,  1.83768794,  1.29499425,  0.01659155,
       -2.34315891,  0.55056902,  0.78590003,  0.11402919,  0.82276988,
       -0.26850792, -1.00816616, -0.64122303,  0.30397252, -0.01740014,
        1.94757456,  0.03868199,  1.21397682, -0.70934238, -0.96609469,
       -0.76920046, -0.78585467,  0.10580905,  0.34895971,  0.07626988,
        1.10205783, -0.58671493, -0.66011906, -0.72135562, -1.59564973,
       -0.43582391,  1.14431698,  0.04268585, -0.00559407, -0.32098286,
        0.26708947,  1.48649047,  0.88121301, -2.42962374, -1.46779035,
        1.00620331, -1.3168557 , -0.50324095,  1.10193387, -1.66728169,
       -1.38887901,  0.23442155,  0.25559315, -0.3017099 ,  0.60436374,
        0.33969663,  0.10943589,  0.45666203, -0.69653387, -1.09

A última que vale mencionar seria a **randint** que nos retorna números inteiros entre um intervalo especificado (excluindo o intervalo maior):

In [22]:
# Veja que se eu chamar um intervalo entre 1 e 2, só me retornará 1, já que sáo apenas números inteiros.
np.random.randint(1,2,10)

array([1, 1, 1, 1, 1, 1, 1, 1, 1, 1])

In [23]:
np.random.randint(0,15,30)

array([ 9,  4,  8, 14,  7,  2, 14, 10, 12,  9,  5,  2, 12, 10, 14, 14,  4,
        4, 10, 13,  8,  4, 10,  1,  2,  1,  7, 14,  1, 11])

## Atributos e Métodos

Agora que falamos de algumas maneiras pelas quais podemos criar arrays, vamos abordar seus atributos e métodos. Ou, informalmente, suas caracteríticas e habilidades.

Vamos supor que eu queria criar uma matriz que vai de 1 a 25 de 5 linhas e 5 colunas. Para isso, eu posso usar a função arange, porém isso iria me retornar um vetor, e não uma matriz 5x5. Neste caso, eu combino a função com um método chamado **reshape**. Veja:

In [24]:
np.arange(1,26).reshape(5,5)

array([[ 1,  2,  3,  4,  5],
       [ 6,  7,  8,  9, 10],
       [11, 12, 13, 14, 15],
       [16, 17, 18, 19, 20],
       [21, 22, 23, 24, 25]])

In [25]:
# Este método não irá funcionar se não for possível distribuir os dados pela matriz:
np.arange(1,25).reshape(5,5)

ValueError: cannot reshape array of size 24 into shape (5,5)

#### min, max, argmin e argmax

São funções para obtermos o valor máximo (ou mínimo) de um array e sua respectiva posição:

In [26]:
# vou criar um array aleatório:
arrale = np.random.randint(0,50,5)
arrale

array([46,  0, 15,  3, 44])

In [27]:
arrale.max()

46

In [28]:
arrale.min()

0

In [29]:
arrale.argmax() 
#Nos retorna o index position do valor máximo

0

In [30]:
arrale.argmin()
#Nos retorna o index position do valor mínimo

1

O método **shape** nos retorna o tamanho da matriz:

In [31]:
arr = np.arange(1,81).reshape(5,16)

In [32]:
arr.shape

(5, 16)

In [33]:
arr.reshape(80,1).shape

(80, 1)

### Indexação

Para indexarmos algum elemento ou parte de uma matriz, é semelhante à indexação de listas, porém com matrizes, teremos que indicar tanto a posição da linha, quanto a coluna do elemento que desejamos. Dessa forma: <br><br>

**arr2d[lin,col]** ou também pode ser, de forma menos usual **arr2d[lin][col]**. Quando se trata de um array 1d, a indexação é igual de listas. Veja alguns exemplos:

In [79]:
arr1d = np.arange(1, 10)
arr2d = np.arange(1, 31).reshape(5,6)

In [80]:
#Mostrando o array
arr1d

array([1, 2, 3, 4, 5, 6, 7, 8, 9])

In [81]:
#Mostrando o array
arr2d

array([[ 1,  2,  3,  4,  5,  6],
       [ 7,  8,  9, 10, 11, 12],
       [13, 14, 15, 16, 17, 18],
       [19, 20, 21, 22, 23, 24],
       [25, 26, 27, 28, 29, 30]])

In [50]:
# Indexando o Array 1d
# Vamos supor que eu queira pegar do 6 até o final, podemos fazer de duas maneiras:
uma_maneira = arr1d[5:]
outra_maneira = arr1d[-4:]

In [51]:
uma_maneira

array([6, 7, 8, 9])

In [52]:
outra_maneira

array([6, 7, 8, 9])

Veja que até agora foi exatamente igual indexar listas, agora vamos ver como fazemos para indexar matrizes:

In [53]:
# Supondo que eu queira pegar o último elemento da matriz, ultima col e ultima linha
arr2d[-1,-1]

30

In [54]:
# Supondo que eu queira pegar apenas o número 23:
arr2d[-2,-2]

23

In [82]:
# Pegando toda a parte entre o 8 e o 23:
parte_arr2d = arr2d[1:-1,1:-1]
parte_arr2d

array([[ 8,  9, 10, 11],
       [14, 15, 16, 17],
       [20, 21, 22, 23]])

In [105]:
# Pegando tudo entre o 2 e o 24:
parte_arr2d = arr2d[:-1,1:]
parte_arr2d

array([[ 2,  3,  4,  5,  6],
       [ 8,  9, 10, 11, 12],
       [14, 15, 16, 17, 18],
       [20, 21, 22, 23, 24]])

Tente criar um array e indexar elementos dele como prática, verá que vai ficando muito mais fácil. <br><br>

Vou mostrar algo que devemos ter atenção quando falarmos de indexação de matrizes, e principalmente quando atribuirmos as indexações a uma outra variável. Veja a variável acima chamada *parte_arr2d*. Se eu multiplicar ela por 2, veja o que acontece:


In [106]:
parte_arr2d[:] = 99
parte_arr2d

array([[99, 99, 99, 99, 99],
       [99, 99, 99, 99, 99],
       [99, 99, 99, 99, 99],
       [99, 99, 99, 99, 99]])

Até aí tudo bem, nada além do esperado, mas agora vamos ver o arr2d original, o qual eu havia indexado anteriormente:

In [107]:
arr2d

array([[ 1, 99, 99, 99, 99, 99],
       [ 7, 99, 99, 99, 99, 99],
       [13, 99, 99, 99, 99, 99],
       [19, 99, 99, 99, 99, 99],
       [25, 26, 27, 28, 29, 30]])

Veja que os valores na matriz original também foram alterados ao atribuir valores diferentes para um slice da matriz! Fique atento a isso ao rodar os seus códigos, uma forma de evitar que isso aconteça é criando uma cópia do array original antes de modificar qualquer slice. <br><br>

O numpy faz isso para consumir menos memória quando trabalhando com arrays muito grandes.

Uma outra forma de fazer o slicing é por operadores de comparação. Veja:

In [108]:
arr = np.arange (1, 21)
arr

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
       18, 19, 20])

In [109]:
# Vendo quais elementos são pares
arr % 2 == 0

array([False,  True, False,  True, False,  True, False,  True, False,
        True, False,  True, False,  True, False,  True, False,  True,
       False,  True])

In [110]:
arr[arr%2==0]

array([ 2,  4,  6,  8, 10, 12, 14, 16, 18, 20])

Criado por: <br><br>

Reddit: **u_jvsm**