# Numpy
O pacote Numpy possui um poderoso objeto array multidimensional, que nos permite realizar um conjunto bastante amplo de operações numéricas, sem a necessidade de utilização de laços for.

1. [Atributos e Métodos de arrays Numpy](#Metodos-e-funções-Numpy)
    1. [arange( )](#arange)
    1. [array( )](#array)
    1. [column_stack( )](#column_stack)
    1. [copy( )](#copy)
    1. [.dtype](#dtype)
    1. [loadtxt( )](#loadtxt)
    1. [.ndim](#ndim)
    1. [reshape(shape[, order])](#reshape)
    1. [resize(newshape[, refcheck])](#resize)
    1. [.shape](#shape)
    1. [.size](#size)
    1. [.T | transpose()](#t)
    1. [tolist()](#tolist)
1. [Trabalhando com Numpy](#Trabalhando-com-Numpy)
    1. [Desempenho Numpy vs lista Python](#Desempenho-Numpy-vs-lista-Python)
    1. [Operações com Numpy](#Operacoes_com_Numpy)
        1. [Operações entre array Numpy e constantes](#array_Numpy_e_constantes)
        1. [Operações entre arrays Numpy](#operacoes_entre_arrays_Numpy)
        1. [Operações entre arrays Numpy de duas dimensões](#operacoes_entre_arrays_Numpy_duas_dimencoes)
    1. [Seleção/Fatiamento com Numpy](#Selecao_com_Numpy)
    1. [Indexação com array booleano no Numpy](#indexacao_bool_com_Numpy)
    1. [Estatísticas no Numpy](#estatistica_Numpy)
1. [Soluções com Numpy](#Solucoes-com-Numpy)
    1. [Adicionando uma nova linha a um array Numpy](#adicionando_nova_linha_a_array_Numpy)


# Atributos e Métodos de arrays Numpy<a class="anchor" id="Metodos-e-funções-Numpy"></a>

## arange( )<a class="anchor" id="arange"></a>

Igual ao range( ), o arange( ) cria um array de números inteiros, com um intervalo especificado.

In [None]:
from numpy import arange

arange(10)

## array( )<a class="anchor" id="array"></a>

* Diferente das listas do Python, que podem conter tipos variados em uma mesma sequência, arrays Numpy suportam somente um tipo de dado por vez.

In [None]:
from numpy import array

# .Transformando uma lista em um array Numpy

km = array([10, 20, 30, 40, 50])
print(f'{km = }')
print(f'{type(km) = }')

## column_stack( )<a class="anchor" id="column_stack"></a>
Transforma vários arrays em um único array, com cada uma das colunas de cada array como uma coluna.

In [None]:
from numpy import loadtxt, column_stack

# pegando dados
anos = loadtxt(fname='carros-anos.txt', dtype=int)
km = loadtxt(fname='carros-km.txt')
valor = loadtxt(fname='carros-valor.txt')

print(f'{anos.shape = } - {km.shape = } - {valor.shape = }')

dataset = column_stack((anos, km, valor))
dataset

## copy( )<a class="anchor" id="copy"></a>

Faz uma copia do array sem referencia-lo

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
dados = array([km, anos])

dados_new = dados
# somando 1000 em todos dados da primeira linha
dados_new[0] += 1000
print(f'dados_new = {dados_new}')

# veja que dados também mudou
print(f'\ndados = {dados}')

In [None]:
# Tirando a referencia com copy()

dados_new = dados.copy()
# somando 1000 em todos dados da primeira linha
dados_new[0] += 1000
print(f'dados_new = {dados_new}')

# veja que dados não mudou
print(f'\ndados = {dados}')

## .dtype<a class="anchor" id="dtype"></a>

In [None]:
from numpy import array

# .Verificando o tipo do array

km = array([10, 20, 30, 40, 50])
print(f'{km = }')
print(f'{type(km) = }')
print(f'{km.dtype = }')

## loadtxt(file.txt, dtype=float)<a class="anchor" id="loadtxt"></a>

In [None]:
import numpy as np

km = np.loadtxt('carros-km.txt')
km

In [None]:
anos = np.loadtxt('carros-anos.txt', dtype=int)
anos

## .ndim<a class="anchor" id="ndim"></a>

Retorna numero de dimenssões do array.

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
dados = array([km, anos])

print(f'{dados.ndim = }')


## reshape(shape[, order])<a class="anchor" id="reshape"></a>

Retorna o array com os mesmos dados com uma nova forma

In [None]:
from numpy import arange

contador = arange(10)
print(f'{contador = }')

# Transformando em 5 linhas e 2 colunas com indexação de C (linguagem C)
c = contador.reshape((5, 2), order='C') # order='C' é default, não precisa colocar
print(f'c\n{c}')

# Transformando em 5 linhas e 2 colunas com indexação de F (Fortran)
f = contador.reshape((5, 2), order='F')
print(f'f\n{f}')



## resize(newshape[, refcheck])<a class="anchor" id="resize"></a>

Altera forma e tamanho do array


In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
dados = array([km, anos])

dados_new = dados

# Adicionando uma nova linha (irá preenche-la com 0)
dados_new.resize((3, 5))
print(f'dados_new.resize((3, 5))\n{dados_new}')

# Gera um erro pois os dados são referenciados (dados_new = dados)
# Ou tiramos a referencia fazendo --> dados_new = dados.copy()
# Ou adicionamos o atributo refcheck=False --> dados_new.resize((3, 5))

In [None]:
# Ou tiramos a referencia fazendo --> dados_new = dados.copy()
dados_new = dados.copy()

# Adicionando uma nova linha (irá preenche-la com 0)
dados_new.resize((3, 5))
print(f'dados_new.resize((3, 5))\n{dados_new}')

In [None]:
# Ou adicionamos o atributo refcheck=False --> dados_new.resize((3, 5))

dados_new = dados

# Adicionando uma nova linha (irá preenche-la com 0)
dados_new.resize((3, 5), refcheck=False)
print(f'dados_new.resize((3, 5))\n{dados_new}')

# Mas veja que dados também foi modificado!!!
dados

## .shape<a class="anchor" id="shape"></a>

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])

print(f'{km.shape = }')

anos = array([2003, 1991, 1990, 2019, 2006])

dados = array([km, anos])

print(f'{dados.shape = }')


## .size<a class="anchor" id="size"></a>

Retorna numero de elementos do array.

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
dados = array([km, anos])

print(f'{dados.size = }')

## .T | transpose()<a class="anchor" id="t"></a>

Retorna o transposto, transforma linhas em colunas e vice versa.

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
dados = array([km, anos])

print(f'{dados = }')
print(f'{dados.T = }')
print(f'{dados.transpose() = }')

## tolist()<a class="anchor" id="tolist"></a>

Retorna o array com uma lista python.

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
dados = array([km, anos])

lista = dados.tolist()
print(f'{lista = }')
print(f'{type(lista) = }')

# Trabalhando com Numpy<a class="anchor" id="Trabalhando-com-Numpy"></a>

## Desempenho Numpy vs lista Python<a class="anchor" id="Desempenho-Numpy-vs-lista-Python"></a>

In [None]:
from numpy import arange

np_array = arange(1000000)
py_list = list(range(1000000))

%time for _ in range(100): np_array *=2

%time for _ in range(100): py_list = [x * 2 for x in py_list]

## Operações com Numpy<a class="anchor" id="Operacoes_com_Numpy"></a>

### Operações entre array Numpy e constantes<a class="anchor" id="array_Numpy_e_constantes"></a>

In [None]:
from numpy import array

# .Lista com km e anos de veiculos (ambas tem o mesmo tamanho!)

km = [44410., 5712., 37123., 0., 25757.]
anos = [2003, 1991, 1990, 2019, 2006]

# .veja que a lista não suporta a operação
idade = 2019 - anos

In [None]:
km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])

# .veja que array numpy suporta a operação
idade = 2019 - anos
idade

### Operações entre arrays Numpy<a class="anchor" id="operacoes_entre_arrays_Numpy"></a>

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])
idade = 2019 - anos

km_media = km / idade

km_media

### Operações entre arrays Numpy de duas dimensões<a class="anchor" id="operacoes_entre_arrays_Numpy_duas_dimencoes"></a>

![array_duas_dimensões](array_duas_dimencoes.png)

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])

dados = array([km, anos])
# .Array de duas linhas e cinco colunas
print(dados)

print(f'\n{dados.shape = }')

In [None]:
# .Para acessar os arrays fazemos slice como em listas
print(f'\n{dados[0] = }')
print(f'\n{dados[1] = }')

km_media = dados[0] / (2021 - dados[1])
km_media

## Seleção/Fatiamento com Numpy<a class="anchor" id="Selecao_com_Numpy"></a>

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])

dados = array([km, anos])

# .Array de duas linhas e cinco colunas
print(dados)

# Podemos selecionar por [linha, coluna] ou [linha][coluna]
print(f'\n{dados[0, 0] = }')
print(f'\n{dados[0][0] = }')
print(f'\n{dados[1][4] = }')
print(f'\n{dados[1] = }')
print(f'\n{dados[0] = }')

In [None]:
from numpy import arange

# . Fatiamento de arrays

contador = arange(10)
print(f'{contador = }')
print(f'{contador[1:5] = }')
print(f'{contador[1:8:2] = }')
print(f'{contador[::2] = }')
print(f'{contador[:10] = }')
print(f'{contador[5:] = }')
print(f'{contador[-1:-3] = }')


In [None]:
from numpy import array

# .Fatiando arrays multidimensionais (Podemos fazer seleção por [linha, coluna])

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])

dados = array([km, anos])


print(f'{dados = }\n')
# Linha 0 coluna de 0 a 3
print(f'{dados[0, 0:3] = }')
# Linha 0 e 1 coluna de 0 a 3
dados2 = dados[0:3, 0:3]
print(f'\ndados[0:3, 0:3]\n{dados[0:3, 0:3]}')

print(f'\n{dados2[1,2] = }')


## Indexação com array booleano no Numpy<a class="anchor" id="indexacao_bool_com_Numpy"></a>

In [None]:
from numpy import arange

contador = arange(10)
print(f'{contador = }')

contador_maior_5 = contador > 5
print(f'\ncontador_maior_5\n{contador_maior_5}')

contador_maior_5 = contador[contador > 5]
print(f'\ncontador_maior_5\n{contador_maior_5}')

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])

dados = array([km, anos])

# Pegar os valores de km e anos dos veículos com ano maior que 2000
print(f'\ndados\n{dados}')

# dados[:,] Selecionando as duas linhas. , dados[1] > 2000 Selecionando a colunas que linha 2 maior que 2000
print(f'\ndados[:, dados[1] > 2000]\n{dados[:, dados[1] > 2000]}')


## Estatísticas no Numpy<a class="anchor" id="estatistica_Numpy"></a>

In [None]:
from numpy import loadtxt, column_stack, mean, std, sum

# pegando dados
anos = loadtxt(fname='carros-anos.txt', dtype=int)
km = loadtxt(fname='carros-km.txt')
valor = loadtxt(fname='carros-valor.txt')

In [None]:
# Verificando shape
print(f'{anos.shape = }\n{km.shape = }\n{valor.shape = }')

In [None]:
# transformando em um único array
dataset = column_stack((anos, km, valor))
dataset.shape

In [None]:
# verificando media de todas as colunas
media_todas_colunas = mean(dataset, axis=0) # axis=0 para linhas, axis=1 para colunas
print(f'{media_todas_colunas = }')

# verificando media individual por coluna
media_km = mean(dataset[:, 1])
print(f'{media_km = }')
media_valor = mean(dataset[:, 2])
print(f'{media_valor = }')

In [None]:
# verificando desvio padrão de todas as colunas
std_todas_colunas = std(dataset, axis=0) # axis=0 para linhas, axis=1 para colunas
print(f'{std_todas_colunas = }')

# verificando desvio padrão individual por coluna
std_km = std(dataset[:, 1])
print(f'{std_km = }')
std_valor = std(dataset[:, 2])
print(f'{std_valor = }')

In [None]:
# soma de todas as colunas
soma_todas_colunas = dataset.sum(axis=0)
soma_todas_colunas2 = sum(dataset, axis=0)
print(f'{soma_todas_colunas = }\n{soma_todas_colunas2 = }')

soma_km = dataset[:, 1].sum()
soma_km2 = sum(dataset[:, 1])
print(f'{soma_km = }\n{soma_km2 = }')


# Soluções com Numpy<a class="anchor" id="Solucoes-com-Numpy"></a>


## Adicionando uma nova linha a um array Numpy<a class="anchor" id="adicionando_nova_linha_a_array_Numpy"></a>

Temos um array de duas linhas, sendo:
* km dos carros
* ano dos carros

Queremos colocar uma linha com km_média e transforma-la para o formato de colunas.

In [None]:
from numpy import array

km = array([44410., 5712., 37123., 0., 25757.])
anos = array([2003, 1991, 1990, 2019, 2006])

dados = array([km, anos])
dados

In [None]:
# Adicionando linha
dados.resize((3, 5), refcheck=False)
dados

In [None]:
# Preenchendo linha de velocidade média
dados[2] = dados[0] / (2021 - dados[1])
dados

In [None]:
# Transformando em colunas
dados.T