# Introdução ao Numpy, Matplolib  e Pandas

> # Numpy

## Biblioteca para manipulação de arrays multidimensionais e matrizes

* Implementado em C e fortran
* Operações de alta performace com vetores e matrizes
* Fornece funções pré-compiladas rápidas para rotinas numéricas


## Fundamentos sobre NUMPY: Criação de Arrays,
- Indexação, operações (aritméticas, relacionais e lógicas), mudança de tipo de dados e valores especiais

## Aplicações do NUMPY para o tratamento de dados científicos
- Seleção, ordenação, ajustes, interpolações, funções matemáticas, arrays com máscaras

## Desempenho com numpy:




In [None]:
import numpy as np
import time

def python_versao():
    time1 = time.time()
    y = range(10000000)
    x = range(10000000)
    z = []
    for i in range(len(x)):
        v = y[i]+x[i]
        z.append(v)
    
    return time.time()-time1

python_versao()

In [None]:
def numpy_versao():
    time1 = time.time()
    y = np.arange(10000000)
    x = np.arange(10000000)
    z = x + y
    return time.time()-time1

numpy_versao()

# -

# Array: Tipo de dados mais importantes para o numpy

>Array é um tipo de dado composto a partir de tipos de outros tipos mais simples de dados. São ordenados segundo uma sequência definida.

> Arrays NumPy podem ser criados a partir de estruturas de dados do Python ( **listas**, **tuplas**) ou a partir de funções específicas para criação de arrays.


In [None]:
a = [1,2,3,4]
a = np.array(a)         #array a partir de a
a


In [None]:
np.zeros((5,2))       #vetor zero com m linhas e n colunas


In [None]:
np.ones((2,3))        ##vetor de 1 com m linhas e n colunas


In [None]:
np.zeros_like(a)     # vetor de zeros no formato de a

In [None]:
np.ones_like(a)     # vetor de 1 no formato de a

In [None]:
np.random.random((3,5))   # matriz m,n de números aleatórios

In [None]:
np.identity(4)            # matriz identidade de ordem n

In [None]:
np.arange(1,4,2)      # vetor com início i, final f e passo p

In [None]:
np.linspace(1,10,20)    #vetor com n números de i até f  (ifn)

In [None]:

a.size  # tamanho do array


In [None]:
a.ndim  # dimens~ao do array


In [None]:
a.reshape(2,2) # alterar a ordem do array

In [None]:
a[x,y]  #acessar elementos

In [None]:
b = np.linspace(1,50,50)

In [None]:
b = b.reshape(5,10)

In [None]:
b

In [None]:
b[3:,8:]

In [None]:
b[3:,:]

# Numpy para operações com matrizes


In [None]:
a=np.array([1,2,3,4])
b=np.array([1,2,3,4])
b=b.reshape(4,1)
a*b

In [None]:
ci=np.linspace(0,20,10)
c=ci.reshape(2,5)
d=c.reshape(5,2)

In [None]:
c,d

In [None]:
d=np.linspace(0,20,10).reshape(5,2)
d

In [None]:
np.dot(c,d)

** Percorrendo uma array**

In [None]:
x=np.linspace(1,20,20).reshape(4,5)
x
                               

In [None]:
x[1,2]

In [None]:
x[:,4]

In [None]:
x[::2,::3]

In [None]:
x[0,:]*2

In [None]:
x[:2,:2]*3

In [None]:
for i in range(len(x)):
    for e in range(len(x[i])):
                 print('%.2f valor da celula'%x[i,e])

## Máscara

In [None]:
np.mod(x,2)==0


In [None]:
mask = np.mod(x,2)==0

In [None]:
np.ma.array(x,mask = mask)

In [None]:
len(x)

In [None]:
len(x[i])

# Matplotlib

##  Biblioteca completa para plotar dados em 2 ou 3 D

In [None]:
import matplotlib.pyplot as plt
y = np.random.random(50)
x = np.arange(len(y))
plt.plot(x,y)
plt.xlabel("Range")
plt.ylabel('Valores aleatórios')
plt.show()

In [None]:
x=np.linspace(-np.pi,np.pi,256)
y1=np.sin(x)
y2=np.cos(x)
plt.plot(x,y1,label='seno')
plt.plot(x,y2, label = 'cos')
plt.legend()
plt.grid()
plt.show()

In [None]:
x=np.linspace(-np.pi,np.pi,256)
plt.figure(figsize=(15,8),dpi=50)
y1=np.sin(x)
y2=np.cos(x)
plt.subplot(1,2,1)
plt.plot(x,y1,label='seno')
plt.grid()
plt.subplot(1,2,2)
plt.plot(x,y2, label = 'cos')
plt.legend()
plt.grid()
plt.show()

In [None]:
#imagem=np.random.random(10000).reshape(100,100)
imagem=np.linspace(0,1,10000).reshape(100,100)
plt.imshow(imagem)
plt.colorbar()
plt.show()

In [None]:
im2=np.sin(imagem)
plt.imshow(im2)
plt.colorbar()
plt.show()

In [None]:
import matplotlib.image as mpig
im = mpig.imread('gato.png')
im

In [None]:
plt.imshow(im)
plt.show()

In [None]:
plt.hist(im.ravel(),bins=256, range=(0.0, 1.0), fc='k', ec='k')
plt.show()

Para saber mais Visite: http://matplotlib.org/gallery.html 

# Pandas

## É uma biblioteca do python, de alta perfomace, da estruturação e análise de dados

### Criando um dataframe

In [None]:
import pandas as pd


In [None]:
d = {'um' : pd.Series([1.,2.,3.], index=['a','b','c']),
    'dois' : pd.Series([1.,2.,3.,4.], index=['a','b','c','d'])}

In [None]:
df = pd.DataFrame(d)
df

In [None]:
nomes = ['Joao','Maria','Eros','Valentina','Enzo']
idade = [17,32,24,19,29]
dados_idade = list(zip(nomes,idade))
dados_idade

In [None]:
df = pd.DataFrame(data = dados_idade, 
                  columns=['Nomes','idade'])
df

### Manipulando DataFrame

In [None]:
df.columns = ['Nomes','idade']
df

In [None]:
df['Peso']=[65,69,75,79,81]

In [None]:
df

In [None]:
del df['Peso']
df

In [None]:
df.loc[2]

In [None]:
df.loc[2:4]

In [None]:
df.ix[:3,['idade']]

### Dados ausente (NoData)

In [None]:
dfm = pd.DataFrame(np.random.randn(5,3),
                  index = ['a','b','c','d','e'],
                  columns=['Um','Dois','Três'])

In [None]:
dfm

In [None]:
dfm.loc['a','Dois'] = np.nan

In [None]:
dfm

In [None]:
dfm.isnull()

In [None]:
dfm.fillna(0)

In [None]:
dfm.query('Três > 0')

In [None]:
dfm.query('Três < 0 & Um > 0')

In [None]:
dfm.count()


### Dados externos: exmplo de aplicação

In [None]:
df = pd.read_csv('alto_da_boa_vista_2017_diariob.csv',
                 sep='\t')
df.head()

In [None]:
df.dtypes

In [None]:
df.columns

In [None]:
df.values

In [None]:
df['Temperatura'].plot()
plt.show()

In [None]:
df['Umidade'].mean() 

In [None]:
df['Umidade'].std()

In [None]:
df['Umidade'].describe()

In [None]:
df.describe()

#### Convertendo para dados diários


In [None]:
df.head()


In [None]:
del df['Dia']
del df['Hora']

In [None]:
df.head()

In [None]:
coletas = pd.date_range(start='01-01-2017',periods=len(df['Temperatura']),freq='15min')

In [None]:
df.index = coletas
df.head()

In [None]:
date_diarios=df.resample('D').mean()

In [None]:
date_diarios.head()

In [None]:
len(date_diarios['Temperatura'])

In [None]:
date_diarios.to_csv('Valores_diarios.csv',sep=';')