<img align="right" src="files/logo_grupo_en_verde.png" style="width: 200px;"/> 
<br>
<br>
<br>
<br>
# Computação Científica com Python <br>
## Pacotes úteis para computação científica <br>
<img align="left" src="files/pylibs.png" style="width: 800px;"/>

# Numpy
 - Manipulação de arrays
   + homogêneos, tipos estáticos
   - eficientes no uso de memória
   - rápida implementação de funções matemáticas
   - mais rápidos que listas
 - Algebra Linear
 - Integração de códico (C/C++, Fortran)
 - ...

## Criando arrays

In [None]:
# Importa numpy
import numpy as np
#help(np.array)

In [None]:
# Cria um array
arr = np.array([x for x in range(0,10)])
print(arr)

In [None]:
# Verifica o formato do array
print(arr.shape)

In [None]:
# Cria um vetor contendo uma progressão aritmética a partir de um intervalo
arr2 = np.arange(0.,4.5,.5)
print(arr2)

In [None]:
# Retorna o tipo dos dados de um array
print(arr.dtype)
print(arr2.dtype)

In [None]:
# Cria um array com zeros
z = np.zeros(10)
print(z)

In [None]:
# Cria array com valores igualmente distribuídos em um intervalo especificado
#linspace -> linearly spaced vector
a = np.linspace(0,10)
print(a,'\n')
b = np.linspace(0,10,15)
print(b,'\n')
print(np.logspace(0,5,10))

In [None]:
help(np.linspace)

## Arrays multidimensionais (matrizes)

In [None]:
matrix = np.array([[1,2,3],[4,5,6]])
print(matrix)
print(matrix.shape)

In [None]:
# Cria uma matriz unitária
mones = np.ones((3,4))
print(mones)

In [None]:
# Cria uma matriz identidade
identidade = np.eye(3)
print(identidade)

In [None]:
# Cria matriz diagonal com valores especificados
d = np.diag(np.array([1,2,3,4,5]))
d

In [None]:
# Transforma lista em matriz
lista = [[23,45,67],[90,23,101],[22,64,99]]
ml = np.matrix(lista)

print('Tipo de dado da matriz: ',type(ml))
print('Tipo de dado dos dados da matriz: ', ml.dtype)
print('Shape da matriz: ', ml.shape) 
print('Número de elementos da matriz: ', ml.size)
print('Tamanho de cada item da matriz em bytes: ', ml.itemsize)
print('Tamanho total da matriz em bytes:', ml.nbytes)

In [None]:
x = np.array([1,2,3])
y = np.array([1.0,2.0,3.0])
z = np.array([1,2,3], dtype=np.float32)

print(x.dtype, y.dtype, z.dtype)

In [None]:
# Repete elementos em um array
k = np.array([1,2,3])
np.repeat(k, 3)

In [None]:
np.tile(k, 3)

## Trabalhando com Datasets

In [None]:
import os
filename = os.path.join('files/pontosBiomassa.csv')

!head files/pontosBiomassa.csv

In [None]:
arq = np.loadtxt(filename, delimiter=',', usecols=(0,3,4), skiprows=1)
print(arq)

In [None]:
#Somando as colunas
arq.sum(0)

In [None]:
# Separando uma coluna
a = np.array([x[0] for x in arq])

In [None]:
# Salvando novo arquivo
np.savetxt("novoArquivo.txt", arq, fmt='%5.3f', delimiter=',', newline='\n', header='ID, LON, LAT')

# Pandas

Manipula de forma rápida e expressiva dados estruturados.

- Funcionalidades de indexação sofisticadas;
  - slice e dice;
  - agregação e seleção de subsets;
- Preparação e manipulação de dados;
  - Series e DataFrames;

## Series

In [None]:
import pandas as pd

serie = pd.Series([4, 7, -5, 3])

In [None]:
serie

In [None]:
type(serie)

In [None]:
print(serie.values)
print(serie.index)

In [None]:
serie2 = pd.Series([4, 7, -5, 3], index = ['a','b','c','d',])
serie2

In [None]:
# Slice e Dice
print(serie2[serie2>3])
print(serie2['a'])
print('b' in serie2)

In [None]:
# Dicionário para Serie

dici = {'A': 234,'B':125,'C':778.695,'D':2.98,'E':66.655,'F':89.25414}
serie3 = pd.Series(dici)
serie3

In [None]:
# Lista como indice
lista = ['A','B','C','D','G']

serie4 = pd.Series(dici, index=lista)
serie4

In [None]:
pd.isnull(serie4)

In [None]:
pd.notnull(serie4)

In [None]:
# Operações com Series
serie5 = serie3 + serie4
serie5

## DataFrames

In [None]:
# Cria um DataFrame
dados = {'Estado':['MG','MT','GO','BA','PE'],
         'Ano':[2001,2002,2003,2004,2005],
         'TempMediaAnual':[26.5,26.3,28.6,30.0,32.12]}

frame = pd.DataFrame(dados)

frame

In [None]:
# Cria um DataFrame e define os indices
frame2 = pd.DataFrame(dados,index = ['um','dois','tres','quatro', 'cinco'])
frame2

In [None]:
# Cria um DataFrame definindo colunas
frame3 = pd.DataFrame(dados, columns = ['Ano','Estado','TempMediaAnual','Precipitacao'],index = ['um','dois','tres','quatro', 'cinco'])
frame3

In [None]:
# Slice e Dice
frame3['Estado']

In [None]:
# Adicionando dados à coluna Precipitacao
prec = [100,150,200,500,80]
frame3['Precipitacao'] = prec
frame3

In [None]:
# Mostra valores do DataFrame
frame3.values

In [None]:
# Informações sobre o DataFrame
frame3.describe()

In [None]:
# Slice e Dice
frame3[2:4]

# DataFrames a partir de arquivos

In [None]:
# Verificando os nomes de arquivos
!ls files/

In [None]:
# Verificando como o arquivo está formatado
!head files/stat_dados_micro_2010.txt

In [None]:
# Lendo o arquivo 
stats = pd.read_table('files/stat_dados_micro_2010.txt', delim_whitespace=True)
stats

In [None]:
# Adicionando nova coluna ao DataFrame
stats['Porcentagem'] = (stats['AREAMICROUT']/stats['AREAMARY'])*100
stats

# Time Series

In [None]:
# Criando range de datas com frequência em segundos
indice = pd.date_range('1/1/2017',periods = 100, freq = 'S')
indice

> [OffSet Aliases (pd.date_range)](http://pandas.pydata.org/pandas-docs/stable/timeseries.html#offset-aliases)

In [None]:
# Criando uma série de dados temporais
ts = pd.Series(np.random.randint(0, 500, len(indice)), index=indice)
ts

## Plotting

In [None]:
# importando pacotes necessários
import matplotlib.pyplot as plt
%matplotlib inline

In [None]:
# Time Series Plot
ts.plot()

## DataFrame Plot

In [None]:
plt.figure()
ax = stats['AREAMICROUT'].plot(secondary_y=['AREAMICROUT', 'Porcentagem'], legend=True)
stats['Porcentagem'].plot(style='k', legend=True)
ax.set_ylabel('Porcentagem')
ax.right_ax.set_ylabel('Área (km²)')