In [0]:
#Importando bibliotecas Pandas e Matplotlib
import pandas as pd
import matplotlib.pyplot as plt

# Antes de começar, é interessante que:
### 1 - Tenhamos definido bem o problema que queremos resolver ou, pro caso de uma investigação, tenhamos pelo menos claro o nosso objetivo final.
### 2 - Feito isso, definiremos a nossa base de dados, que será a partir dela que iremos desenvolver nosso trabalho.
### 3 - Como último passo antes de colocarmos a mão na massa, é sempre bom visualizar nossa base de dados com algum editor de texto simples (Vim, Notepad ++, Bloco de Notas, etc), para entender como deveremos trabalhar em cima destes arquivos.

<h3> Base de dados: 

https://raw.githubusercontent.com/gilvandrocesardemedeiros/ClimatePrediction/master/Dados_INMET/Mensais/INMET-Dados_Mensais_Natal_1968-2018.csv

<h3> Documentação para leitura de arquivos .csv no Pandas: 

http://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_csv.html
  

In [0]:
#Leitura dos dados
dataSet = pd.read_csv("https://raw.githubusercontent.com/gilvandrocesardemedeiros/ClimatePrediction/master/Dados_INMET/Mensais/INMET-Dados_Mensais_Natal_1968-2018.csv",
                     sep = ";")

In [0]:
#Visualização geral dos dados
dataSet

In [0]:
#Visualização apenas do cabeçalho da base de dados
dataSet.head()

In [0]:
#Visualizando o "tipo" da base de dados
print(type(dataSet))

In [0]:
#Visualizando apenas os títulos das labels
print(list(dataSet))

In [0]:
#Visualizando apenas a coluna "PrecipitacaoTotal"
dataSet["PrecipitacaoTotal"]

In [0]:
#Visualizando o "tipo" deste objeto criado
print(type(dataSet["PrecipitacaoTotal"]))

In [0]:
#Visualizando os valores (sem os índices) da coluna "PrecipitacaoTotal"
dataSet["PrecipitacaoTotal"].values

In [0]:
#Visualizando o "tipo" deste objeto criado
print(type(dataSet["PrecipitacaoTotal"].values))

In [0]:
#Selecionando duas (ou mais) labels do DataFrame
dataSet[["Data","PrecipitacaoTotal"]]

In [0]:
#Visualizando o tipo dos dados armazenados em cada label
dataSet.dtypes

In [0]:
#Visualizando o dataSet novamente
dataSet.head()

<h3> Trabalhando com datas: 

https://docs.python.org/3/library/datetime.html#available-types

In [0]:
from datetime import datetime
#Transformando data em variável do tipo datetime
dataSet["Data"] = pd.to_datetime(dataSet["Data"], format = "%d/%m/%Y")

In [0]:
#Visualizando o tipo dos dados armazenados em cada label
dataSet.dtypes

In [0]:
#Visualizando o dataSet novamente
dataSet.head()

In [0]:
#Eliminando labels com problemas nos dados
dataSet = dataSet.drop(columns = ["EvapoBHPotencial","EvapoBHReal","PressaoNivelMarMedia","PressaoMedia","VisibilidadeMedia","Unnamed: 20"])

In [0]:
#Visualizando o dataSet novamente
dataSet.head()

In [0]:
#Verificando dimensões da base de dados
dataSet.shape

In [0]:
#Eliminando eventuais falhas
dataSet = dataSet.dropna()

In [0]:
#Verificando novas dimensões da base de dados
dataSet.shape

In [0]:
#Verificando os eventos em que a precipitação foi superior a 500 mm
dataSet[dataSet["PrecipitacaoTotal"] > 500]

In [0]:
#Verificando os eventos em que a precipitação foi superior a 500 mm, mas visualizando apenas a data, número de dias de precipitação e temperatura máxima média
dataSet[dataSet["PrecipitacaoTotal"] > 500][["Data","NumDiasPrecipitacao","TempMaximaMedia"]]

<h3> Agora vamos trabalhar com gráficos em Matplotlib:

https://matplotlib.org/gallery/index.html

In [0]:
#Plotagem simples
plt.plot(dataSet["Data"], dataSet["PrecipitacaoTotal"])
plt.title("Precipitação ao longo dos anos")
plt.xlabel("Data")
plt.ylabel("Precipitação")
plt.show()

In [0]:
#Scatter plot
plt.scatter(dataSet["Data"], dataSet["PrecipitacaoTotal"])
plt.title("Precipitação ao longo dos anos")
plt.xlabel("Data")
plt.ylabel("Precipitação")
plt.show()