<a href="https://colab.research.google.com/github/GeorgeOgeorge/natal_meteorological_analysis/blob/main/analise_metereologia.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
#importando bibliotecas utilizadas nas operações
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd
import seaborn as sb

In [None]:
#importando o arquivo
from google.colab import drive
drive.mount('/content/drive/')
%cd /content/drive/MyDrive/

# Pré-processamento dos dados

In [None]:
# Lendo a tabela e colocando o (;) como separador de colunas
df = pd.read_csv("dados_natal.csv", sep=';')
# Deletando todas as linhas com valores faltantes
df.dropna(axis=0, inplace=True)
# Mudando (,) nos valores decimais para (.)
df.replace(',', '.', regex=True, inplace=True)

# Fazendo conversão dos dados analiticos para o tipo Float
dados_metereologicos = df.iloc[:,2:19].astype(float)
# Convertendo o valor da data para o tipo DateTime
data = pd.to_datetime(df['Data'])

# Concatenando DataFrames
final_df = pd.concat([data, df['Hora (UTC)'], dados_metereologicos], axis=1)
# Definindo coluna Data como indice para linhas
final_df = final_df.set_index(['Data'])

final_df

# Questões

In [None]:
#Questão: A) Tabela com estatísticas descritivas de todas as variáveis
final_df.describe()

In [None]:
#Questão B) Série precipitação mensal.
meses = [
  final_df.loc['2021-1-1':'2021-2-1'],
  final_df.loc['2021-2-1':'2021-3-1'],
  final_df.loc['2021-3-1':'2021-4-1'],
  final_df.loc['2021-4-1':'2021-5-1'],
  final_df.loc['2021-5-1':'2021-6-1'],
  final_df.loc['2021-6-1':'2021-7-1'],
  final_df.loc['2021-7-1':'2021-8-1'],
  final_df.loc['2021-8-1':'2021-9-1'],
  final_df.loc['2021-9-1':'2021-10-1'],
  final_df.loc['2021-10-1':'2021-11-1'],
  final_df.loc['2021-11-1':'2021-12-1'],
  final_df.loc['2021-12-1':'2021-12-31']
]

dados_chuva = []

for mes in meses:
  dados_chuva.append([
    mes["Chuva (mm)"].max(),
    mes["Chuva (mm)"].mean(),
    mes["Chuva (mm)"].min()
  ])

df_chuvas = pd.DataFrame(dados_chuva,columns=['Maxima', 'Media', 'Minima'])

df_chuvas

In [None]:
#C) Serie de Temperatura mínima, media e máxima.
meses = [
  final_df.loc['2021-1-1':'2021-2-1'],
  final_df.loc['2021-2-1':'2021-3-1'],
  final_df.loc['2021-3-1':'2021-4-1'],
  final_df.loc['2021-4-1':'2021-5-1'],
  final_df.loc['2021-5-1':'2021-6-1'],
  final_df.loc['2021-6-1':'2021-7-1'],
  final_df.loc['2021-7-1':'2021-8-1'],
  final_df.loc['2021-8-1':'2021-9-1'],
  final_df.loc['2021-9-1':'2021-10-1'],
  final_df.loc['2021-10-1':'2021-11-1'],
  final_df.loc['2021-11-1':'2021-12-1'],
  final_df.loc['2021-12-1':'2021-12-31']
]

dados_temperatura = []

for mes in meses:
  dados_temperatura.append([
    mes["Temp. Max. (C)"].max(),
    mes["Temp. Max. (C)"].mean(),
    mes["Temp. Max. (C)"].min(),
    mes["Temp. Ins. (C)"].max(),
    mes["Temp. Ins. (C)"].mean(),
    mes["Temp. Ins. (C)"].min(),
    mes["Temp. Min. (C)"].max(),
    mes["Temp. Min. (C)"].mean(),
    mes["Temp. Min. (C)"].min()
  ])

df_temperaturas = pd.DataFrame(dados_temperatura,
                               columns=['Maxima_maxima', 'Maxima_media', 'Maxima_minima',
                                        'Media_maxima', 'Media_media', 'Media_minima',
                                        'Minima_maxima', 'Minima_media', 'Minima_minima'
                                        ])

df_temperaturas

In [None]:
#D) Correlação entre precipitação e temperatura.
sb.relplot(data=final_df, x='Temp. Ins. (C)', y='Chuva (mm)')

In [None]:
#E) Correlação entre precipitação e vento. 
sb.relplot(data=final_df, x='Vel. Vento (m/s)', y='Chuva (mm)')

In [None]:
#F) Correlação entre temperatura e vento.
sb.relplot(data=final_df, x='Temp. Ins. (C)', y='Vel. Vento (m/s)')

In [None]:
# Chuvas em natal acontecem na madrugada :(
sb.relplot(data=final_df, x='Hora (UTC)', y='Chuva (mm)')

In [None]:
# Mapa de calor de correlações
corr = final_df.corr()
sb.heatmap(corr, annot=True, fmt=".1f")