#Introdução à Computação Aplicada às Ciências Atmosfericas II

As condições climatológicas influenciam desde a safra de grãos até a decisão de um vendedor ambulante levar seu carrinho para a praia ou não, sendo importante e influente na economia do país. Portanto aprender a coletar e elaborar análises de dados sobre o clima usando o Python (ou outra linguagem de programação) é fundamental para o profissional meteorologista.

Condições como a temperatura, umidade, radiação e pressão atmosgérica podem influenciar diversos aspectos do nosso cotidiano, portanto, o monitoramento do clima pode ajudar a tomar melhores decisões.

##Fontes de dados

###INMET

No Brasil, uma das principais fontes de dados públicas sobre condições climática é o Instituto Nacional de Meterologia (INMET), que disponibiliza dados históricos com relativa atualização sobre:

- Precipitação
- Pressão atmosférica
- Radiação
- Temperatura
- Umidade
- Vento

Os dados são disponibilizados para nível de:
- Regiões
- Estados
- Municípios

Em uma granularidade de:
- Data
- Hora

A base de dados do INMET, para estações automáticas, inicia em 2000 e possui dados até o ano corrente (usualmente, atualizado até o mês anterior).

Para acessar a base de dados clique aqui: [Base de Dados - INMET](https://portal.inmet.gov.br/dadoshistoricos)

##Dados INMET para o ano de 2024 - São Luís (MA).


####Importando bibliotecas

In [None]:
#Importando biblioteca

import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import numpy as np

# from inspect import formatannotation


In [None]:
#Acessando tabela de dados
tb = pd.read_csv('/content/INMET_NE_MA_A203_SAO LUIS_01-01-2024_A_31-12-2024.CSV',
                 skiprows=8, sep=';', encoding='latin-1')
tb

##Análise de dados

- Número de dias d chuva por mês:

In [None]:
#Verificando nomes das colunas
tb.columns

In [None]:
# print(tb["UMIDADE RELATIVA DO AR, HORARIA (%)"].dtypes) #verificar o tipo de dado de uma única coluna
print(tb.dtypes) #verificar o tipo de dado de todas as colunas

In [None]:
#Renomeando coluna
tb = tb.rename(columns = {'UMIDADE RELATIVA DO AR, HORARIA (%)': 'Umidade_R_AR'})
tb.columns

#AGORA MUDE O NOME DA COLUNA 'Hora UTC'


In [None]:
tb = tb.rename(columns = {'PRECIPITAÇÃO TOTAL, HORÁRIO (mm)':'Precip_Tot_mm',
                          'PRESSAO ATMOSFERICA AO NIVEL DA ESTACAO, HORARIA (mB)':'Pressao_Atm_mB',
                          'PRESSÃO ATMOSFERICA MAX.NA HORA ANT. (AUT) (mB)':'Pressao_Atm_Max_mB',
                          'PRESSÃO ATMOSFERICA MIN. NA HORA ANT. (AUT) (mB)':'Pressao_Atm_Min_mB',
                          'RADIACAO GLOBAL (Kj/m²)':'Radiacao_Kj_m2',
                          'TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)':'Temp_Ar_C',
                          'TEMPERATURA DO PONTO DE ORVALHO (°C)':'Temp_Pt_Orv_C',
                          'UMIDADE REL. MAX. NA HORA ANT. (AUT) (%)': 'Umidade_RMax_AR',
                          'UMIDADE REL. MIN. NA HORA ANT. (AUT) (%)': 'Umidade_RMin_AR',
                          'TEMPERATURA MÍNIMA NA HORA ANT. (AUT) (°C)':'Temp_Min_C',
                          'TEMPERATURA MÁXIMA NA HORA ANT. (AUT) (°C)':'Temp_Max_C',
                          'TEMPERATURA ORVALHO MAX. NA HORA ANT. (AUT) (°C)':'Temp_Orv_Max_C',
                          'TEMPERATURA ORVALHO MIN. NA HORA ANT. (AUT) (°C)':'Temp_Orv_Min_C',
                          'VENTO, DIREÇÃO HORARIA (gr) (° (gr))':'Vento_Dir',
                          'VENTO, RAJADA MAXIMA (m/s)':'Vento_m_s',
                          'VENTO, VELOCIDADE HORARIA (m/s)':'Vento_Vel_m_s'
                          })

tb.columns

In [None]:
#Deletando coluna
tb = tb.drop(columns=['Unnamed: 19'])
tb.columns

In [None]:
#Criando nova coluna
tb['Estado'] = 'MA'
tb

In [None]:
#Convertendo coluna data para datetime
# tb['Data'] = pd.to_numeric(tb['Data'])
tb['Data'] = pd.to_datetime(tb['Data'])
tb['Data'].dtypes

In [None]:
#Extraindo o mês da data
tb['Mes'] = tb['Data'].dt.month
tb

In [None]:
#Filtrando dados para selecionar somente os dias com chuva
dias_com_chuva = tb[tb['Precip_Tot_mm'] > 0]

In [None]:
tb['Precip_Tot_mm'] = pd.to_numeric(tb['Precip_Tot_mm'], errors='coerce')
print(tb['Precip_Tot_mm'].dtypes)

dias_com_chuva = tb[tb['Precip_Tot_mm'] > 0]

In [None]:
# Contar o número de dias com chuva por mês, considerando apenas uma entrada por dia com chuva
dias_chuva_por_mes = dias_com_chuva.groupby('Mes')['Data'].nunique()
dias_chuva_por_mes

####Gráfico de Barras

In [None]:
#Gerando gráfico
plt.figure(figsize=(10, 6))
dias_chuva_por_mes.plot(kind='bar', color='blue')
plt.show()

In [None]:
#Gerando gráfico
plt.figure(figsize=(10, 6))
dias_chuva_por_mes.plot(kind='bar', color='blue')
plt.title('Número de Dias com Chuva por Mês em São Luís (2024)')
plt.xlabel('Mês')
plt.ylabel('Número de Dias com Chuva')
plt.xticks(rotation=0)
plt.grid(axis='y', linestyle='--')
plt.show()

In [None]:
meses = ['janeiro', 'fevereiro', 'março', 'abril', 'maio', 'junho', 'julho', 'dezembro']

media = np.mean(dias_chuva_por_mes)
media

In [None]:
#Gerando gráfico

fig, ax = plt.subplots(figsize=(10, 6))

g_barras = ax.bar(meses, dias_chuva_por_mes, color='skyblue')

ax.axhline(media, color='black', linestyle='--')

ax.text(6.6, media + 0.1, 'Média de dias de chuva no mês',
        ha='center', va='bottom', color='gray', fontsize=11)


ax.set_xlabel('Mês', fontsize=12)

ax.set_ylabel('Número de Dias com Chuva', fontsize=12, color='black')

ax.set_title('Número de Dias com Chuva por Mês em São Luís (2024)', fontsize=12)

ax.tick_params(axis='x', rotation=0)

plt.figtext(0.5, -0.05, "Fonte: INMET - Estação A203 São Luís-MA | Elaboração: Profa. Izadora",
            fontsize=10, color = 'gray')

plt.tight_layout()
plt.show()

#Salvando gráfico
# plt.savefig('/content/grafico_1_300dpi.png', format='png', dpi=300, bbox_inches='tight')  # Salvar em SVG
# plt.savefig('/content/grafico_1_300dpi.svg', format='svg', dpi=300, bbox_inches='tight')  # Salvar em SVG
# plt.close()

In [None]:
#Salvando tabela organizada
tb.to_csv('dados_clima_slz_2024.csv', index=False)

####Gráfico Mapa de Calor (Heatmap)

In [None]:
#Carregando tabela organizada
tb2 = pd.read_csv('/content/dados_clima_slz_2024.csv')
tb2

In [None]:
#Extraindo o mês da data

tb2['Data'] = pd.to_datetime(tb2['Data'])

tb2['Dia'] = tb2['Data'].dt.day
tb2['Ano'] = tb2['Data'].dt.year
tb2

In [None]:
# Pivotar para formar uma matriz: linhas = meses, colunas = dias
tb2=tb2.rename(columns={'UMIDADE REL. MAX. NA HORA ANT. (AUT) (%)': 'Umidade_RMax_AR',
                          'UMIDADE REL. MIN. NA HORA ANT. (AUT) (%)': 'Umidade_RMin_AR'})

tb2.columns

In [None]:
# Tipo de dado da coluna 'Temp_Ar_C' deve ser numérico
tb2['Temp_Ar_C'] = pd.to_numeric(tb2['Temp_Ar_C'], errors='coerce')


In [None]:
# Criar a tabela pivot para o mapa de calor
# Agrupar por Mês e Dia, e calcular a média da temperatura para cada dia de cada mês
# Isso lida com múltiplas observações no mesmo dia (por exemplo, horárias)
tb2_pivot = tb2.groupby(['Mes', 'Dia'])['Temp_Ar_C'].mean().unstack()
tb2_pivot

In [None]:
# Ordenar os meses corretamente
meses_ordem = list(range(1, 13)) # Números de 1 a 12 para os meses
dias_ordem = list(range(1, 32)) # Números de 1 a 31 para os dias

print(meses_ordem)
print(dias_ordem)

In [None]:
# Reindexar o DataFrame pivotado para garantir a ordem correta dos meses e dias
tb2_pivot = tb2_pivot.reindex(index=meses_ordem, columns=dias_ordem)
tb2_pivot

In [None]:
#Gerando mapa
# Configurar o tamanho da figura
plt.figure(figsize=(15, 8))

# Criar o mapa de calor
ax = sns.heatmap(tb2_pivot, cmap='coolwarm', annot=False, fmt=".1f", linewidths=.5,
                 cbar_kws={'label': 'Temperatura (°C)'})


# Configurar títulos e rótulos
plt.title('Mapa de Calor da Temperatura do Ar (°C) por Mês e Dia (São Luís, 2024)', fontsize=14)
plt.xlabel('Dia do Mês', fontsize=12)
plt.ylabel('Mês', fontsize=12)

nomes_meses = ['Jan', 'Fev', 'Mar', 'Abr', 'Mai', 'Jun',
               'Jul', 'Ago', 'Set', 'Out', 'Nov',
               'Dez']

# Onde 1=Jan, 2=Fev, etc.
ax.set_yticks(ticks=np.arange(12) + 0.5)
ax.set_yticklabels(labels=nomes_meses, fontsize=10)
# ax.invert_yaxis() # Inverte o eixo Y para começar por Janeiro embaixo

plt.figtext(0.5, -0.05, "Fonte: INMET - Estação A203 São Luís-MA | Elaboração: Profa. Izadora",
            fontsize=10, color='gray') #ha='center'

# Mostrar o mapa de calor
plt.tight_layout()
plt.show()

#Salvar figura
plt.savefig('mapa_calor_temp_slz_2024.png')
plt.close()

####Outros gráficos

In [None]:
# Gráfico de Setor (Pizza) - Exemplo com a média da Umidade por Mês
# Calcular a média da umidade por mês
umidade_media_por_mes = tb2.groupby('Mes')['Umidade_R_AR'].mean()

plt.figure(figsize=(8, 8))
plt.pie(umidade_media_por_mes, labels=nomes_meses, autopct='%1.1f%%', startangle=140, colors=plt.cm.Paired(range(len(nomes_meses))))
plt.title('Distribuição da Umidade Média do Ar por Mês (São Luís, 2024)')
plt.show()

In [None]:
# Gráfico de Dispersão - Exemplo: Relação entre Temperatura e Umidade
plt.figure(figsize=(10, 6))
sns.scatterplot(x='Temp_Ar_C', y='Umidade_R_AR', data=tb2, alpha=0.5)
plt.title('Relação entre Temperatura e Umidade do Ar (São Luís, 2024)')
plt.xlabel('Temperatura do Ar (°C)')
plt.ylabel('Umidade Relativa do Ar (%)')
plt.grid(True)
plt.show()


In [None]:
# Gráfico de Linha - Exemplo: Variação da Temperatura ao longo do tempo
# Agrupar por mês e calcular a média da temperatura

tb2['Data'] = pd.to_datetime(tb2['Data'])
tb2_temp_mensal = tb2.groupby(tb2['Data'].dt.to_period('M'))['Temp_Ar_C'].mean().reset_index()
tb2_temp_mensal['Data'] = tb2_temp_mensal['Data'].astype(str)

# Gerando gráfico
plt.figure(figsize=(15, 6))

plt.plot(tb2_temp_mensal['Data'], tb2_temp_mensal['Temp_Ar_C'], linestyle='-')

plt.title('Variação Mensal da Temperatura do Ar (São Luís, 2024)')

plt.xlabel('Mês')

plt.ylabel('Temperatura do Ar (°C)')

plt.grid(True)

plt.show()

In [None]:
#Gráfico Barras
# Calcule a precipitação total mensal
precip_total_mensal = tb2.groupby('Mes')['Precip_Tot_mm'].sum()

# Para ver os valores de precipitação total mensal
# print("Precipitação Total Mensal (mm):")
# print(precip_total_mensal)

# Gere o gráfico de barras para a precipitação total mensal
plt.figure(figsize=(10, 6))
precip_total_mensal.plot(kind='bar', color='green')
plt.title('Precipitação Total Mensal em São Luís (2024)')
plt.xlabel('Mês')
plt.ylabel('Precipitação Total (mm)')
plt.xticks(ticks=np.arange(12), labels=nomes_meses, rotation=0)
plt.grid(axis='y', linestyle='--')
plt.show()

In [None]:
# Gráfico de Histograma - Exemplo: Distribuição da Temperatura
plt.figure(figsize=(10, 6))
sns.histplot(tb2['Temp_Ar_C'].dropna(), bins=30, kde=True, color='skyblue')
plt.title('Distribuição da Temperatura do Ar (°C) (São Luís, 2024)')
plt.xlabel('Temperatura do Ar (°C)')
plt.ylabel('Frequência')
plt.grid(axis='y', alpha=0.75)
plt.show()

In [None]:
# Gráfico de Boxplot - Exemplo: Distribuição da Temperatura por Mês
plt.figure(figsize=(12, 8))
sns.boxplot(x='Mes', y='Temp_Ar_C', data=tb2, palette='viridis')
plt.title('Distribuição da Temperatura do Ar (°C) por Mês (São Luís, 2024)')
plt.xlabel('Mês')
plt.ylabel('Temperatura do Ar (°C)')
plt.xticks(ticks=np.arange(12), labels=nomes_meses)
plt.grid(axis='y', alpha=0.75)
plt.show()

In [None]:
# Gráfico de Violino - Exemplo: Distribuição da Umidade por Mês
plt.figure(figsize=(12, 8))
sns.violinplot(x='Mes', y='Umidade_R_AR', data=tb2, palette='pastel')
plt.title('Distribuição da Umidade Relativa do Ar (%) por Mês (São Luís, 2024)')
plt.xlabel('Mês')
plt.ylabel('Umidade Relativa do Ar (%)')
plt.xticks(ticks=np.arange(12), labels=nomes_meses)
plt.grid(axis='y', alpha=0.75)
plt.show()


In [None]:
# Gráfico de Regressão - Relação entre Umidade e Temperatura
plt.figure(figsize=(10, 6))
sns.regplot(x='Temp_Ar_C', y='Umidade_R_AR', data=tb2, scatter_kws={'alpha':0.5})
plt.title('Regressão entre Temperatura e Umidade do Ar (São Luís, 2024)')
plt.xlabel('Temperatura do Ar (°C)')
plt.ylabel('Umidade Relativa do Ar (%)')
plt.grid(True)
plt.show()

##Referências

- Matplotlib: https://matplotlib.org
- Seaborn: https://seaborn.pydata.org
- Numpy: https://numpy.org
- Pandas: https://pandas.pydata.org
- Geopandas: https://geopandas.org/en/stable/gallery/index.html