In [86]:
import pandas as pd
import matplotlib.pyplot as plt
import plotly.express as px
import seaborn as sns
import plotly.io as pio
import plotly.express as px
import plotly.subplots as sp
import plotly.graph_objects as go
from plotly.subplots import make_subplots

pio.renderers.default = 'notebook_connected'

In [87]:
tabelas = ["2022.xlsx","2021.xlsx","2020.xlsx","2019.xlsx","2018.xlsx","2017.xlsx","2016.xlsx","2015.xlsx","2014.xlsx","2013.xlsx","2012.xlsx","2011.xlsx","2010.xlsx","2009.xlsx","2008.xlsx","2007.xlsx","2006.xlsx","2005.xlsx","2004.xlsx"]
meses = {1:'Janeiro',2:'Fevereiro',3:'Março',4:'Abril',5:'Maio',6:'Junho',7:'Julho',8:'Agosto',9:'Setembro',10:'Outubro',11:'Novembro',12:'Dezembro'}

## Análise da Maior Temperatura Anual ao longo do tempo

In [88]:
maiores_temperaturas = {'Ano':[],'Tmáx':[],'Mês':[]}
for i in range(len(tabelas)):
    mes = {'Tmáx':[],'Mês':[]}
    for j in range(12):
        dados = pd.read_excel(tabelas[i], sheet_name=j)
        mes['Tmáx'].append(dados['TMAX'].max())
        mes['Mês'].append(meses[j+1])
    maiores_temperaturas['Ano'].append(tabelas[i].split(".")[0])
    maiores_temperaturas['Tmáx'].append(max(mes['Tmáx']))
    maiores_temperaturas['Mês'].append(mes['Mês'][mes['Tmáx'].index(max(mes['Tmáx']))])    

In [89]:
df = pd.DataFrame(maiores_temperaturas)

In [90]:
display(df)

Unnamed: 0,Ano,Tmáx,Mês
0,2022,33.927586,Janeiro
1,2021,34.962069,Setembro
2,2020,37.275172,Outubro
3,2019,36.734074,Fevereiro
4,2018,34.788571,Dezembro
5,2017,35.4625,Outubro
6,2016,36.119259,Outubro
7,2015,36.535417,Janeiro
8,2014,36.722692,Outubro
9,2013,34.468333,Novembro


In [91]:
fig = px.line(df, x='Ano', y='Tmáx', hover_data=['Mês'], labels={'Tmáx': 'Temperatura (°C)'})
fig.update_layout(title={'text': 'Variação Anual da Temperatura Máxima', 'x': 0.5})
fig.update_layout(xaxis={'type': 'category', 'tickmode': 'array', 'dtick': 1})

fig.show()

### Quais são os meses que possuem a maior temperatura anual de 2004 até 2022?

In [92]:
# Agrupar os dados por Mês e criar uma lista de todos os anos
agrupado = df.groupby('Mês')['Ano'].apply(list).reset_index(name='Anos')

# Adicionar contagem de meses
agrupado['Contagem'] = agrupado['Anos'].apply(len)

# Criar o gráfico interativo de barras usando o DataFrame agrupado
fig = px.bar(agrupado, x='Mês', y='Contagem', labels={'x': 'Mês', 'y': 'Quantidade'},
             hover_data={'Mês': False, 'Anos': True}, title='Contagem de Meses')

# Centralizar o título
fig.update_layout(title={'text': 'Contagem de Meses', 'x': 0.5})

# Exibir o gráfico interativo
fig.show()

Os meses de dezembro, janeiro e fevereiro são caracterizados pelo período de verão, portanto, é compreensível que ocorram temperaturas mais altas durante essa temporada do ano. No entanto, é necessário investigar os possíveis fenômenos que contribuem para o aumento da temperatura durante o mês de março, que é caracterizado como período de outono, e que não é natural para essa estação. Da mesma forma, devemos analisar os meses de setembro, outubro e novembro, que pertencem à estação da primavera, mas também podem apresentar temperaturas elevadas segundo esses dados.

Primavera: setembro, outubro e novembro.
Verão: dezembro, janeiro e fevereiro.
Outono: março, abril e maio.
Inverno: junho, julho e agosto.

#### Análise de por que o mês de outubro é o que possui a temperatura mais elevada

In [96]:
tabelas1 = ["2020.xlsx","2017.xlsx","2016.xlsx","2014.xlsx"]

In [97]:
temperaturas_de_outubro = {'Ano':[],'Tmáx':[],'Umidade':[],'Dia':[]}
for i in range(len(tabelas1)):
    dados = pd.read_excel(tabelas[i], sheet_name=10)
    for j, temperatura in enumerate(dados['TMAX']):
        temperaturas_de_outubro['Ano'].append(tabelas1[i].split(".")[0])
        temperaturas_de_outubro['Tmáx'].append(temperatura)
        temperaturas_de_outubro['Umidade'].append(dados['MÉDIA'][j])  
        temperaturas_de_outubro['Dia'].append(dados['Dia'][j])

In [98]:
display(pd.DataFrame(temperaturas_de_outubro))

Unnamed: 0,Ano,Tmáx,Umidade,Dia
0,2020,18.785714,85.467857,1
1,2020,14.460714,90.600000,2
2,2020,16.853571,68.267857,3
3,2020,18.817857,56.025000,4
4,2020,20.589286,55.621429,5
...,...,...,...,...
116,2014,34.876552,23.077241,27
117,2014,32.139643,35.916071,28
118,2014,31.290357,41.826071,29
119,2014,33.930000,35.544828,30


In [99]:
df = pd.DataFrame(temperaturas_de_outubro)
fig = make_subplots(rows=2, cols=2)
coords = [(1, 1), (1, 2), (2, 1), (2, 2)]
for i, (ano, coord) in enumerate(zip(df['Ano'].unique(), coords), 1):
    df_ano = df[df['Ano'] == ano]
    fig.add_trace(go.Scatter(x=df_ano['Dia'], y=df_ano['Tmáx'], mode='lines+markers', name=str(ano),
                             hovertemplate='Dia: %{x}<br>Temperatura: %{y:.2f}°C<br>Umidade: %{text}%<extra></extra>',
                             text=df_ano['Umidade']),
                  row=coord[0], col=coord[1])
    fig.update_xaxes(title_text='Dia', row=coord[0], col=coord[1])
    fig.update_yaxes(title_text='Temperatura (°C)', row=coord[0], col=coord[1])

fig.update_layout(
    title=dict(text='Variação da Temperatura Máxima por dia nos meses de Outubro', x=0.5, y=0.95),
    height=600,
    width=1000
)

fig.show()

Em geral, o mês de outubro é amplamente reconhecido como um período de transição para a primavera, especialmente na região Sudeste do Brasil. Durante esse período, é comum observar um retorno mais frequente das chuvas, muitas vezes acompanhadas por tempestades, principalmente no período da tarde e noite. No entanto, ao analisarmos uma série temporal, é interessante notar que, em determinados anos, o mês de outubro registra as temperaturas mais altas do ano em seis ocasiões. Esse fato curioso  levando-me a realizar pesquisas sobre as possíveis explicações para esse fenômeno. Entre as explicações mais plausíveis, destacam-se a presença de pequenos fenômenos meteorológicos, como massas de ar seco e quente, e o fenômeno conhecido como ilha de calor, que ocorre nessa região.

## Análisa da Temperatura Mínima

In [101]:
menores_temperaturas = {'Ano':[],'TMIN':[],'Mês':[]}
for i in range(len(tabelas)):
    mes = {'TMIN':[],'Mês':[]}
    for j in range(12):
        dados = pd.read_excel(tabelas[i], sheet_name=j)
        mes['TMIN'].append(dados['TMIN'].min())
        mes['Mês'].append(meses[j+1])
    menores_temperaturas['Ano'].append(tabelas[i].split(".")[0])
    menores_temperaturas['TMIN'].append(min(mes['TMIN']))
    menores_temperaturas['Mês'].append(mes['Mês'][mes['TMIN'].index(min(mes['TMIN']))])   

In [102]:
df = pd.DataFrame(menores_temperaturas)

In [103]:
display(df)

Unnamed: 0,Ano,TMIN,Mês
0,2022,6.296296,Maio
1,2021,3.218571,Julho
2,2020,8.094138,Agosto
3,2019,5.007586,Julho
4,2018,8.028571,Maio
5,2017,7.569231,Junho
6,2016,3.524286,Junho
7,2015,9.895833,Julho
8,2014,8.5064,Junho
9,2013,5.27875,Julho


In [104]:
fig = px.line(df, x='Ano', y='TMIN', hover_data=['Mês'], labels={'Tmín': 'Temperatura (°C)'})
fig.update_layout(title={'text': 'Variação Anual da Temperatura Mínima', 'x': 0.5})
fig.update_layout(xaxis={'type': 'category', 'tickmode': 'array', 'dtick': 1})

fig.show()

In [105]:
agrupado = df.groupby('Mês')['Ano'].apply(list).reset_index(name='Anos')

agrupado['Contagem'] = agrupado['Anos'].apply(len)

fig = px.bar(agrupado, x='Mês', y='Contagem', labels={'x': 'Mês', 'y': 'Quantidade'},
             hover_data={'Mês': False, 'Anos': True}, title='Contagem de Meses')

fig.update_layout(title={'text': 'Contagem de Meses', 'x': 0.5})

fig.show()