# Desenvolver um gráfico de temperaturas médias por cidade

<a href="https://portal.inmet.gov.br/dadoshistoricos">Source link</a>

Com base em um banco de dados do Instituto Nacional de Meteorologia, o objetivo é criar um código que consiga extrair os dados fornecidos e transformá-los em um gráfico, de forma dinâmica.  
Estados escolhidos:
- Minas Gerais;
- São Paulo;
- Rio de Janeiro;
- Distrito Federal;
- Goiás e;
- Bahia.

### Passo-a-passo:

1. Importar as bibliotecas necessárias para o código;
2. selecionar os estados informados acima;
3. isolar os nomes das cidades que constam no banco de dados;
4. importar o banco de dados;
5. tratar o banco de dados;
6. agrupar os dados por mês;
7. tratar os nomes das linhas, definindo o mês em questão;
8. criar e exibir o gráfico interativo.

##### 1. Importar as bibliotecas necessárias para o código:

In [1]:
import os
import pandas as pd
import re
import plotly.graph_objects as go

##### Passos 2 e 3 - Selecionar os estados informados, isolar os nomes das cidades que constam no banco de dados:

In [2]:
[cities_mg, cities_rj, cities_sp, cities_go, cities_df, cities_ba] = [dict(), dict(), dict(), dict(), dict(), dict()]
for yr in range(2003, 2024):
    yr_list = os.listdir(f'assets/{yr}/')
    i = 0
    j = 0
    for _ in range(0, len(yr_list)):
        if yr_list[i][:11] == 'INMET_SE_MG':
            cities_mg[f'{yr}_{j}'] = (yr_list[i][17:-28])
            j+=1
        if yr_list[i][:11] == 'INMET_SE_SP':
            cities_sp[f'{yr}_{j}'] = (yr_list[i][17:-28])
            j+=1
        if yr_list[i][:11] == 'INMET_SE_RJ':
            cities_rj[f'{yr}_{j}'] = (yr_list[i][17:-28])
            j+=1
        if yr_list[i][:11] == 'INMET_CO_DF':
            cities_df[f'{yr}_{j}'] = (yr_list[i][17:-28])
            j+=1
        if yr_list[i][:11] == 'INMET_CO_GO':
            cities_go[f'{yr}_{j}'] = (yr_list[i][17:-28])
            j+=1
        if yr_list[i][:11] == 'INMET_NE_BA':
            cities_ba[f'{yr}_{j}'] = (yr_list[i][17:-28])
            j+=1
        i+=1
display(cities_mg, cities_sp)

{'2003_12': 'BARBACENA',
 '2003_13': 'ARAXA',
 '2003_14': 'MONTES CLAROS',
 '2003_15': 'UBERLANDIA',
 '2003_16': 'ALMENARA',
 '2004_12': 'BARBACENA',
 '2004_13': 'ARAXA',
 '2004_14': 'MONTES CLAROS',
 '2004_15': 'UBERLANDIA',
 '2004_16': 'ALMENARA',
 '2004_17': 'MONTE VERDE',
 '2005_12': 'BARBACENA',
 '2005_13': 'ARAXA',
 '2005_14': 'MONTES CLAROS',
 '2005_15': 'UBERLANDIA',
 '2005_16': 'ALMENARA',
 '2005_17': 'MONTE VERDE',
 '2005_18': 'VICOSA',
 '2006_14': 'BARBACENA',
 '2006_15': 'ARAXA',
 '2006_16': 'MONTES CLAROS',
 '2006_17': 'UBERLANDIA',
 '2006_18': 'ALMENARA',
 '2006_19': 'MONTE VERDE',
 '2006_20': 'VICOSA',
 '2006_21': 'TIMOTEO',
 '2006_22': 'ITUIUTABA',
 '2006_23': 'OURO BRANCO',
 '2006_24': 'SAO JOAO DEL REI',
 '2006_25': 'VARGINHA',
 '2006_26': 'PASSOS',
 '2006_27': 'MURIAE',
 '2006_28': 'CAMPINA VERDE',
 '2006_29': 'CONCEICAO DAS ALAGOAS',
 '2006_30': 'PAMPULHA',
 '2006_31': 'SERRA DOS AIMORES',
 '2006_32': 'PATROCINIO',
 '2006_33': 'FORMIGA',
 '2006_34': 'SACRAMENTO',
 '

{'2003_21': 'BAURU',
 '2003_22': 'CAMPOS DO JORDAO',
 '2003_23': 'PRESIDENTE PRUDENTE',
 '2003_24': 'FRANCA',
 '2004_22': 'BAURU',
 '2004_23': 'CAMPOS DO JORDAO',
 '2004_24': 'PRESIDENTE PRUDENTE',
 '2004_25': 'FRANCA',
 '2005_23': 'BAURU',
 '2005_24': 'CAMPOS DO JORDAO',
 '2005_25': 'PRESIDENTE PRUDENTE',
 '2005_26': 'FRANCA',
 '2006_52': 'SAO PAULO - MIRANTE',
 '2006_53': 'BAURU',
 '2006_54': 'CAMPOS DO JORDAO',
 '2006_55': 'PRESIDENTE PRUDENTE',
 '2006_56': 'FRANCA',
 '2006_57': 'SAO CARLOS',
 '2006_58': 'IGUAPE',
 '2006_59': 'SOROCABA',
 '2006_60': 'ITAPEVA',
 '2006_61': 'SAO MIGUEL ARCANJO',
 '2006_62': 'OURINHOS',
 '2006_63': 'RANCHARIA',
 '2006_64': 'AVARE',
 '2006_65': 'PIRACICABA',
 '2006_66': 'LINS',
 '2006_67': 'TAUBATE',
 '2006_68': 'VOTUPORANGA',
 '2007_97': 'SAO PAULO - MIRANTE',
 '2007_98': 'BAURU',
 '2007_99': 'CAMPOS DO JORDAO',
 '2007_100': 'PRESIDENTE PRUDENTE',
 '2007_101': 'FRANCA',
 '2007_102': 'SAO CARLOS',
 '2007_103': 'IGUAPE',
 '2007_104': 'SOROCABA',
 '2007_1

##### Passos 4 e 5 - importar e tratar o banco de dados:

In [3]:
user_yr = input('Digite o ano ')
user_city = input('Digite a cidade ').replace('-', r'\-').replace('(', r'\(').replace(')', r'\)').upper()
user_yr_list = os.listdir(f'assets/{user_yr}/')
for file in user_yr_list:
    if re.search(f'{user_city}', file) != None:
        city_data = pd.read_csv(f'assets/{user_yr}/{file}', skiprows=8, encoding='latin-1', on_bad_lines='skip', sep=';', usecols=[0,7,15,18])
        city_data.rename(columns={city_data.iloc[:, 0].name: 'Data'}, inplace=True)
        city_data['Data'] = pd.to_datetime(city_data['Data'])
        city_data['TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)'] = city_data['TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)'].str.replace(',', '.').str.replace('-9999', 'NaN').astype(float)
        city_data['UMIDADE RELATIVA DO AR, HORARIA (%)'] = city_data['UMIDADE RELATIVA DO AR, HORARIA (%)'].replace(',', '.').replace(-9999, 'NaN').astype(float)
        city_data['VENTO, VELOCIDADE HORARIA (m/s)'] = city_data['VENTO, VELOCIDADE HORARIA (m/s)'].str.replace(',', '.').str.replace('-9999', 'NaN').astype(float)
        display(city_data)

Unnamed: 0,Data,"TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)","UMIDADE RELATIVA DO AR, HORARIA (%)","VENTO, VELOCIDADE HORARIA (m/s)"
0,2023-01-01,20.6,85.0,1.7
1,2023-01-01,20.1,89.0,1.3
2,2023-01-01,19.9,90.0,1.3
3,2023-01-01,19.6,91.0,0.4
4,2023-01-01,19.3,91.0,0.5
...,...,...,...,...
7291,2023-10-31,27.5,52.0,2.0
7292,2023-10-31,25.8,62.0,1.6
7293,2023-10-31,21.0,82.0,4.3
7294,2023-10-31,20.3,89.0,2.4


In [4]:
display(city_data.info())

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 7296 entries, 0 to 7295
Data columns (total 4 columns):
 #   Column                                        Non-Null Count  Dtype         
---  ------                                        --------------  -----         
 0   Data                                          7296 non-null   datetime64[ns]
 1   TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)  7296 non-null   float64       
 2   UMIDADE RELATIVA DO AR, HORARIA (%)           7296 non-null   float64       
 3   VENTO, VELOCIDADE HORARIA (m/s)               7296 non-null   float64       
dtypes: datetime64[ns](1), float64(3)
memory usage: 228.1 KB


None

In [5]:
city_table = city_data.groupby('Data').mean()
display(city_table)

Unnamed: 0_level_0,"TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)","UMIDADE RELATIVA DO AR, HORARIA (%)","VENTO, VELOCIDADE HORARIA (m/s)"
Data,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1
2023-01-01,21.329167,83.208333,1.362500
2023-01-02,20.983333,83.250000,1.437500
2023-01-03,20.775000,85.916667,1.150000
2023-01-04,20.845833,87.375000,1.029167
2023-01-05,20.270833,90.833333,0.466667
...,...,...,...
2023-10-27,22.779167,80.791667,1.283333
2023-10-28,23.912500,75.583333,1.333333
2023-10-29,25.812500,68.875000,1.183333
2023-10-30,24.470833,75.708333,1.166667


##### 6. Agrupar os dados de mês em mês:

In [6]:
city_table = city_data.groupby(pd.Grouper(key='Data',axis=0, freq='M')).mean()

city_table.reset_index(inplace=True)
display(city_table)

Unnamed: 0,Data,"TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)","UMIDADE RELATIVA DO AR, HORARIA (%)","VENTO, VELOCIDADE HORARIA (m/s)"
0,2023-01-31,22.116398,79.841398,1.218414
1,2023-02-28,24.002679,68.363095,1.483036
2,2023-03-31,24.180645,62.973118,1.606989
3,2023-04-30,22.113472,70.718056,1.501667
4,2023-05-31,20.025538,66.086022,1.33414
5,2023-06-30,18.713889,64.847222,1.134861
6,2023-07-31,19.483871,61.110215,1.462769
7,2023-08-31,21.232258,59.0,1.563844
8,2023-09-30,24.017917,55.284722,2.152917
9,2023-10-31,24.763978,65.067204,1.697312


##### 7. Tratar os nomes das linhas, definindo o mês em questão:

In [7]:
i=0
for month in ['Jan', 'Fev', 'Mar', 'Abr', 'Mai', 'Jun', 'Jul', 'Ago', 'Set', 'Out', 'Nov', 'Dez']:
    city_table['Data'][i] = f'{month}/{user_yr[2:]}'
    i+=1

display(city_table['Data'])

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  city_table['Data'][i] = f'{month}/{user_yr[2:]}'
  city_table['Data'][i] = f'{month}/{user_yr[2:]}'
A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  city_table['Data'][i] = f'{month}/{user_yr[2:]}'


0    Jan/23
1    Fev/23
2    Mar/23
3    Abr/23
4    Mai/23
5    Jun/23
6    Jul/23
7    Ago/23
8    Set/23
9    Out/23
Name: Data, dtype: object

##### 8. Criar e exibir o gráfico interativo:

In [8]:
city_table.dropna(inplace=True)
fig = go.Figure(
    data=[go.Scatter(x=city_table['Data'], y=city_table['TEMPERATURA DO AR - BULBO SECO, HORARIA (°C)'])],
    skip_invalid=True,
    empty=False,
    layout = go.Layout(title=go.layout.Title(text=f'Temperatura média/mês no ano de {user_yr} em {user_city.title()}'))
    )
fig.update_layout(xaxis_title_text=f'Meses do ano', yaxis_title_text='Temperatura média (ºC)')
fig.show()