In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeRegressor
from sklearn.metrics import mean_absolute_error, mean_squared_error, r2_score

In [2]:
# Leitura dos dados
dados = pd.read_csv('../data/dados_processados/CAMPO_GRANDE_01-01-2002_A_31-12-2022_com_media_por_dia_v4.CSV')
dados = dados.drop('Unnamed: 0', axis=1)

In [3]:
# Pré-processamento
df = pd.DataFrame(dados)
df['Data'] = pd.to_datetime(df['Data'], format='%Y-%m-%d')
df['Mês'] = df['Data'].dt.month.astype(float)
df = df.dropna(axis=0, how='any')

In [4]:
# Variáveis independentes (todas as outras colunas, exceto 'PRECIP. TOTAL (mm)' e 'Data')
X = df.drop(['PRECIP. TOTAL (mm)', 'Data'], axis=1)

In [5]:
# Variável dependente
Y = df['PRECIP. TOTAL (mm)']

In [6]:
# Divisão em conjunto de treinamento e teste
X_train, X_test, Y_train, Y_test = train_test_split(X, Y, test_size=0.2, random_state=1)

In [7]:
# Modelo de Árvore de Decisão
model = DecisionTreeRegressor()
model.fit(X_train, Y_train)

In [8]:
# Previsões no conjunto de teste
previsoes = model.predict(X_test)

In [10]:
# Avaliação do modelo
mae = mean_absolute_error(Y_test, previsoes)
mse = mean_squared_error(Y_test, previsoes)
r2 = r2_score(Y_test, previsoes)

# Exibindo resultados
print(f'Modelo: Árvore de Decisão')
print(f'MAE: {mae}')
print(f'MSE: {mse}')
print(f'R-squared: {r2}')

Modelo: Árvore de Decisão
MAE: 7.628069213081928
MSE: 48540.668438055145
R-squared: 0.9887067519276208
