In [1]:
import pandas as pd
import numpy as np


# 2.0 - Regressão:

#### 2.0.1 - Métricas de Performance

In [2]:
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error, mean_absolute_percentage_error

Métricas de performance: 
- **R2 (Coeficiente de Determinação)** - Mede o quão bem o modelo explica a variabilidade da variável dependente. Seu valor varia de 0 a 1, onde 1 indica que o modelo explica 100% da variabilidade dos dados e 0 indica que o modelo não explica nada.
- **MSE (Mean Squared Error - Erro Quadrático Médio)** - Calcula a média dos quadrados dos erros (diferença entre os valores reais e previstos). Como os erros são elevados ao quadrado, penaliza erros grandes mais severamente, o que pode ser útil para evitar grandes desvios.
- **RMSE (Root Mean Squared Error - Raiz do Erro Quadrático Médio):** - É simplesmente a raiz quadrada do MSE. Essa métrica tem a vantagem de manter a mesma unidade da variável alvo, tornando a interpretação mais intuitiva.
- **MAE (Mean Absolute Error - Erro Médio Absoluto)** - Calcula a média dos erros absolutos entre os valores reais e previstos. Diferente do MSE, ele não eleva os erros ao quadrado, o que significa que grandes erros não são tão penalizados.
- **MAPE (Mean Absolute Percentage Error - Erro Médio Percentual Absoluto)** -Mede o erro médio percentual entre os valores reais e previstos. Diferente das outras métricas, ele é expresso em porcentagem, tornando mais fácil interpretar a precisão do modelo em termos relativos.

#### 2.0.2 - Importando Data Regressão

In [3]:
#Importando dados de Treino
X_training = pd.read_csv( '../data/Regression/X_training.csv' )
y_training = pd.read_csv( '../data/Regression/y_training.csv' )

# Visualizando informações dos dados  de treino
print('Dados de Treino')
print("X_training shape:", X_training.shape)
print("y_training shape:", y_training.shape)


#Importando Dados de Validação
X_validation = pd.read_csv( '../data/Regression/X_validation.csv' )
y_validation = pd.read_csv( '../data/Regression/y_val.csv' )

# Visualizando informações dos dados de validação
print('\nDados de Validação')
print("X_validation shape:", X_validation.shape)
print("y_valalidation shape:", y_validation.shape)


#Importando Dados de Teste
X_test = pd.read_csv( '../data/Regression/X_test.csv' )
y_test = pd.read_csv( '../data/Regression/y_test.csv' )

# Visualizando informações dos dados de teste
print('\nDados de Teste')
print("X_test shape:", X_test.shape)
print("y_test shape:", y_test.shape)

Dados de Treino
X_training shape: (10547, 13)
y_training shape: (10547, 1)

Dados de Validação
X_validation shape: (4521, 13)
y_valalidation shape: (4521, 1)

Dados de Teste
X_test shape: (3767, 13)
y_test shape: (3767, 1)


In [4]:
display(X_training.head(1))
y_training.shape

Unnamed: 0,song_duration_ms,acousticness,danceability,energy,instrumentalness,key,liveness,loudness,audio_mode,speechiness,tempo,time_signature,audio_valence
0,0.205673,0.0921,0.72,0.802,0.0,0.090909,0.694,0.431778,1,0.0582,0.103876,0.8,0.723


(10547, 1)

## 2.1 -  <u>Decision Tree Regressor</u>

Hiperparâmetros:
- **max_depth** - Define a profundidade máxima da árvore de decisão, controlando o quanto o modelo pode se ramificar para separar os dados e influenciando o equilíbrio entre underfitting (menor profundidade) e overfitting (maior profuncidade).

#### Treinando Modelo Decision Tree Regressor

In [5]:
# Importar Algorítimo
from sklearn.tree import DecisionTreeRegressor

random_state = 0
max_depth = 28

#Criar Instância Decision Tree Regressor
decision_tree_regressor = DecisionTreeRegressor(random_state=random_state, max_depth=max_depth)

# Treina  Modelo  
decision_tree_regressor = decision_tree_regressor.fit(X_training, y_training)

#### Dados de Treino

In [6]:
# Fazer previsões de Treino
y_pred = decision_tree_regressor.predict(X_training)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred)  
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred)  

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_decision_tree_reg = pd.DataFrame({
    "Algoritmo": ["Decision Tree Regressor"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_decision_tree_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Decision Tree Regressor,Treino,0.991,4.401,2.098,0.286,0.084


#### Dados de Validação

In [7]:
# Fazer previsões de Validação
y_pred = decision_tree_regressor.predict(X_validation)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred)  
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Decision Tree Regressor"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_decision_tree_reg = pd.concat([df_decision_tree_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_decision_tree_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Decision Tree Regressor,Validação,-0.283,612.767,24.754,17.103,6.871


#### Dados de Teste

In [8]:
# Concatenar os dados de treino e teste
X_combined = pd.concat([X_training, X_validation], axis=0)
y_combined = pd.concat([y_training, y_validation], axis=0)

# Retreinar o Modelo com os dados combinados  
decision_tree_regressor = decision_tree_regressor.fit(X_combined, y_combined)

In [9]:
# Fazer previsões de Teste
y_pred = decision_tree_regressor.predict(X_test)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred)  
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred) 
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Decision Tree Regressor"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Adicionar a nova linha ao DataFrame existente
df_decision_tree_reg = pd.concat([df_decision_tree_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_decision_tree_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Decision Tree Regressor,Teste,-0.179,574.155,23.962,15.826,6.04


#### Resultado Final Decision Tree Regressor

In [10]:
df_decision_tree_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Decision Tree Regressor,Treino,0.991,4.401,2.098,0.286,0.084
1,Decision Tree Regressor,Validação,-0.283,612.767,24.754,17.103,6.871
2,Decision Tree Regressor,Teste,-0.179,574.155,23.962,15.826,6.04


## 2.2 - <u>Random Forest Regressor</u>

Hiperparâmetros:
- **max_depth** - Define a profundidade máxima da árvore de decisão, controlando o quanto o modelo pode se ramificar para separar os dados e influenciando o equilíbrio entre underfitting (menor profundidade) e overfitting (maior profuncidade).
- **n_estimators** - Define o número de árvores na floresta, influenciando a estabilidade e a precisão do modelo. Mais árvores geralmente melhoram o desempenho, mas aumentam o custo computacional.

#### Treinando o Modelo Random Forest Regressor

In [11]:
# Importar Algorítimo
from sklearn.ensemble import RandomForestRegressor

max_depth = 28
n_estimators = 165

# Criar instância do Random Forest Regressor
rf_regressor = RandomForestRegressor(n_estimators=n_estimators, max_depth=max_depth, random_state=random_state)

# Converter y_training para NumPy e ajustar o formato
y_training_flat = y_training.to_numpy().ravel()

# Treinar o modelo
rf_regressor.fit(X_training, y_training_flat)

#### Dados de Treino

In [12]:
# Fazer previsões de Treino
y_pred = rf_regressor.predict(X_training)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_rf_reg = pd.DataFrame({
    "Algoritmo": ["Random Forest Regressor"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_rf_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Random Forest Regressor,Treino,0.904,45.827,6.77,4.849,2.606


#### Dados de Validação

In [13]:
# Fazer previsões de Validação
y_pred = rf_regressor.predict(X_validation)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred)  
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse) 
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Random Forest Regressor"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_rf_reg = pd.concat([df_rf_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_rf_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Random Forest Regressor,Validação,0.339,315.474,17.762,12.955,7.039


#### Dados de Teste

In [14]:
# Converter y_combined para NumPy e ajustar o formato
y_combined_flat = y_combined.to_numpy().ravel()

# Retreina o Modelo com os dados combinados
rf_regressor = rf_regressor.fit(X_combined, y_combined_flat)

In [15]:
# Fazer previsões de Teste
y_pred = rf_regressor.predict(X_test)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred)  
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred) 
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Random Forest Regressor"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Adicionar a nova linha ao DataFrame existente
df_rf_reg = pd.concat([df_rf_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_rf_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Random Forest Regressor,Teste,0.406,289.291,17.009,12.228,6.33


#### Resultado Final Random Forest Regressor

In [16]:
df_rf_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Random Forest Regressor,Treino,0.904,45.827,6.77,4.849,2.606
1,Random Forest Regressor,Validação,0.339,315.474,17.762,12.955,7.039
2,Random Forest Regressor,Teste,0.406,289.291,17.009,12.228,6.33


## 2.3 - <u>Linear Regression</u> 

In [17]:
# Importar Algoritmo
from sklearn.linear_model import LinearRegression

# Criar instância do modelo Linear Regression
linear_reg = LinearRegression()

# Treinar o modelo
linear_reg = linear_reg.fit(X_training, y_training)

#### Dados de Treino

In [18]:
# Fazer previsões de Treino
y_pred = linear_reg.predict(X_training)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_linear_reg = pd.DataFrame({
    "Algoritmo": ["Linear Regression"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_linear_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression,Treino,0.046,455.996,21.354,16.998,8.653


#### Dados de Validação

In [19]:
# Fazer previsões de Validação
y_pred = linear_reg.predict(X_validation)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred)  
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse) 
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_linear_reg = pd.concat([df_linear_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_linear_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Linear Regression,Validação,0.04,458.447,21.411,17.04,8.683


#### Dados de Teste

In [20]:
# Retreina o Modelo com os dados combinados
linear_reg = linear_reg.fit(X_combined, y_combined)

In [21]:
# Fazer previsões de Teste
y_pred = linear_reg.predict(X_test)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred)  
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred) 
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_linear_reg = pd.concat([df_linear_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_linear_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Linear Regression,Teste,0.051,461.988,21.494,17.144,8.531


#### Resultado Final Linear Regression Lasso

In [22]:
df_linear_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression,Treino,0.046,455.996,21.354,16.998,8.653
1,Linear Regression,Validação,0.04,458.447,21.411,17.04,8.683
2,Linear Regression,Teste,0.051,461.988,21.494,17.144,8.531


## 2.4 - <u>Linear Regression Lasso</u> 

Hiperparâmetros: 
- **alpha** - Define a intensidade da penalização. Valores maiores aumentam a regularização.
- **max_iter**: Número máximo de iterações para o algoritmo de otimização convergir.

#### Treinando o Modelo Linear Regression Lasso

In [23]:
# Importar Algorítimo
from sklearn.linear_model import Lasso

# Hiperparâmetros
alpha = 1.2
max_iter = 20

# Criar Instância Linear Regression Lasso
lasso_reg = Lasso(alpha=alpha, max_iter=max_iter)

# Treinar o modelo
lasso_reg = lasso_reg.fit(X_training, y_training)

#### Dados de Treino

In [24]:
# Fazer previsões de Treino
y_pred = lasso_reg.predict(X_training)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_lasso_reg = pd.DataFrame({
    "Algoritmo": ["Linear Regression Lasso"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_lasso_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression Lasso,Treino,0.006,474.915,21.793,17.311,8.738


#### Dados de Validação

In [25]:
# Fazer previsões de Validação
y_pred = lasso_reg.predict(X_validation)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred)  
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse) 
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression Lasso"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_lasso_reg = pd.concat([df_lasso_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_lasso_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Linear Regression Lasso,Validação,0.007,474.233,21.777,17.275,8.693


#### Dados de Teste

In [26]:
# Retreina o Modelo com os dados combinados
lasso_reg = lasso_reg.fit(X_combined, y_combined)

In [27]:
# Fazer previsões de Teste
y_pred = lasso_reg.predict(X_test)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred)  
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred) 
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression Lasso"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_lasso_reg = pd.concat([df_lasso_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_lasso_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Linear Regression Lasso,Teste,0.007,483.568,21.99,17.482,8.746


#### Resultado Final Linear Regression Lasso

In [28]:
df_lasso_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression Lasso,Treino,0.006,474.915,21.793,17.311,8.738
1,Linear Regression Lasso,Validação,0.007,474.233,21.777,17.275,8.693
2,Linear Regression Lasso,Teste,0.007,483.568,21.99,17.482,8.746


## 2.5 - <u> Linear Regression Ridge</u> 

Parâmetros: 
- **alpha** - Define a intensidade da penalização. Valores maiores aumentam a regularização.
- **max_iter**: Número máximo de iterações para o algoritmo de otimização convergir.

#### Treinando o Modelo Linear Regression Ridge

In [29]:
# Importar Algorítimo
from sklearn.linear_model import Ridge

# Hiperparâmetros
alpha = 1.2 
maz_iter = 20

# Criar Instância Linear Regression Lasso
ridge_reg = Ridge(alpha=alpha, max_iter=max_iter)

# Treinar o modelo
ridge_reg = ridge_reg.fit(X_training, y_training)

#### Dados de Treino

In [30]:
# Fazer previsões de Treino
y_pred = ridge_reg.predict(X_training)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_ridge_reg = pd.DataFrame({
    "Algoritmo": ["Linear Regression Ridge"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_ridge_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression Ridge,Treino,0.046,455.997,21.354,16.998,8.653


#### Dados de Validação

In [31]:
# Fazer previsões de Validação
y_pred = ridge_reg.predict(X_validation)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred)  
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse) 
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression Ridge"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_ridge_reg = pd.concat([df_ridge_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_ridge_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Linear Regression Ridge,Validação,0.04,458.445,21.411,17.039,8.682


#### Dados de Teste

In [32]:
# Retreina o Modelo com os dados combinados
ridge_reg = ridge_reg.fit(X_combined, y_combined)

In [33]:
# Fazer previsões de Teste
y_pred = ridge_reg.predict(X_test)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred)  
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred) 
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression Ridge"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_ridge_reg = pd.concat([df_ridge_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_ridge_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Linear Regression Ridge,Teste,0.051,461.988,21.494,17.144,8.532


#### Resutaldo Final Linear Regression Ridge

In [34]:
df_ridge_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression Ridge,Treino,0.046,455.997,21.354,16.998,8.653
1,Linear Regression Ridge,Validação,0.04,458.445,21.411,17.039,8.682
2,Linear Regression Ridge,Teste,0.051,461.988,21.494,17.144,8.532


## 2.6 - <u>Linear Regression Elastic Net</u> 

Parâmetros: alpha, l1_ratio, max_tier

- **alpha** - Define a intensidade da penalização. Valores maiores aumentam a regularização.
- **max_iter** - Número máximo de iterações para o algoritmo de otimização convergir.
- **l1_ratio** -  Controla o equilíbrio entre a penalização L1 (Lasso) e L2 (Ridge) na regressão Elastic Net. Valores próximos de 1 favorecem a penalização L1, tornando o modelo mais esparso ao zerar coeficientes, enquanto valores próximos de 0 favorecem a penalização L2, que reduz coeficientes sem zerá-los.

#### Treinando o Modelo Linear Regression Elastic Net

In [35]:
# Importar Algoritmo
from sklearn.linear_model import ElasticNet

# Hiperparâmetros
alpha = 1.2
max_iter = 20
l1_ratio = 0.1  # Combinação entre L1 (Lasso) e L2 (Ridge)

# Criar Instância Elastic Net
elastic_net_reg = ElasticNet(alpha=alpha, max_iter=max_iter, l1_ratio=l1_ratio)

# Treinar o modelo
elastic_net_reg.fit(X_training, y_training)

#### Dados de Treino

In [36]:
# Fazer previsões de Treino
y_pred = elastic_net_reg.predict(X_training)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred)  
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred)  

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_elastic_net_reg = pd.DataFrame({
    "Algoritmo": ["Linear Regression Elastic Net"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_elastic_net_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression Elastic Net,Treino,0.009,473.692,21.764,17.289,8.725


#### Dados de Validação

In [37]:
# Fazer previsões de Validação
y_pred = elastic_net_reg.predict(X_validation)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred)  
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression Elastic Net"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_elastic_net_reg = pd.concat([df_elastic_net_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_elastic_net_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Linear Regression Elastic Net,Validação,0.009,473.153,21.752,17.258,8.687


#### Dados de Treino

In [38]:
# Retreinar o Modelo com os dados combinados  
elastic_net_reg = elastic_net_reg.fit(X_combined, y_combined)

In [39]:
# Fazer previsões de Teste
y_pred = elastic_net_reg.predict(X_test)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred)  
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred) 
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Linear Regression Elastic Net"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Adicionar a nova linha ao DataFrame existente
df_elastic_net_reg = pd.concat([df_elastic_net_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_elastic_net_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Linear Regression Elastic Net,Teste,0.009,482.487,21.966,17.461,8.736


#### Resultado Final Linear Regression Elastic Net

In [40]:
df_elastic_net_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Linear Regression Elastic Net,Treino,0.009,473.692,21.764,17.289,8.725
1,Linear Regression Elastic Net,Validação,0.009,473.153,21.752,17.258,8.687
2,Linear Regression Elastic Net,Teste,0.009,482.487,21.966,17.461,8.736


## 2.7 - <u>Polynomial Regression</u>

Parâmetros: 
- **degree** - Define o grau do polinômio usado na regressão, controlando a complexidade do modelo. Um grau baixo pode levar a underfitting (modelo muito simples que não captura padrões nos dados), enquanto um grau alto pode levar a overfitting (modelo muito complexo que se ajusta demais aos dados de treino, perdendo generalização).

#### Treinando o Modelo Polynomial Regression

In [41]:
# Importar Algorítimo
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import LinearRegression

# Definir Grau
degree = 2

# Criar transformação polinomial
poly_features = PolynomialFeatures(degree=degree)

# Transformar os dados de entrada
X_training_poly = poly_features.fit_transform(X_training)
X_validation_poly = poly_features.fit_transform(X_validation)
X_test_poly = poly_features.fit_transform(X_test)
X_combined_poly = poly_features.fit_transform(X_combined)

# Criar instância do modelo de regressão linear
polynomial_regressor = LinearRegression()

# Treinar o modelo com os dados transformados
polynomial_regressor = polynomial_regressor.fit(X_training_poly, y_training)

#### Dados de Treino

In [42]:
# Fazer previsões de Treino
y_pred = polynomial_regressor.predict(X_training_poly)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_poly_reg = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_poly_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression,Treino,0.094,432.986,20.808,16.458,8.351


#### Dados de Validação

In [43]:
# Fazer previsões de Validação
y_pred = polynomial_regressor.predict(X_validation_poly)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred) 
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg = pd.concat([df_poly_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Polynomial Regression,Validação,0.066,445.768,21.113,16.75,8.548


#### Dados de Teste

In [44]:
# Retreinar o Modelo com os dados combinados  
polynomial_regressor = polynomial_regressor.fit(X_combined_poly, y_combined)

In [45]:
# Fazer previsões de Teste
y_pred = polynomial_regressor.predict(X_test_poly)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred) 
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred)  
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg = pd.concat([df_poly_reg, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Polynomial Regression,Teste,0.091,442.641,21.039,16.736,8.277


#### Resutaldo Final Polynomial Regression

In [46]:
df_poly_reg

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression,Treino,0.094,432.986,20.808,16.458,8.351
1,Polynomial Regression,Validação,0.066,445.768,21.113,16.75,8.548
2,Polynomial Regression,Teste,0.091,442.641,21.039,16.736,8.277


## 2.8 - <u>Polynomial Regression Lasso</u> 

Parâmetros: 
- **degree** - Define o grau do polinômio usado na regressão, controlando a complexidade do modelo. Um grau baixo pode levar a underfitting (modelo muito simples que não captura padrões nos dados), enquanto um grau alto pode levar a overfitting (modelo muito complexo que se ajusta demais aos dados de treino, perdendo generalização).
- **alpha** - Define a intensidade da penalização. Valores maiores aumentam a regularização.
- **max_iter** - Número máximo de iterações para o algoritmo de otimização convergir.

#### Treinando o Modelo Polynomial Regression Lasso

In [47]:
# Importar Algorítmo
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import Lasso

# Hiperparâmetros
degree = 2       
alpha = 1.0      
max_iter = 1000  

# Criar transformação polinomial
poly_features = PolynomialFeatures(degree=degree)

# Transformar os dados de entrada
X_training_poly = poly_features.fit_transform(X_training)
X_validation_poly = poly_features.fit_transform(X_validation)
X_test_poly = poly_features.fit_transform(X_test)
X_combined_poly = poly_features.fit_transform(X_combined)

# Criar instância do modelo Lasso com os hiperparâmetros
lasso_reg = Lasso(alpha=alpha, max_iter=max_iter)

# Treinar o modelo com os dados transformados
lasso_reg = lasso_reg.fit(X_training_poly, y_training)

#### Dados de Treino

In [48]:
# Fazer previsões de Treino
y_pred = lasso_reg.predict(X_training_poly)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_poly_reg_lasso = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Lasso"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_poly_reg_lasso.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression Lasso,Treino,0.009,473.639,21.763,17.285,8.7


#### Dados de Validação

In [49]:
# Fazer previsões de Validação
y_pred = lasso_reg.predict(X_validation_poly)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred) 
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Lasso"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg_lasso = pd.concat([df_poly_reg_lasso, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg_lasso.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Polynomial Regression Lasso,Validação,0.01,472.913,21.747,17.238,8.682


#### Dados de Teste

In [50]:
# Retreinar o Modelo com os dados combinados  
lasso_reg = lasso_reg.fit(X_combined_poly, y_combined)

In [51]:
# Fazer previsões de Teste
y_pred = lasso_reg.predict(X_test_poly)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred) 
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred)  
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Lasso"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg_lasso = pd.concat([df_poly_reg_lasso, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg_lasso.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Polynomial Regression Lasso,Teste,0.009,482.615,21.968,17.456,8.756


#### Resultado Final Polynomial Regression Lasso

In [52]:
df_poly_reg_lasso

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression Lasso,Treino,0.009,473.639,21.763,17.285,8.7
1,Polynomial Regression Lasso,Validação,0.01,472.913,21.747,17.238,8.682
2,Polynomial Regression Lasso,Teste,0.009,482.615,21.968,17.456,8.756


## 2.9 - <u>Polynomial Regression Ridge</u>

Parâmetros: 
- **degree** - Define o grau do polinômio usado na regressão, controlando a complexidade do modelo. Um grau baixo pode levar a underfitting (modelo muito simples que não captura padrões nos dados), enquanto um grau alto pode levar a overfitting (modelo muito complexo que se ajusta demais aos dados de treino, perdendo generalização).
- **alpha** - Define a intensidade da penalização. Valores maiores aumentam a regularização.
- **max_iter** - Número máximo de iterações para o algoritmo de otimização convergir.

#### Treinando o Modelo Polynomial Regression Ridge

In [53]:
# Importar Algorítmo
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import Ridge

# Hiperparâmetros
degree = 2       
alpha = 1.0      
max_iter = 1000  

# Criar transformação polinomial
poly_features = PolynomialFeatures(degree=degree)

# Transformar os dados de entrada
X_training_poly = poly_features.fit_transform(X_training)
X_validation_poly = poly_features.fit_transform(X_validation)
X_test_poly = poly_features.fit_transform(X_test)
X_combined_poly = poly_features.fit_transform(X_combined)

# Criar instância do modelo Ridge com os hiperparâmetros
ridge_reg = Ridge(alpha=alpha, max_iter=max_iter)

# Treinar o modelo com os dados transformados
ridge_reg = ridge_reg.fit(X_training_poly, y_training)


#### Dados de Treino

In [54]:
# Fazer previsões de Treino
y_pred = ridge_reg.predict(X_training_poly)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_poly_reg_ridge = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Ridge"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_poly_reg_ridge.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression Ridge,Treino,0.093,433.475,20.82,16.472,8.373


#### Dados de Validação

In [55]:
# Fazer previsões de Validação
y_pred = ridge_reg.predict(X_validation_poly)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred) 
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Ridge"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg_ridge = pd.concat([df_poly_reg_ridge, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg_ridge.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Polynomial Regression Ridge,Validação,0.068,445.184,21.099,16.739,8.569


#### Dados de Teste

In [56]:
# Retreinar o Modelo com os dados combinados  
ridge_reg = ridge_reg.fit(X_combined_poly, y_combined)

In [57]:
# Fazer previsões de Teste
y_pred = ridge_reg.predict(X_test_poly)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred) 
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred)  
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Ridge"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg_ridge = pd.concat([df_poly_reg_ridge, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg_ridge.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Polynomial Regression Ridge,Teste,0.09,442.967,21.047,16.742,8.309


#### Resultado Final Poliynomial Regression Ridge

In [58]:
df_poly_reg_ridge

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression Ridge,Treino,0.093,433.475,20.82,16.472,8.373
1,Polynomial Regression Ridge,Validação,0.068,445.184,21.099,16.739,8.569
2,Polynomial Regression Ridge,Teste,0.09,442.967,21.047,16.742,8.309


## 2.10 - <u>Poliynomial Regression Elastic Net</u>

Parâmetros: 
- **degree** - Define o grau do polinômio usado na regressão, controlando a complexidade do modelo. Um grau baixo pode levar a underfitting (modelo muito simples que não captura padrões nos dados), enquanto um grau alto pode levar a overfitting (modelo muito complexo que se ajusta demais aos dados de treino, perdendo generalização).
- **alpha** - Define a intensidade da penalização. Valores maiores aumentam a regularização.
- **max_iter** - Número máximo de iterações para o algoritmo de otimização convergir.
- **l1_ratio** - Controla o equilíbrio entre a penalização L1 (Lasso) e L2 (Ridge) na regressão Elastic Net. Valores próximos de 1 favorecem a penalização L1, tornando o modelo mais esparso ao zerar coeficientes, enquanto valores próximos de 0 favorecem a penalização L2, que reduz coeficientes sem zerá-los.

#### Treinando o Modelo Polynomial Regression Elastic Net

In [59]:
# Importar Algorítmo
from sklearn.preprocessing import PolynomialFeatures
from sklearn.linear_model import ElasticNet

# Hiperparâmetros
degree = 2       
alpha = 1.0      
max_iter = 1000  
l1_ratio = 0.1   

# Criar transformação polinomial
poly_features = PolynomialFeatures(degree=degree)

# Transformar os dados de entrada
X_training_poly = poly_features.fit_transform(X_training)
X_validation_poly = poly_features.fit_transform(X_validation)
X_test_poly = poly_features.fit_transform(X_test)
X_combined_poly = poly_features.fit_transform(X_combined)

# Criar instância do modelo Elastic Net com os hiperparâmetros
elastic_net_reg = ElasticNet(alpha=alpha, max_iter=max_iter, l1_ratio=l1_ratio)

# Treinar o modelo com os dados transformados
elastic_net_reg = elastic_net_reg.fit(X_training_poly, y_training)

#### Dados de Treino

In [60]:
# Fazer previsões de Treino
y_pred = elastic_net_reg.predict(X_training_poly)

# Cálculo das métricas
r2 = r2_score(y_training, y_pred) 
mse = mean_squared_error(y_training, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_training, y_pred)  
mape = mean_absolute_percentage_error(y_training, y_pred) 

# Criando um DataFrame com as métricas como colunas e nome do algoritmo
df_poly_reg_elastic_net = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Elastic Net"],
    "Etapa": ["Treino"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})

# Exibir os resultados
df_poly_reg_elastic_net.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression Elastic Net,Treino,0.023,467.206,21.615,17.152,8.646


#### Dados de Validação

In [61]:
# Fazer previsões de Validação
y_pred = elastic_net_reg.predict(X_validation_poly)

# Cálculo das métricas
r2 = r2_score(y_validation, y_pred) 
mse = mean_squared_error(y_validation, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_validation, y_pred)  
mape = mean_absolute_percentage_error(y_validation, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Elastic Net"],
    "Etapa": ["Validação"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg_elastic_net = pd.concat([df_poly_reg_elastic_net, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg_elastic_net.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
1,Polynomial Regression Elastic Net,Validação,0.02,467.723,21.627,17.127,8.666


#### Dados de Teste

In [62]:
# Retreinar o Modelo com os dados combinados  
elastic_net_reg = elastic_net_reg.fit(X_combined_poly, y_combined)

In [63]:
# Fazer previsões de Teste
y_pred = elastic_net_reg.predict(X_test_poly)

# Cálculo das métricas
r2 = r2_score(y_test, y_pred) 
mse = mean_squared_error(y_test, y_pred)  
rmse = np.sqrt(mse)  
mae = mean_absolute_error(y_test, y_pred)  
mape = mean_absolute_percentage_error(y_test, y_pred) 

# Criando uma nova linha com os valores calculados
nova_linha = pd.DataFrame({
    "Algoritmo": ["Polynomial Regression Elastic Net"],
    "Etapa": ["Teste"],
    "R²": [round(r2, 3)],
    "MSE": [round(mse, 3)],
    "RMSE": [round(rmse, 3)],
    "MAE": [round(mae, 3)],
    "MAPE": [round(mape, 3)]
})


# Adicionar a nova linha ao DataFrame existente
df_poly_reg_elastic_net = pd.concat([df_poly_reg_elastic_net, nova_linha], ignore_index=True)

# Exibir apenas a última linha inserida
df_poly_reg_elastic_net.tail(1)

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
2,Polynomial Regression Elastic Net,Teste,0.019,477.764,21.858,17.347,8.719


#### Resultado Final Poliynomial Regression Elastic Net

In [64]:
df_poly_reg_elastic_net

Unnamed: 0,Algoritmo,Etapa,R²,MSE,RMSE,MAE,MAPE
0,Polynomial Regression Elastic Net,Treino,0.023,467.206,21.615,17.152,8.646
1,Polynomial Regression Elastic Net,Validação,0.02,467.723,21.627,17.127,8.666
2,Polynomial Regression Elastic Net,Teste,0.019,477.764,21.858,17.347,8.719


## 2.11 - <u>Resultado Final Regressão</u>

In [65]:
# Juntar os 4 DataFrames em um único
df_regression = pd.concat([df_decision_tree_reg, 
                           df_rf_reg,
                           df_linear_reg,
                           df_lasso_reg, 
                           df_ridge_reg,
                           df_elastic_net_reg,
                           df_poly_reg,
                           df_poly_reg_lasso,
                           df_poly_reg_ridge,
                           df_poly_reg_elastic_net],
                           ignore_index=True)

# Criar DataFrames separados por etapa
df_regression_train = df_regression.query("Etapa == 'Treino'").drop(columns=["Etapa"])
df_regression_val = df_regression.query("Etapa == 'Validação'").drop(columns=["Etapa"])
df_regression_test = df_regression.query("Etapa == 'Teste'").drop(columns=["Etapa"])

# Exibir os DataFrames criados
print('Dados de Treino:')
display(df_regression_train)
print('\nDados de Validação:')
display(df_regression_val)
print('\nDados de Tete:')
display(df_regression_test)

Dados de Treino:


Unnamed: 0,Algoritmo,R²,MSE,RMSE,MAE,MAPE
0,Decision Tree Regressor,0.991,4.401,2.098,0.286,0.084
3,Random Forest Regressor,0.904,45.827,6.77,4.849,2.606
6,Linear Regression,0.046,455.996,21.354,16.998,8.653
9,Linear Regression Lasso,0.006,474.915,21.793,17.311,8.738
12,Linear Regression Ridge,0.046,455.997,21.354,16.998,8.653
15,Linear Regression Elastic Net,0.009,473.692,21.764,17.289,8.725
18,Polynomial Regression,0.094,432.986,20.808,16.458,8.351
21,Polynomial Regression Lasso,0.009,473.639,21.763,17.285,8.7
24,Polynomial Regression Ridge,0.093,433.475,20.82,16.472,8.373
27,Polynomial Regression Elastic Net,0.023,467.206,21.615,17.152,8.646



Dados de Validação:


Unnamed: 0,Algoritmo,R²,MSE,RMSE,MAE,MAPE
1,Decision Tree Regressor,-0.283,612.767,24.754,17.103,6.871
4,Random Forest Regressor,0.339,315.474,17.762,12.955,7.039
7,Linear Regression,0.04,458.447,21.411,17.04,8.683
10,Linear Regression Lasso,0.007,474.233,21.777,17.275,8.693
13,Linear Regression Ridge,0.04,458.445,21.411,17.039,8.682
16,Linear Regression Elastic Net,0.009,473.153,21.752,17.258,8.687
19,Polynomial Regression,0.066,445.768,21.113,16.75,8.548
22,Polynomial Regression Lasso,0.01,472.913,21.747,17.238,8.682
25,Polynomial Regression Ridge,0.068,445.184,21.099,16.739,8.569
28,Polynomial Regression Elastic Net,0.02,467.723,21.627,17.127,8.666



Dados de Tete:


Unnamed: 0,Algoritmo,R²,MSE,RMSE,MAE,MAPE
2,Decision Tree Regressor,-0.179,574.155,23.962,15.826,6.04
5,Random Forest Regressor,0.406,289.291,17.009,12.228,6.33
8,Linear Regression,0.051,461.988,21.494,17.144,8.531
11,Linear Regression Lasso,0.007,483.568,21.99,17.482,8.746
14,Linear Regression Ridge,0.051,461.988,21.494,17.144,8.532
17,Linear Regression Elastic Net,0.009,482.487,21.966,17.461,8.736
20,Polynomial Regression,0.091,442.641,21.039,16.736,8.277
23,Polynomial Regression Lasso,0.009,482.615,21.968,17.456,8.756
26,Polynomial Regression Ridge,0.09,442.967,21.047,16.742,8.309
29,Polynomial Regression Elastic Net,0.019,477.764,21.858,17.347,8.719
