In [None]:
import numpy as np
import pandas as pd
from sklearn.linear_model import SGDRegressor
from sklearn.preprocessing import StandardScaler
import matplotlib.pyplot as plt

# Separar as features (Temperatura) e labels (Vendas_Sorvetes)
X = dados["Temperatura"].values.reshape(-1, 1)
y = dados["Vendas_Sorvete"].values



# Normalizar as features (Temperatura)
scaler = StandardScaler()
X_norm = scaler.fit_transform(X)

# Treinar o modelo com SGDRegressor e hiperparâmetros ajustados
sgd_reg = SGDRegressor(max_iter=1000, penalty='l2', eta0=0.01)
sgd_reg.fit(X_norm, y.ravel())

# Analisar os resultados
print("Inclinação (m):", sgd_reg.coef_[0])
print("Intercepto (b):", sgd_reg.intercept_)

# Fazer predições para novos valores de temperatura
nova_temperatura = 22.5

# Reshape nova_temperatura em um 2D array com linha e coluna
nova_temperatura = np.array([nova_temperatura]).reshape(1, 1)

# Aplicar o scaler em temperatura
nova_temperatura_scaled = scaler.transform(nova_temperatura)

# Nova predição utilizando o  scaled nova_temperatura
predicao = sgd_reg.predict(nova_temperatura_scaled)
print("A predição de vendas para a temperatura de 22.5 graus é de", predicao)


# Calcular o R² e outras métricas
from sklearn.metrics import r2_score, mean_squared_error, mean_absolute_error


# Criando a função do MAPE
def mean_absolute_percentage_error(y_true, y_pred):
    y_true = np.clip(y_true, np.min(y_pred), np.max(y_pred))
    return np.mean(np.abs((y_true - y_pred) / y_true)) * 100

r2 = r2_score(y, sgd_reg.predict(X_norm))
mse = mean_squared_error(y, sgd_reg.predict(X_norm))
rmse = np.sqrt(mse)
mae = mean_absolute_error(y, sgd_reg.predict(X_norm))
mape = mean_absolute_percentage_error(y, sgd_reg.predict(X_norm))


print("R²:", r2)
print("MSE:", mse)
print("RMSE:", rmse)
print("MAE:", mae)
print("MAPE:", mape)

# Visualizar a relação entre features e labels com reta de regressão
plt.scatter(X, y, label="Dados Originais")
plt.plot(X, sgd_reg.predict(X_norm), color="red", label="Reta de Regressão")
plt.xlabel("Temperatura")
plt.ylabel("Vendas de Sorvete")
plt.title("Modelo de Regressão Linear")
plt.legend()
plt.show()