In [None]:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.preprocessing import OneHotEncoder
from sklearn.metrics import r2_score, mean_absolute_error


In [None]:

# Carregar o CSV
df = pd.read_csv("vendas_energeticos.csv")
df.head()


In [None]:

# Visualização básica
sns.scatterplot(data=df, x="hora_dia", y="venda_energetico", hue="dia_semana")
plt.title("Vendas de Energéticos por Hora e Dia da Semana")
plt.show()


In [None]:

# One-hot encoding para o dia da semana
encoder = OneHotEncoder(sparse=False)
dias_encoded = encoder.fit_transform(df[['dia_semana']])
dias_df = pd.DataFrame(dias_encoded, columns=encoder.get_feature_names_out(['dia_semana']))

# Unir os dados transformados ao DataFrame original
df_modelo = pd.concat([df[['hora_dia', 'venda_energetico']], dias_df], axis=1)
df_modelo.head()


In [None]:

# Separar variáveis independentes e alvo
X = df_modelo.drop("venda_energetico", axis=1)
y = df_modelo["venda_energetico"]

# Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


In [None]:

# Treinar o modelo
modelo = LinearRegression()
modelo.fit(X_train, y_train)


In [None]:

# Previsões
y_pred = modelo.predict(X_test)

# Avaliação
print("R²:", r2_score(y_test, y_pred))
print("MAE:", mean_absolute_error(y_test, y_pred))


In [None]:

# Exemplo de predição
novo_exemplo = pd.DataFrame([[14] + [0,0,0,0,0,1,0]], columns=X.columns)  # Ex: sábado, 14h
modelo.predict(novo_exemplo)
