In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import HistGradientBoostingRegressor
from sklearn.metrics import mean_squared_error, r2_score

arquivo = "dados_amr.xlsx"
df = pd.read_excel(arquivo)

# Definir target e features
y = df['tempo_preparacao']
X = df.drop(columns=['tempo_preparacao'])

# Codificar variáveis categóricas
X_encoded = pd.get_dummies(X, drop_first=True)

# Dividir em treino, validação e teste
X_temp, X_test, y_temp, y_test = train_test_split(X_encoded, y, test_size=0.2, random_state=42)
X_train, X_val, y_train, y_val = train_test_split(X_temp, y_temp, test_size=0.25, random_state=42)

# Treinar o modelo
model = HistGradientBoostingRegressor(random_state=42)
model.fit(X_train, y_train)

# Avaliação na validação
y_val_pred = model.predict(X_val)
print("Validação")
print("MSE:", mean_squared_error(y_val, y_val_pred))
print("R²:", r2_score(y_val, y_val_pred))

# Avaliação no teste final
y_test_pred = model.predict(X_test)
print("\nTeste Final")
print("MSE:", mean_squared_error(y_test, y_test_pred))
print("R²:", r2_score(y_test, y_test_pred))

Validação
MSE: 0.12884367815050538
R²: 0.957850662634745

Teste Final
MSE: 0.10904849162435548
R²: 0.962476374831337


In [11]:
import joblib
joblib.dump(model, 'modelo_lucro.pkl')
modelo_carregado = joblib.load('modelo_lucro.pkl')

In [35]:
correlation = df['tempo_preparacao'].corr(df['lucro'])
print("Correlação de Pearson:", correlation)

Correlação de Pearson: -0.004649353144150638
