In [1]:
import pandas as pd
import os
import joblib
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from time import time
from datetime import datetime

In [2]:
tiempo_inicio = time()
today = f'[{datetime.today().strftime("%Y-%m-%d %H:%M:%S")}]'
print(f'{today} Comienzo del entrenamiento del modelo')

[2023-03-30 16:01:16] Comienzo del entrenamiento del modelo


In [3]:
# Variables Globales
PATH = os.getcwd()
AUX_FOLDER = 'aux_file'
INPUT_FILENAME = 'dataset_modelo.xlsx'
OUTPUT_FILENAME = 'model_weights.pkl'

In [4]:
# Cargo los datos
df = pd.read_excel(os.path.join(PATH, AUX_FOLDER, INPUT_FILENAME))

In [5]:
# Separo lo datos en train y test y variables pedictoras y target
X = df.drop(['Precio', 'Año', 'Mes', 'Dia'], axis=1)
y = df['Precio']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [6]:
# Crear y entrenar el modelo de regresión lineal múltiple
reg = LinearRegression()
reg.fit(X_train, y_train)

In [7]:
# Realizar predicciones en el conjunto de prueba
y_pred = reg.predict(X_test)

In [8]:
# Calcular métricas de evaluación
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

today = f'[{datetime.today().strftime("%Y-%m-%d %H:%M:%S")}]'
print(f'{today} Los resultados obtenidos son:')
print(f"{today} Mean Squared Error: {mse}")
print(f"{today} R-squared: {r2}")

[2023-03-30 16:01:16] Los resultados obtenidos son:
[2023-03-30 16:01:16] Mean Squared Error: 27620168.66870761
[2023-03-30 16:01:16] R-squared: 0.9984882373699149


In [9]:
# Obtener los coeficientes y la intersección del modelo
coefficients = reg.coef_
intercept = reg.intercept_

# Guarda los coeficientes e intercept en un archivo usando joblib
joblib.dump([coefficients, intercept], os.path.join(PATH, AUX_FOLDER, OUTPUT_FILENAME))

['c:\\Users\\TALIGENT\\test\\Papermill\\Ejemplo 3\\aux_file\\model_weights.pkl']

In [10]:
coefficients

array([127234.9002189 ,  20903.74332011, -56391.02855076])

In [11]:
intercept

328452.2517776206

In [12]:
tiempo_fin = time()
duracion = tiempo_fin - tiempo_inicio
horas, remainder = divmod(int(duracion), 3600)
minutos, segundos = divmod(remainder, 60)
print(f'{today} El tiempo transcurrido de ejecucion fue: {horas:02d}h {minutos:02d}m {segundos:02d}s')

[2023-03-30 16:01:16] El tiempo transcurrido de ejecucion fue: 00h 00m 00s
