In [25]:
import pandas as pd
import os
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score
from time import time
from datetime import datetime

In [26]:
tiempo_inicio = time()
today = f'[{datetime.today().strftime("%Y-%m-%d %H:%M:%S")}]'
print(f'{today} Comienzo del entrenamiento del modelo')

[2023-04-03 00:59:49] Comienzo del entrenamiento del modelo


In [27]:
# Variables Globales
PATH = os.getcwd()
AUX_FOLDER = 'aux_file'
INPUT_FILENAME = 'dataset_modelo.xlsx'
OUTPUT_FILENAME = 'model_weights.txt'

In [28]:
# Cargo los datos
df = pd.read_excel(os.path.join(PATH, AUX_FOLDER, INPUT_FILENAME))

In [29]:
# Separo lo datos en train y test y variables pedictoras y target
X = df.drop(['Precio', 'Año', 'Mes', 'Dia'], axis=1)
y = df['Precio']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

In [30]:
# Crear y entrenar el modelo de regresión lineal múltiple
reg = LinearRegression()
reg.fit(X_train, y_train)

In [31]:
# Realizar predicciones en el conjunto de prueba
y_pred = reg.predict(X_test)

In [32]:
# Calcular métricas de evaluación
mse = mean_squared_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

today = f'[{datetime.today().strftime("%Y-%m-%d %H:%M:%S")}]'
print(f'{today} Los resultados obtenidos son:')
print(f"{today} Mean Squared Error: {mse}")
print(f"{today} R-squared: {r2}")

[2023-04-03 00:59:49] Los resultados obtenidos son:
[2023-04-03 00:59:49] Mean Squared Error: 34553102.116133474
[2023-04-03 00:59:49] R-squared: 0.9984420650779654


In [33]:
# Obtener los coeficientes y la intersección del modelo
coefficients = reg.coef_
intercept = reg.intercept_

# Guarda los coeficientes e intercept en un archivo de texto
np.savetxt(os.path.join(PATH, AUX_FOLDER, OUTPUT_FILENAME), np.append(coefficients, intercept))

In [34]:
coefficients

array([131716.47304084,  21143.9058483 , -55342.75209089])

In [35]:
intercept

330337.0937274716

In [36]:
tiempo_fin = time()
duracion = tiempo_fin - tiempo_inicio
horas, remainder = divmod(int(duracion), 3600)
minutos, segundos = divmod(remainder, 60)
print(f'{today} El tiempo transcurrido de ejecucion fue: {horas:02d}h {minutos:02d}m {segundos:02d}s')

[2023-04-03 00:59:49] El tiempo transcurrido de ejecucion fue: 00h 00m 00s
