In [1]:
import numpy as np
import pandas as pd
import os
from sklearn.preprocessing import StandardScaler
import joblib
from time import time
from datetime import datetime

In [2]:
tiempo_inicio = time()
today = f'[{datetime.today().strftime("%Y-%m-%d %H:%M:%S")}]'
print(f'{today} Comienzo de la predicción')

[2023-03-30 16:01:21] Comienzo de la predicción


In [3]:
# Variables Globales
PATH = os.getcwd()
AUX_FOLDER = 'aux_file'
OUTPUT = 'output'
MODEL_PARAMETERS = 'model_weights.pkl'
OUTPUT_FILENAME = 'predictions.xlsx'

In [4]:
# Si no esta la carpeta aux_file, la creo
if not os.path.exists(os.path.join(PATH, OUTPUT)):
    os.mkdir(OUTPUT)

In [5]:
new_data = {
    'Fecha': ['2021-01-01', '2021-02-01', '2021-03-01', '2021-04-01', '2021-05-01'],
    'Area': [100, 200, 150, 120, 180],
    'Habitaciones': [2, 3, 4, 3, 4],
    'Antiguedad': [10, 20, 30, 40, 50],
}

new_df = pd.DataFrame(new_data)

In [6]:
media = 0
desv_estandar = 1

In [7]:
# Parameters
media = [127.742, 3.072, 50.16]
desv_estandar = [42.40239894156933, 1.422257360677033, 28.47592667500041]


In [8]:
# Aplicar el mismo preprocesamiento que al dataset original
scaled_new_data = (new_df[['Area', 'Habitaciones', 'Antiguedad']] - media) / desv_estandar
new_df_scaled = pd.DataFrame(scaled_new_data, columns=['Area', 'Habitaciones', 'Antiguedad'])

# Cargar el modelo previously trained desde su archivo "model_weights.plk"
coeficientes, intercept = joblib.load(os.path.join(PATH, AUX_FOLDER, MODEL_PARAMETERS))

# Realizar predicciones con el modelo entrenado
predictions =  np.dot(new_df_scaled, coeficientes.reshape(-1,1)) + intercept
# Guardar las predicciones en un archivo de Excel
predictions_df = pd.DataFrame(predictions, columns=['Predicciones'])
predictions_df = pd.concat([new_df, predictions_df], axis=1)
predictions_df.to_excel(os.path.join(PATH, OUTPUT, OUTPUT_FILENAME), index=False)

In [9]:
tiempo_fin = time()
duracion = tiempo_fin - tiempo_inicio
horas, remainder = divmod(int(duracion), 3600)
minutos, segundos = divmod(remainder, 60)
print(f'{today} El tiempo transcurrido de ejecucion fue: {horas:02d}h {minutos:02d}m {segundos:02d}s')

[2023-03-30 16:01:21] El tiempo transcurrido de ejecucion fue: 00h 00m 00s


In [10]:
coeficientes

array([127234.9002189 ,  20903.74332011, -56391.02855076])

In [11]:
intercept

328452.2517776206

In [12]:
predictions_df

Unnamed: 0,Fecha,Area,Habitaciones,Antiguedad,Predicciones
0,2021-01-01,100,2,10,308981.380324
1,2021-02-01,200,3,20,603941.243202
2,2021-03-01,150,4,30,448803.104335
3,2021-04-01,120,3,40,324282.869581
4,2021-05-01,180,4,50,499216.59866
