# PARTE 26: VALIDACIÓN DE MODELO REGRESIÓN LINEAL

* Paso 1: Dividir el DATASET en entrenamiento y prueba (generalmente 80% - 20%)
* Paso 2: Implementar el modelo que tuvo buenos indicadores con solo el DATASET de entrenamiento
* Paso 3: Verificar que aún tenga buenos indicadores
* Paso 4: Aplicar el modelo sobre el DATASET de pruebas
* Paso 5: Verificar que aún tenga buenos indicadores

## PARTE 26.1: VALIDAR MODELO STATSMODELS (SALES)

In [5]:
#IMPORTAR DATASET
import pandas as pd
RUTA = "DATASETS - CERTIFICACIÓN/23_1_CORRELACION_VENTAS.csv"
DATASET = pd.read_csv(RUTA)

#DIVIDIR DATASET EN ENTRENAMIENTO Y PRUEBAS
from sklearn.model_selection import train_test_split
DATASET_ENTRENAMIENTO , DATASET_PRUEBAS = train_test_split(DATASET ,test_size = 0.2)

DATASET_ENTRENAMIENTO = DATASET_ENTRENAMIENTO.reset_index()
DATASET_ENTRENAMIENTO = DATASET_ENTRENAMIENTO.drop(["index"],axis = 1)

DATASET_PRUEBAS = DATASET_PRUEBAS.reset_index()
DATASET_PRUEBAS = DATASET_PRUEBAS.drop(["index"],axis = 1)

#### VERIFICACIÓN QUE TIENE BUENOS INDICADORES SOBRE DATASET TOTAL

In [6]:
#VARIABLES PREDICHAS Y PREDICTORAS
VY = "Sales"
VX = ["TV","Radio"]

#OBTENER INDICADORES DEL MODELO
import numpy as np
import statsmodels.formula.api as sfa

COMANDO = VY + "~" + "+".join(VX)
MODELO_STATS = sfa.ols(formula = COMANDO , data = DATASET).fit()
DATASET["PRED"] = MODELO_STATS.predict(DATASET[VX])

SMC =  sum((DATASET["PRED"]-np.mean(DATASET[VY]))**2)
SRC =  sum((DATASET[VY]-DATASET["PRED"])**2)
STC =  sum((DATASET[VY]-np.mean(DATASET[VY]))**2)    

print("VARIABLES PREDICTORAS UTILIZADAS")
print(VX)

#CÁLCULO DE R2
R2 = MODELO_STATS.rsquared
print("R2 --> {}".format(R2))

#CÁLCULO DE ESR
ESR = np.sqrt((SRC)/(DATASET.shape[0]-len(VX)-1))
print("ESR --> {}".format(ESR))

#CÁLCULO DE ESR_PORCENT
ESR_PORCENT = (ESR / np.mean(DATASET[VY])) * 100
print("ESR_PORCENT --> {}%".format(round(ESR_PORCENT)))
    
#CÁLCULO DE AIC
AIC = MODELO_STATS.aic
print("AIC --> {}".format(round(AIC)))
    
#CÁLCULO DE BIC
BIC = MODELO_STATS.bic
print("BIC --> {}".format(round(BIC)))
    
#CÁLCULO DE PVALUES
for INDICE,VALOR in enumerate(MODELO_STATS.pvalues):
    if VALOR > 0.05:
        print("----PVALUES CRÍTICOS----")
        print("{} --> {}".format(MODELO_STATS.pvalues.index[INDICE],VALOR))
                  
#CÁLCULO DE FIV ENTRE VARIABLES PREDICTORAS
for VARIABLE in VX:
    LISTA_PREVIA = VX
    LISTA_PREVIA.remove(VARIABLE)
    COMANDO = VARIABLE + "~" + "+".join(LISTA_PREVIA)
            
    REGRESION_FIV = sfa.ols(formula = COMANDO, data = DATASET).fit()
    R2_FIV = REGRESION_FIV.rsquared
    FIV = 1/(1-R2_FIV)
            
    if FIV > 8:
        print("------FIVS CRÍTICOS------") 
        print("{} ---> {}".format(COMANDO,FIV))

VARIABLES PREDICTORAS UTILIZADAS
['TV', 'Radio']
R2 --> 0.9025896186081139
ESR --> 1.6574865008166215
ESR_PORCENT --> 11%
AIC --> 773
BIC --> 783


#### VERIFICACIÓN QUE TIENE BUENOS INDICADORES SOBRE DATASET ENTRENAMIENTO

In [7]:
#VARIABLES PREDICHAS Y PREDICTORAS
VY = "Sales"
VX = ["TV","Radio"]

#OBTENER INDICADORES DEL MODELO
import numpy as np
import statsmodels.formula.api as sfa

COMANDO = VY + "~" + "+".join(VX)
MODELO_STATS_E = sfa.ols(formula = COMANDO , data = DATASET_ENTRENAMIENTO).fit()
DATASET_ENTRENAMIENTO["PRED"] = MODELO_STATS_E.predict(DATASET_ENTRENAMIENTO[VX])

SMC =  sum((DATASET_ENTRENAMIENTO["PRED"]-np.mean(DATASET_ENTRENAMIENTO[VY]))**2)
SRC =  sum((DATASET_ENTRENAMIENTO[VY]-DATASET_ENTRENAMIENTO["PRED"])**2)
STC =  sum((DATASET_ENTRENAMIENTO[VY]-np.mean(DATASET_ENTRENAMIENTO[VY]))**2)    

print("VARIABLES PREDICTORAS UTILIZADAS")
print(VX)

#CÁLCULO DE R2
R2 = MODELO_STATS_E.rsquared
print("R2 --> {}".format(R2))

#CÁLCULO DE ESR
ESR = np.sqrt((SRC)/(DATASET_ENTRENAMIENTO.shape[0]-len(VX)-1))
print("ESR --> {}".format(ESR))

#CÁLCULO DE ESR_PORCENT
ESR_PORCENT = (ESR / np.mean(DATASET_ENTRENAMIENTO[VY])) * 100
print("ESR_PORCENT --> {}%".format(round(ESR_PORCENT)))
    
#CÁLCULO DE AIC
AIC = MODELO_STATS_E.aic
print("AIC --> {}".format(round(AIC)))
    
#CÁLCULO DE BIC
BIC = MODELO_STATS_E.bic
print("BIC --> {}".format(round(BIC)))
    
#CÁLCULO DE PVALUES
for INDICE,VALOR in enumerate(MODELO_STATS_E.pvalues):
    if VALOR > 0.05:
        print("----PVALUES CRÍTICOS----")
        print("{} --> {}".format(MODELO_STATS_E.pvalues.index[INDICE],VALOR))
                  
#CÁLCULO DE FIV ENTRE VARIABLES PREDICTORAS
for VARIABLE in VX:
    LISTA_PREVIA = VX
    LISTA_PREVIA.remove(VARIABLE)
    COMANDO = VARIABLE + "~" + "+".join(LISTA_PREVIA)
            
    REGRESION_FIV = sfa.ols(formula = COMANDO, data = DATASET_ENTRENAMIENTO).fit()
    R2_FIV = REGRESION_FIV.rsquared
    FIV = 1/(1-R2_FIV)
            
    if FIV > 8:
        print("------FIVS CRÍTICOS------") 
        print("{} ---> {}".format(COMANDO,FIV))

VARIABLES PREDICTORAS UTILIZADAS
['TV', 'Radio']
R2 --> 0.9012658329664016
ESR --> 1.665570864681979
ESR_PORCENT --> 11%
AIC --> 620
BIC --> 630


#### VERIFICACIÓN QUE TIENE BUENOS INDICADORES SOBRE DATASET PRUEBAS

In [9]:
#VARIABLES PREDICHAS Y PREDICTORAS
VY = "Sales"
VX = ["TV","Radio"]

#OBTENER INDICADORES DEL MODELO
import numpy as np
import statsmodels.formula.api as sfa

COMANDO = VY + "~" + "+".join(VX)
DATASET_PRUEBAS["PRED"] = MODELO_STATS_E.predict(DATASET_PRUEBAS[VX])

SMC =  sum((DATASET_PRUEBAS["PRED"]-np.mean(DATASET_PRUEBAS[VY]))**2)
SRC =  sum((DATASET_PRUEBAS[VY]-DATASET_PRUEBAS["PRED"])**2)
STC =  sum((DATASET_PRUEBAS[VY]-np.mean(DATASET_PRUEBAS[VY]))**2)    

print("VARIABLES PREDICTORAS UTILIZADAS")
print(VX)

#CÁLCULO DE R2
R2 = MODELO_STATS_E.rsquared
print("R2 --> {}".format(R2))

#CÁLCULO DE ESR
ESR = np.sqrt((SRC)/(DATASET_PRUEBAS.shape[0]-len(VX)-1))
print("ESR --> {}".format(ESR))

#CÁLCULO DE ESR_PORCENT
ESR_PORCENT = (ESR / np.mean(DATASET_PRUEBAS[VY])) * 100
print("ESR_PORCENT --> {}%".format(round(ESR_PORCENT)))
    
#CÁLCULO DE AIC
AIC = MODELO_STATS_E.aic
print("AIC --> {}".format(round(AIC)))
    
#CÁLCULO DE BIC
BIC = MODELO_STATS_E.bic
print("BIC --> {}".format(round(BIC)))
    
#CÁLCULO DE PVALUES
for INDICE,VALOR in enumerate(MODELO_STATS_E.pvalues):
    if VALOR > 0.05:
        print("----PVALUES CRÍTICOS----")
        print("{} --> {}".format(MODELO_STATS_E.pvalues.index[INDICE],VALOR))
                  
#CÁLCULO DE FIV ENTRE VARIABLES PREDICTORAS
for VARIABLE in VX:
    LISTA_PREVIA = VX
    LISTA_PREVIA.remove(VARIABLE)
    COMANDO = VARIABLE + "~" + "+".join(LISTA_PREVIA)
            
    REGRESION_FIV = sfa.ols(formula = COMANDO, data = DATASET_PRUEBAS).fit()
    R2_FIV = REGRESION_FIV.rsquared
    FIV = 1/(1-R2_FIV)
            
    if FIV > 8:
        print("------FIVS CRÍTICOS------") 
        print("{} ---> {}".format(COMANDO,FIV))

VARIABLES PREDICTORAS UTILIZADAS
['TV', 'Radio']
R2 --> 0.9012658329664016
ESR --> 1.6977142015855509
ESR_PORCENT --> 11%
AIC --> 620
BIC --> 630


In [None]:
# INDICADORES SOBRE DATASET TOTAL
VARIABLES PREDICTORAS UTILIZADAS
['TV', 'Radio']
R2 --> 0.9025896186081139
ESR --> 1.6574865008166215
ESR_PORCENT --> 11%
AIC --> 773
BIC --> 783

# INDICADORES SOBRE DATASET ENTRENAMIENTO
VARIABLES PREDICTORAS UTILIZADAS
['TV', 'Radio']
R2 --> 0.9012658329664016
ESR --> 1.665570864681979
ESR_PORCENT --> 11%
AIC --> 620
BIC --> 630

# INDICADORES SOBRE DATASET PRUEBAS
VARIABLES PREDICTORAS UTILIZADAS
['TV', 'Radio']
R2 --> 0.9012658329664016
ESR --> 1.6977142015855509
ESR_PORCENT --> 11%
AIC --> 620
BIC --> 630

## PARTE 26.2: VALIDAR MODELO SKLEARN (PRICE)

In [17]:
#IMPORTAR DATASET
import pandas as pd
RUTA = "DATASETS - CERTIFICACIÓN/25_1_CORRELACION_CARROS.csv"
DATASET = pd.read_csv(RUTA)

#PREPARACIÓN DE DATASET
DATASET = DATASET.drop(["CarName","car_ID"],axis = 1)

#ANÁLISIS DE VARIABLES CATEGÓRICAS
VARIABLES_CAT = list(DATASET.select_dtypes(include = ["object"]))

#GENERACIÓN DE VARIABLES DUMMY
def GENERAR_DUMMIES(DATASET,VARIABLE):
    DUMMY = pd.get_dummies(DATASET[VARIABLE], prefix = VARIABLE)
    DATASET = pd.concat([DATASET,DUMMY] , axis = 1)
    DATASET = DATASET.drop([VARIABLE] , axis = 1)
    return DATASET

for X in VARIABLES_CAT:
    DATASET = GENERAR_DUMMIES(DATASET,X)

#DIVIDIR DATASET EN ENTRENAMIENTO Y PRUEBAS
from sklearn.model_selection import train_test_split
DATASET_ENTRENAMIENTO , DATASET_PRUEBAS = train_test_split(DATASET ,test_size = 0.2)

DATASET_ENTRENAMIENTO = DATASET_ENTRENAMIENTO.reset_index()
DATASET_ENTRENAMIENTO = DATASET_ENTRENAMIENTO.drop(["index"],axis = 1)

DATASET_PRUEBAS = DATASET_PRUEBAS.reset_index()
DATASET_PRUEBAS = DATASET_PRUEBAS.drop(["index"],axis = 1)

#### VERIFICACIÓN QUE TIENE BUENOS INDICADORES SOBRE DATASET TOTAL

In [18]:
#VARIABLES PREDICHAS Y PREDICTORAS
VY = "price"
VX = ['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']

#OBTENER INDICADORES DEL MODELO
import numpy as np
import statsmodels.formula.api as sfa

COMANDO = VY + "~" + "+".join(VX)
MODELO_STATS = sfa.ols(formula = COMANDO , data = DATASET).fit()
DATASET["PRED"] = MODELO_STATS.predict(DATASET[VX])

SMC =  sum((DATASET["PRED"]-np.mean(DATASET[VY]))**2)
SRC =  sum((DATASET[VY]-DATASET["PRED"])**2)
STC =  sum((DATASET[VY]-np.mean(DATASET[VY]))**2)    

print("VARIABLES PREDICTORAS UTILIZADAS")
print(VX)

#CÁLCULO DE R2
R2 = MODELO_STATS.rsquared
print("R2 --> {}".format(R2))

#CÁLCULO DE ESR
ESR = np.sqrt((SRC)/(DATASET.shape[0]-len(VX)-1))
print("ESR --> {}".format(ESR))

#CÁLCULO DE ESR_PORCENT
ESR_PORCENT = (ESR / np.mean(DATASET[VY])) * 100
print("ESR_PORCENT --> {}%".format(round(ESR_PORCENT)))
    
#CÁLCULO DE AIC
AIC = MODELO_STATS.aic
print("AIC --> {}".format(round(AIC)))
    
#CÁLCULO DE BIC
BIC = MODELO_STATS.bic
print("BIC --> {}".format(round(BIC)))
    
#CÁLCULO DE PVALUES
for INDICE,VALOR in enumerate(MODELO_STATS.pvalues):
    if VALOR > 0.05:
        print("----PVALUES CRÍTICOS----")
        print("{} --> {}".format(MODELO_STATS.pvalues.index[INDICE],VALOR))
                  
#CÁLCULO DE FIV ENTRE VARIABLES PREDICTORAS
for VARIABLE in VX:
    LISTA_PREVIA = VX
    LISTA_PREVIA.remove(VARIABLE)
    COMANDO = VARIABLE + "~" + "+".join(LISTA_PREVIA)
            
    REGRESION_FIV = sfa.ols(formula = COMANDO, data = DATASET).fit()
    R2_FIV = REGRESION_FIV.rsquared
    FIV = 1/(1-R2_FIV)
            
    if FIV > 8:
        print("------FIVS CRÍTICOS------") 
        print("{} ---> {}".format(COMANDO,FIV))

VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']
R2 --> 0.8767346083823705
ESR --> 2868.8163776367583
ESR_PORCENT --> 22%
AIC --> 3856
BIC --> 3889


#### VERIFICACIÓN QUE TIENE BUENOS INDICADORES SOBRE DATASET ENTRENAMIENTO

In [19]:
#VARIABLES PREDICHAS Y PREDICTORAS
VY = "price"
VX = ['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']

#OBTENER INDICADORES DEL MODELO
import numpy as np
import statsmodels.formula.api as sfa

COMANDO = VY + "~" + "+".join(VX)
MODELO_STATS_E = sfa.ols(formula = COMANDO , data = DATASET_ENTRENAMIENTO).fit()
DATASET_ENTRENAMIENTO["PRED"] = MODELO_STATS_E.predict(DATASET_ENTRENAMIENTO[VX])

SMC =  sum((DATASET_ENTRENAMIENTO["PRED"]-np.mean(DATASET_ENTRENAMIENTO[VY]))**2)
SRC =  sum((DATASET_ENTRENAMIENTO[VY]-DATASET_ENTRENAMIENTO["PRED"])**2)
STC =  sum((DATASET_ENTRENAMIENTO[VY]-np.mean(DATASET_ENTRENAMIENTO[VY]))**2)    

print("VARIABLES PREDICTORAS UTILIZADAS")
print(VX)

#CÁLCULO DE R2
R2 = MODELO_STATS_E.rsquared
print("R2 --> {}".format(R2))

#CÁLCULO DE ESR
ESR = np.sqrt((SRC)/(DATASET_ENTRENAMIENTO.shape[0]-len(VX)-1))
print("ESR --> {}".format(ESR))

#CÁLCULO DE ESR_PORCENT
ESR_PORCENT = (ESR / np.mean(DATASET_ENTRENAMIENTO[VY])) * 100
print("ESR_PORCENT --> {}%".format(round(ESR_PORCENT)))
    
#CÁLCULO DE AIC
AIC = MODELO_STATS_E.aic
print("AIC --> {}".format(round(AIC)))
    
#CÁLCULO DE BIC
BIC = MODELO_STATS_E.bic
print("BIC --> {}".format(round(BIC)))
    
#CÁLCULO DE PVALUES
for INDICE,VALOR in enumerate(MODELO_STATS_E.pvalues):
    if VALOR > 0.05:
        print("----PVALUES CRÍTICOS----")
        print("{} --> {}".format(MODELO_STATS_E.pvalues.index[INDICE],VALOR))
                  
#CÁLCULO DE FIV ENTRE VARIABLES PREDICTORAS
for VARIABLE in VX:
    LISTA_PREVIA = VX
    LISTA_PREVIA.remove(VARIABLE)
    COMANDO = VARIABLE + "~" + "+".join(LISTA_PREVIA)
            
    REGRESION_FIV = sfa.ols(formula = COMANDO, data = DATASET_ENTRENAMIENTO).fit()
    R2_FIV = REGRESION_FIV.rsquared
    FIV = 1/(1-R2_FIV)
            
    if FIV > 8:
        print("------FIVS CRÍTICOS------") 
        print("{} ---> {}".format(COMANDO,FIV))

VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']
R2 --> 0.8734290226597308
ESR --> 2929.1363356772054
ESR_PORCENT --> 22%
AIC --> 3093
BIC --> 3124


#### VERIFICACIÓN QUE TIENE BUENOS INDICADORES SOBRE DATASET PRUEBAS

In [20]:
#VARIABLES PREDICHAS Y PREDICTORAS
VY = "price"
VX = ['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']

#OBTENER INDICADORES DEL MODELO
import numpy as np
import statsmodels.formula.api as sfa

COMANDO = VY + "~" + "+".join(VX)
DATASET_PRUEBAS["PRED"] = MODELO_STATS_E.predict(DATASET_PRUEBAS[VX])

SMC =  sum((DATASET_PRUEBAS["PRED"]-np.mean(DATASET_PRUEBAS[VY]))**2)
SRC =  sum((DATASET_PRUEBAS[VY]-DATASET_PRUEBAS["PRED"])**2)
STC =  sum((DATASET_PRUEBAS[VY]-np.mean(DATASET_PRUEBAS[VY]))**2)    

print("VARIABLES PREDICTORAS UTILIZADAS")
print(VX)

#CÁLCULO DE R2
R2 = MODELO_STATS_E.rsquared
print("R2 --> {}".format(R2))

#CÁLCULO DE ESR
ESR = np.sqrt((SRC)/(DATASET_PRUEBAS.shape[0]-len(VX)-1))
print("ESR --> {}".format(ESR))

#CÁLCULO DE ESR_PORCENT
ESR_PORCENT = (ESR / np.mean(DATASET_PRUEBAS[VY])) * 100
print("ESR_PORCENT --> {}%".format(round(ESR_PORCENT)))
    
#CÁLCULO DE AIC
AIC = MODELO_STATS_E.aic
print("AIC --> {}".format(round(AIC)))
    
#CÁLCULO DE BIC
BIC = MODELO_STATS_E.bic
print("BIC --> {}".format(round(BIC)))
    
#CÁLCULO DE PVALUES
for INDICE,VALOR in enumerate(MODELO_STATS_E.pvalues):
    if VALOR > 0.05:
        print("----PVALUES CRÍTICOS----")
        print("{} --> {}".format(MODELO_STATS_E.pvalues.index[INDICE],VALOR))
                  
#CÁLCULO DE FIV ENTRE VARIABLES PREDICTORAS
for VARIABLE in VX:
    LISTA_PREVIA = VX
    LISTA_PREVIA.remove(VARIABLE)
    COMANDO = VARIABLE + "~" + "+".join(LISTA_PREVIA)
            
    REGRESION_FIV = sfa.ols(formula = COMANDO, data = DATASET_PRUEBAS).fit()
    R2_FIV = REGRESION_FIV.rsquared
    FIV = 1/(1-R2_FIV)
            
    if FIV > 8:
        print("------FIVS CRÍTICOS------") 
        print("{} ---> {}".format(COMANDO,FIV))

VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']
R2 --> 0.8734290226597308
ESR --> 3215.7490941098713
ESR_PORCENT --> 23%
AIC --> 3093
BIC --> 3124


#### UTILIZANDO TODAS LAS VARIABLES RECOMENDADAS POR SKLEARN

In [None]:
# INDICADORES SOBRE DATASET TOTAL
VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc', 'cylindernumber_eight', 'aspiration_turbo']
R2 --> 0.8847108725935892
ESR --> 2788.784775543346
ESR_PORCENT --> 21%
AIC --> 3846
BIC --> 3886

# INDICADORES SOBRE DATASET ENTRENAMIENTO
VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc', 'cylindernumber_eight', 'aspiration_turbo']
R2 --> 0.8866918959715713
ESR --> 2746.521441684707
ESR_PORCENT --> 20%
AIC --> 3074
BIC --> 3111

# INDICADORES SOBRE DATASET PRUEBAS
VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc', 'cylindernumber_eight', 'aspiration_turbo']
R2 --> 0.8866918959715713
ESR --> 3663.8741991731235
ESR_PORCENT --> 29%
AIC --> 3074
BIC --> 3111

#### UTILIZANDO LA MEJOR COMBINACIÓN PARA REDUCIR INESTABILIDAD DE ESR%

In [None]:
# INDICADORES SOBRE DATASET TOTAL
VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']
R2 --> 0.8767346083823705
ESR --> 2868.8163776367583
ESR_PORCENT --> 22%
AIC --> 3856
BIC --> 3889

# INDICADORES SOBRE DATASET ENTRENAMIENTO
VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']
R2 --> 0.8734290226597308
ESR --> 2929.1363356772054
ESR_PORCENT --> 22%
AIC --> 3093
BIC --> 3124

# INDICADORES SOBRE DATASET PRUEBAS
VARIABLES PREDICTORAS UTILIZADAS
['enginesize', 'horsepower', 'carwidth', 'cylindernumber_four', 'carbody_hatchback', 'drivewheel_rwd', 'stroke', 'carbody_convertible', 'enginetype_ohc']
R2 --> 0.8734290226597308
ESR --> 3215.7490941098713
ESR_PORCENT --> 23%
AIC --> 3093
BIC --> 3124