In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import GridSearchCV,train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LinearRegression
import matplotlib.pyplot as plt
from sklearn.metrics import mean_squared_error, r2_score

# Leer datos de entrenamiento

In [2]:
path = 'continuous_train.csv'
data = pd.read_csv(path, sep = ',', na_filter = False)
data = data.set_index('Unnamed: 0')

X = data.drop(columns = ['y']).copy()
y_train = data[['y']].copy()

# Leer datos de validación

In [3]:
path = 'continuous_test.csv'
test = pd.read_csv(path, sep = ',', na_filter = False)
test = test.set_index('Unnamed: 0')

X_test = test.drop(columns = ['y']).copy()
y_test = test[['y']].copy()

# Leer variables

In [4]:
path = 'variablesToProof.csv'
variablesTorun = pd.read_csv(path, sep = ',')

In [5]:
def calculated_metrics(variablesSelected,X_trained_scaled,y_train,X_test_scaled,y_test):
    X_trained_scaled_aux = X_trained_scaled[variablesSelected].copy()
    X_test_scaled_aux = X_test_scaled[variablesSelected].copy()
    ## Regresion para cada cantidad de variables
    regr = LinearRegression()

    # Train the model using the training sets
    regr.fit(X_trained_scaled_aux,  y_train['y'].values)

    # Make predictions using the testing set
    y_pred = regr.predict(X_test_scaled_aux)

    y_pred = pd.DataFrame(y_pred, index=y_test.index, columns=["y_pred"])

    total = y_pred.join(y_test)
    total['y_menor_-1'] = (total['y']<-1).astype(int)
    total['y_pred_menor_-1'] = (total['y_pred']<-1).astype(int)
    total['good_class'] = (total['y_menor_-1']==total['y_pred_menor_-1']).astype(int)
    mse = mean_squared_error(y_test, y_pred)
    accuray =total['good_class'].sum()/len(total)
    r2 = r2_score(y_test, y_pred)
    return mse,accuray,r2

In [6]:
resultados =  pd.DataFrame({'Modelo':  variablesTorun.columns[1:]})

In [7]:
resultados =  pd.DataFrame()
for i in variablesTorun.columns[1:]:
    print(i)
    mse = []
    accuray = []
    r2 = []
    if len(list(variablesTorun[variablesTorun[i]==1]['VariableName']))>0:
        for j in range(1,1000):
            X_train, X_test_aux, y_train_aux, y_test_aux = train_test_split(X, y_train, test_size=0.2)
            standarscaler = StandardScaler()
            X_trained_scaled_aux = standarscaler.fit_transform(X_train)
            X_trained_scaled_aux = pd.DataFrame(X_trained_scaled_aux, index=X_train.index, columns=X_train.columns.values)

            X_test_scaled_aux = standarscaler.transform(X_test_aux)

            X_test_scaled_aux = pd.DataFrame(X_test_scaled_aux, index=X_test_aux.index, columns=X_test_aux.columns.values)


            variablesSelected = list(variablesTorun[variablesTorun[i]==1]['VariableName'])
            mse_aux,accuray_aux,r2_aux= calculated_metrics(variablesSelected,X_trained_scaled_aux,y_train_aux,X_test_scaled_aux,y_test_aux)
            mse.append(mse_aux)
            accuray.append(accuray_aux)
            r2.append(r2_aux)

        auxRes= pd.DataFrame({'Modelo': i, 'Median: Mean squared error': [np.median(np.asarray(mse))], 'Median: R2': [np.median(np.asarray(r2))],'Median: Accuray': [np.median(np.asarray(accuray))]})
        resultados = pd.concat([resultados,auxRes])
        resultados.to_csv('ResultadosCV_scores.csv')
    else:
        print(f"El conjunto de variables {i} no tiene variables")
#     break
# resultado_scores_ranking_cv.reset_index(inplace = True,drop = True)

Cantidad de variables: 1 Iteracion: 1
Cantidad de variables: 1 Iteracion: 2
Cantidad de variables: 1 Iteracion: 4
Cantidad de variables: 1 Iteracion: 5
Cantidad de variables: 1 Iteracion: 7
Cantidad de variables: 1 Iteracion: 8
Cantidad de variables: 1 Iteracion: 42
Cantidad de variables: 2 Iteracion: 1
Cantidad de variables: 2 Iteracion: 2
Cantidad de variables: 2 Iteracion: 3
Cantidad de variables: 2 Iteracion: 4
Cantidad de variables: 2 Iteracion: 6
Cantidad de variables: 2 Iteracion: 7
Cantidad de variables: 2 Iteracion: 9
Cantidad de variables: 2 Iteracion: 13
Cantidad de variables: 2 Iteracion: 15
Cantidad de variables: 2 Iteracion: 20
Cantidad de variables: 2 Iteracion: 22
Cantidad de variables: 2 Iteracion: 29
Cantidad de variables: 2 Iteracion: 39
Cantidad de variables: 2 Iteracion: 53
Cantidad de variables: 2 Iteracion: 55
Cantidad de variables: 2 Iteracion: 56
Cantidad de variables: 2 Iteracion: 63
Cantidad de variables: 2 Iteracion: 64
Cantidad de variables: 2 Iteracion: 71

Cantidad de variables: 6 Iteracion: 4
Cantidad de variables: 6 Iteracion: 5
Cantidad de variables: 6 Iteracion: 7
Cantidad de variables: 6 Iteracion: 8
Cantidad de variables: 6 Iteracion: 9
Cantidad de variables: 6 Iteracion: 10
Cantidad de variables: 6 Iteracion: 11
Cantidad de variables: 6 Iteracion: 13
Cantidad de variables: 6 Iteracion: 14
Cantidad de variables: 6 Iteracion: 16
Cantidad de variables: 6 Iteracion: 17
Cantidad de variables: 6 Iteracion: 18
Cantidad de variables: 6 Iteracion: 19
Cantidad de variables: 6 Iteracion: 20
Cantidad de variables: 6 Iteracion: 21
Cantidad de variables: 6 Iteracion: 22
Cantidad de variables: 6 Iteracion: 23
Cantidad de variables: 6 Iteracion: 24
Cantidad de variables: 6 Iteracion: 25
Cantidad de variables: 6 Iteracion: 27
Cantidad de variables: 6 Iteracion: 28
Cantidad de variables: 6 Iteracion: 30
Cantidad de variables: 6 Iteracion: 31
Cantidad de variables: 6 Iteracion: 32
Cantidad de variables: 6 Iteracion: 33
Cantidad de variables: 6 Itera

Cantidad de variables: 8 Iteracion: 68
Cantidad de variables: 8 Iteracion: 69
Cantidad de variables: 8 Iteracion: 71
Cantidad de variables: 8 Iteracion: 72
Cantidad de variables: 8 Iteracion: 74
Cantidad de variables: 8 Iteracion: 75
Cantidad de variables: 8 Iteracion: 76
Cantidad de variables: 8 Iteracion: 77
Cantidad de variables: 8 Iteracion: 79
Cantidad de variables: 8 Iteracion: 81
Cantidad de variables: 8 Iteracion: 82
Cantidad de variables: 8 Iteracion: 83
Cantidad de variables: 8 Iteracion: 84
Cantidad de variables: 8 Iteracion: 85
Cantidad de variables: 8 Iteracion: 86
Cantidad de variables: 8 Iteracion: 87
Cantidad de variables: 8 Iteracion: 89
Cantidad de variables: 8 Iteracion: 90
Cantidad de variables: 8 Iteracion: 91
Cantidad de variables: 8 Iteracion: 92
Cantidad de variables: 8 Iteracion: 93
Cantidad de variables: 8 Iteracion: 98
Cantidad de variables: 9 Iteracion: 1
Cantidad de variables: 9 Iteracion: 2
Cantidad de variables: 9 Iteracion: 3
Cantidad de variables: 9 Ite

Cantidad de variables: 11 Iteracion: 3
Cantidad de variables: 11 Iteracion: 4
Cantidad de variables: 11 Iteracion: 5
Cantidad de variables: 11 Iteracion: 6
Cantidad de variables: 11 Iteracion: 7
Cantidad de variables: 11 Iteracion: 8
Cantidad de variables: 11 Iteracion: 9
Cantidad de variables: 11 Iteracion: 10
Cantidad de variables: 11 Iteracion: 11
Cantidad de variables: 11 Iteracion: 12
Cantidad de variables: 11 Iteracion: 13
Cantidad de variables: 11 Iteracion: 14
Cantidad de variables: 11 Iteracion: 15
Cantidad de variables: 11 Iteracion: 16
Cantidad de variables: 11 Iteracion: 17
Cantidad de variables: 11 Iteracion: 18
Cantidad de variables: 11 Iteracion: 19
Cantidad de variables: 11 Iteracion: 20
Cantidad de variables: 11 Iteracion: 21
Cantidad de variables: 11 Iteracion: 22
Cantidad de variables: 11 Iteracion: 23
Cantidad de variables: 11 Iteracion: 24
Cantidad de variables: 11 Iteracion: 25
Cantidad de variables: 11 Iteracion: 26
Cantidad de variables: 11 Iteracion: 27
Cantida

Cantidad de variables: 13 Iteracion: 19
Cantidad de variables: 13 Iteracion: 20
Cantidad de variables: 13 Iteracion: 21
Cantidad de variables: 13 Iteracion: 22
Cantidad de variables: 13 Iteracion: 23
Cantidad de variables: 13 Iteracion: 24
Cantidad de variables: 13 Iteracion: 25
Cantidad de variables: 13 Iteracion: 26
Cantidad de variables: 13 Iteracion: 27
Cantidad de variables: 13 Iteracion: 28
Cantidad de variables: 13 Iteracion: 29
Cantidad de variables: 13 Iteracion: 30
Cantidad de variables: 13 Iteracion: 32
Cantidad de variables: 13 Iteracion: 33
Cantidad de variables: 13 Iteracion: 34
Cantidad de variables: 13 Iteracion: 35
Cantidad de variables: 13 Iteracion: 36
Cantidad de variables: 13 Iteracion: 37
Cantidad de variables: 13 Iteracion: 38
Cantidad de variables: 13 Iteracion: 39
Cantidad de variables: 13 Iteracion: 40
Cantidad de variables: 13 Iteracion: 41
Cantidad de variables: 13 Iteracion: 42
Cantidad de variables: 13 Iteracion: 43
Cantidad de variables: 13 Iteracion: 44


Lasso alpha: 0.1 Iteracion: 37
Lasso alpha: 0.1 Iteracion: 38
Lasso alpha: 0.1 Iteracion: 40
Lasso alpha: 0.1 Iteracion: 41
Lasso alpha: 0.1 Iteracion: 42
Lasso alpha: 0.1 Iteracion: 43
Lasso alpha: 0.1 Iteracion: 44
Lasso alpha: 0.1 Iteracion: 45
Lasso alpha: 0.1 Iteracion: 46
Lasso alpha: 0.1 Iteracion: 47
Lasso alpha: 0.1 Iteracion: 48
Lasso alpha: 0.1 Iteracion: 49
Lasso alpha: 0.1 Iteracion: 50
Lasso alpha: 0.1 Iteracion: 51
Lasso alpha: 0.1 Iteracion: 52
Lasso alpha: 0.1 Iteracion: 53
Lasso alpha: 0.1 Iteracion: 54
Lasso alpha: 0.1 Iteracion: 55
Lasso alpha: 0.1 Iteracion: 56
Lasso alpha: 0.1 Iteracion: 57
Lasso alpha: 0.1 Iteracion: 58
Lasso alpha: 0.1 Iteracion: 59
Lasso alpha: 0.1 Iteracion: 60
Lasso alpha: 0.1 Iteracion: 61
Lasso alpha: 0.1 Iteracion: 62
Lasso alpha: 0.1 Iteracion: 63
Lasso alpha: 0.1 Iteracion: 64
Lasso alpha: 0.1 Iteracion: 65
Lasso alpha: 0.1 Iteracion: 66
Lasso alpha: 0.1 Iteracion: 67
Lasso alpha: 0.1 Iteracion: 68
Lasso alpha: 0.1 Iteracion: 69
Lasso al

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables 

El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
El conjunto de variables Lasso alpha: 0.5 Iteracion: 14 no tiene variables
Lasso alpha: 0.5 Iteracion: 15


  out=out, **kwargs)
  ret = ret.dtype.type(ret / rcount)


Lasso alpha: 0.5 Iteracion: 54
Lasso alpha: 0.5 Iteracion: 81
Lasso alpha: 0.5 Iteracion: 91
Modelo Diana 2


In [8]:
resultados.sort_values('Median: Mean squared error',ascending = True)

Unnamed: 0,Modelo,Median: Mean squared error,Median: R2,Median: Accuray
0,Cantidad de variables: 7 Iteracion: 76,3.677757,0.140432,0.708333
0,Cantidad de variables: 6 Iteracion: 67,3.691690,0.132058,0.708333
0,Cantidad de variables: 7 Iteracion: 21,3.695670,0.130213,0.708333
0,Lasso alpha: 0.30000000000000004 Iteracion: 57,3.712891,0.117845,0.750000
0,Cantidad de variables: 7 Iteracion: 8,3.723520,0.137915,0.708333
...,...,...,...,...
0,Lasso alpha: 0.1 Iteracion: 16,4.807330,-0.135322,0.666667
0,Lasso alpha: 0.1 Iteracion: 44,4.879815,-0.119128,0.708333
0,Lasso alpha: 0.1 Iteracion: 86,4.891113,-0.124913,0.666667
0,Lasso alpha: 0.1 Iteracion: 45,4.945866,-0.140021,0.666667
