# Introducción a Machine Learning

Los procesos principales en Machine Learning  son los siguientes:
1. Recolección de datos

2. Procesamiento de datos

3. Identificación del modelo

4. Entrenamiento

5. Validación

6. Identificación de hiperparámetros

7. Predicción



El proceso de aprendizaje es iterativo, por lo que es común que en cualquier paso nos podamos regresar a otro proceso, siempre con la finalidad de generar el mejor modelo.

En esta práctica partiremos del punto 2, asumiendo que los datos ya están recolectados.

## 2. procesamiento de datos

In [2]:
import numpy as np
import pandas as pd
import sklearn as sk
import matplotlib.pyplot as plt

In [3]:
from sklearn import datasets

diabetes = datasets.load_diabetes()
X = diabetes.data
y = diabetes.target

print('Dimensiones en X = {}'.format(X.shape))
print('Dimensiones en y = {}'.format(y.shape))

# Samples total  442
# Dimensionality  10
# Features  real, -.2 < x < .2
# Targets integer 25 - 346

Dimensiones en X = (442, 10)
Dimensiones en y = (442,)


## 3. Identificación del modelo

En este ejemplo se seleccionará  el modelo Lasso

In [4]:
from sklearn.linear_model import Lasso

linear_model = Lasso()

## 4 y 5. Entrenamiento y Validación

In [5]:
from sklearn.model_selection import KFold

k_fold = KFold(n_splits=3)

for k, (train, test) in enumerate(k_fold.split(X, y)):
    # Se entrena con el conjunto de datos de entrenamiento
    linear_model.fit(X[train], y[train])
    # Se valida con el conjunto de datos de prueba
    print("[fold {}]  coeficiente de correlación: {}".format(k, linear_model.score(X[test], y[test])))

[fold 0]  coeficiente de correlación: 0.34542984833684853
[fold 1]  coeficiente de correlación: 0.34712314449919834
[fold 2]  coeficiente de correlación: 0.36884725706191346


## 6. Identificación de hiperparámetros

El modelo Lasso tiene un hiperparámetro que es alpha, por defecto tiene asignado el valor 1.0.

Para identificar de qué forma se deberían modificar los hiperparámetros para aumentar el rendimiento, se debe conocer muy bien el algoritmo.

Esta práctica tiene como objetivo el de conocer los procesos generales en el aprendizaje automático, así que la explicación del modelo está fuera de este ámbito. Sin embargo, se muestra la función objetivo para dar una intuición de cómo afecta éste hiperparámetro en el modelo.

$$ Cost = (1 / (2 * num\_instancias)) * ||y - Xw||^2_2 + alpha * ||w||_1$$

In [6]:
linear_model2 = Lasso(alpha=0.1)
k_fold = KFold(n_splits=3)

for k, (train, test) in enumerate(k_fold.split(X, y)):
    # Se entrena con el conjunto de datos de entrenamiento
    linear_model2.fit(X[train], y[train])
    # Se valida con el conjunto de datos de prueba
    print("[fold {}]  coeficiente de correlación: {}".format(k, linear_model2.score(X[test], y[test])))

[fold 0]  coeficiente de correlación: 0.4553764654572192
[fold 1]  coeficiente de correlación: 0.4970449650050526
[fold 2]  coeficiente de correlación: 0.5075811884365067


# Ejercicio 1

1.1 Automatizar la búsqueda del mejor valor de alpha. Por ejemplo, realizar una búsqueda de 50 elementos en el rango [0,1]

Emplear validación cruzada de 4 folds

1.2 Discutir cómo afecta el número de folds en el proceso de entrenamiento y validación; cuál valor es el adecuado.

In [7]:
#*EXTRA
def frange(start,stop,step):
    while(start<stop):
        yield start
        start = start+step
        


In [8]:
#Ejercicio 1.1 Busqueda del Alpha !!
n = 4
k_fold2 = KFold(n_splits=n)
AALPHA = 0
KALPHA = 0
IALPHA = 0
for i in frange(0.02,1,.02):
    AALPHA = 0
    print("alpha = {}".format(i))
    linear_model3 = Lasso(alpha = i)
    for k2, (train, test) in enumerate(k_fold2.split(X, y)):
        linear_model3.fit(X[train], y[train])
        # Se valida con el conjunto de datos de prueba
        print("[fold {}]  coeficiente de correlación: {}".format(k2, linear_model3.score(X[test], y[test])))
        AALPHA = AALPHA + (linear_model3.score(X[test],y[test]))    
    print(AALPHA/4)
    if(KALPHA == 0):
        KALPHA = (AALPHA/4)
    else:
        if(KALPHA < (AALPHA/4)):
            print("Mejor coeficiente previo: {} ".format(KALPHA))
            print("Coeficiente actual: {} ".format(AALPHA/4))
            IALPHA = i
            KALPHA = (AALPHA/4)
print("Mejor alpha en promedio {} con un coeficiente de correlacion de : {}".format(IALPHA,KALPHA))

            
        
        
        


alpha = 0.02
[fold 0]  coeficiente de correlación: 0.3769289242773214
[fold 1]  coeficiente de correlación: 0.491627611130961
[fold 2]  coeficiente de correlación: 0.5190668895489858
[fold 3]  coeficiente de correlación: 0.5520232571489545
0.48491167052655565
alpha = 0.04
[fold 0]  coeficiente de correlación: 0.3740694525340481
[fold 1]  coeficiente de correlación: 0.49131929781241196
[fold 2]  coeficiente de correlación: 0.5232127006233358
[fold 3]  coeficiente de correlación: 0.5505138199236015
0.48477881772334935
alpha = 0.06
[fold 0]  coeficiente de correlación: 0.3712448906760034
[fold 1]  coeficiente de correlación: 0.4899057395240403
[fold 2]  coeficiente de correlación: 0.526067494387482
[fold 3]  coeficiente de correlación: 0.5492321090698324
0.4841125584143396
alpha = 0.08
[fold 0]  coeficiente de correlación: 0.3681075893657215
[fold 1]  coeficiente de correlación: 0.4879878655074767
[fold 2]  coeficiente de correlación: 0.5272153255204882
[fold 3]  coeficiente de correlació

[fold 2]  coeficiente de correlación: 0.43587772226993204
[fold 3]  coeficiente de correlación: 0.4426500081774016
0.40253681299131244
alpha = 0.6800000000000003
[fold 0]  coeficiente de correlación: 0.3288466510900079
[fold 1]  coeficiente de correlación: 0.3962637225422943
[fold 2]  coeficiente de correlación: 0.4317044125682865
[fold 3]  coeficiente de correlación: 0.4378670756271351
0.39867046545693097
alpha = 0.7000000000000003
[fold 0]  coeficiente de correlación: 0.3262433373969905
[fold 1]  coeficiente de correlación: 0.39246221891249233
[fold 2]  coeficiente de correlación: 0.4274352253599109
[fold 3]  coeficiente de correlación: 0.43295855500720576
0.3947748341691499
alpha = 0.7200000000000003
[fold 0]  coeficiente de correlación: 0.32349769391474203
[fold 1]  coeficiente de correlación: 0.3888611374141713
[fold 2]  coeficiente de correlación: 0.42306775117296913
[fold 3]  coeficiente de correlación: 0.4280515081405349
0.3908695226606044
alpha = 0.7400000000000003
[fold 0]  c

# Ejercicio 2

Programar los siguientes errores: $sse$, $mse$, $rmse$

Agregar las métricas en el proceso de validación del modelo

In [9]:
def SSEf(Yr,Yi):
    return (Yr-Yi)**2
    
def SSE(Yr,Yi):
    Sum = 0
    for i in range(0,len(Yr)):
        Sum = Sum + SSEf(Yr[i],Yi[i])    
        

def MSE(Yr,Yi):
    n = len(Yr)
    Y = SSE(Yr,Yi)
    return (Y/n)

def RMSE(Yr,Yi):
    return MSE(Yr,Yi)**.5
    

# Ejercicio 3
Graficar los valores obtenidos por el modelo, con el mejor hiper-parámetro, y los valores reales de cada uno de los folds.

# Ejercicio 4

Replicar los ejercicios 1, 2 y 3 con el dataset boston.

Ejemplo:

In [12]:
from sklearn.datasets import load_boston
boston = load_boston()
Z = boston.data
a = boston.target
Z

array([[6.3200e-03, 1.8000e+01, 2.3100e+00, ..., 1.5300e+01, 3.9690e+02,
        4.9800e+00],
       [2.7310e-02, 0.0000e+00, 7.0700e+00, ..., 1.7800e+01, 3.9690e+02,
        9.1400e+00],
       [2.7290e-02, 0.0000e+00, 7.0700e+00, ..., 1.7800e+01, 3.9283e+02,
        4.0300e+00],
       ...,
       [6.0760e-02, 0.0000e+00, 1.1930e+01, ..., 2.1000e+01, 3.9690e+02,
        5.6400e+00],
       [1.0959e-01, 0.0000e+00, 1.1930e+01, ..., 2.1000e+01, 3.9345e+02,
        6.4800e+00],
       [4.7410e-02, 0.0000e+00, 1.1930e+01, ..., 2.1000e+01, 3.9690e+02,
        7.8800e+00]])

In [11]:

n = 4 
k_fold3 = KFold(n_splits=n)
AALPHA = 0
KALPHA = 0
IALPHA = 0
for i in frange(0.02,1,.02):
    AALPHA = 0
    print("alpha = {}".format(i))
    linear_model4 = Lasso(alpha = i)
    for k2, (train, test) in enumerate(k_fold3.split(Z, a)):
        linear_model4.fit(Z[train], a[train])
        # Se valida con el conjunto de datos de prueba
        print("[fold {}]  coeficiente de correlación: {}".format(k2, linear_model4.score(Z[test], a[test])))
        AALPHA = AALPHA + (linear_model4.score(Z[test],a[test]))    
    print(AALPHA/4)
    if(KALPHA == 0):
        KALPHA = (AALPHA/4)
    else:
        if(KALPHA < (AALPHA/4)):
            print("Mejor coeficiente previo: {} ".format(KALPHA))
            print("Coeficiente actual: {} ".format(AALPHA/4))
            IALPHA = i
            KALPHA = (AALPHA/4)
print("Mejor alpha en promedio {} con un coeficiente de correlacion promedio de : {}".format(IALPHA,KALPHA))

            
        
        

alpha = 0.02
[fold 0]  coeficiente de correlación: 0.6213988695064239
[fold 1]  coeficiente de correlación: 0.6064232922012476
[fold 2]  coeficiente de correlación: 0.35765810694009004
[fold 3]  coeficiente de correlación: -0.9966977838336595
0.14719562120352547
alpha = 0.04
[fold 0]  coeficiente de correlación: 0.6367945805750947
[fold 1]  coeficiente de correlación: 0.5860427085338555
[fold 2]  coeficiente de correlación: 0.3550045425554019
[fold 3]  coeficiente de correlación: -0.8966285273516204
0.170303326078183
Mejor coeficiente previo: 0.14719562120352547 
Coeficiente actual: 0.170303326078183 
alpha = 0.06
[fold 0]  coeficiente de correlación: 0.6482717484265268
[fold 1]  coeficiente de correlación: 0.5908239413244165
[fold 2]  coeficiente de correlación: 0.3559220347040888
[fold 3]  coeficiente de correlación: -0.8848802365116815
0.17753437198583766
Mejor coeficiente previo: 0.170303326078183 
Coeficiente actual: 0.17753437198583766 
alpha = 0.08
[fold 0]  coeficiente de corre

[fold 0]  coeficiente de correlación: 0.6042993911458239
[fold 1]  coeficiente de correlación: 0.5314314234050226
[fold 2]  coeficiente de correlación: 0.40459595587844177
[fold 3]  coeficiente de correlación: -0.595029611551184
0.23632428971952607
Mejor coeficiente previo: 0.23281062414920317 
Coeficiente actual: 0.23632428971952607 
alpha = 0.6200000000000002
[fold 0]  coeficiente de correlación: 0.6017610979534278
[fold 1]  coeficiente de correlación: 0.5308234307659307
[fold 2]  coeficiente de correlación: 0.4046430026570176
[fold 3]  coeficiente de correlación: -0.5782950096966075
0.23973313041994215
Mejor coeficiente previo: 0.23632428971952607 
Coeficiente actual: 0.23973313041994215 
alpha = 0.6400000000000002
[fold 0]  coeficiente de correlación: 0.5991617855262135
[fold 1]  coeficiente de correlación: 0.5303999561886084
[fold 2]  coeficiente de correlación: 0.4045699278795236
[fold 3]  coeficiente de correlación: -0.5617845083208182
0.24308679031838182
Mejor coeficiente previ