# Introducción a Machine Learning

Los procesos principales en Machine Learning  son los siguientes:
1. Recolección de datos

2. Procesamiento de datos

3. Identificación del modelo

4. Entrenamiento

5. Validación

6. Identificación de hiperparámetros

7. Predicción



El proceso de aprendizaje es iterativo, por lo que es común que en cualquier paso nos podamos regresar a otro proceso, siempre con la finalidad de generar el mejor modelo.

En esta práctica partiremos del punto 2, asumiendo que los datos ya están recolectados.

## 2. procesamiento de datos

In [1]:
import numpy as np
import pandas as pd
import sklearn as sk
import matplotlib.pyplot as plt

In [2]:
from sklearn import datasets

diabetes = datasets.load_diabetes()
X = diabetes.data
y = diabetes.target

print('Dimensiones en X = {}'.format(X.shape))
print('Dimensiones en y = {}'.format(y.shape))

# Samples total  442
# Dimensionality  10
# Features  real, -.2 < x < .2
# Targets integer 25 - 346

Dimensiones en X = (442, 10)
Dimensiones en y = (442,)


## 3. Identificación del modelo

En este ejemplo se seleccionará  el modelo Lasso

In [3]:
from sklearn.linear_model import Lasso

linear_model = Lasso()

## 4 y 5. Entrenamiento y Validación

In [4]:
from sklearn.model_selection import KFold

k_fold = KFold(n_splits=3)

for k, (train, test) in enumerate(k_fold.split(X, y)):
    # Se entrena con el conjunto de datos de entrenamiento
    linear_model.fit(X[train], y[train])
    # Se valida con el conjunto de datos de prueba
    print("[fold {}]  coeficiente de correlación: {}".format(k, linear_model.score(X[test], y[test])))

[fold 0]  coeficiente de correlación: 0.34542984833684853
[fold 1]  coeficiente de correlación: 0.34712314449919834
[fold 2]  coeficiente de correlación: 0.36884725706191346


## 6. Identificación de hiperparámetros

El modelo Lasso tiene un hiperparámetro que es alpha, por defecto tiene asignado el valor 1.0.

Para identificar de qué forma se deberían modificar los hiperparámetros para aumentar el rendimiento, se debe conocer muy bien el algoritmo.

Esta práctica tiene como objetivo el de conocer los procesos generales en el aprendizaje automático, así que la explicación del modelo está fuera de este ámbito. Sin embargo, se muestra la función objetivo para dar una intuición de cómo afecta éste hiperparámetro en el modelo.

$$ Cost = (1 / (2 * num\_instancias)) * ||y - Xw||^2_2 + alpha * ||w||_1$$

In [5]:
linear_model2 = Lasso(alpha=0.1)
k_fold = KFold(n_splits=3)

for k, (train, test) in enumerate(k_fold.split(X, y)):
    # Se entrena con el conjunto de datos de entrenamiento
    linear_model2.fit(X[train], y[train])
    # Se valida con el conjunto de datos de prueba
    print("[fold {}]  coeficiente de correlación: {}".format(k, linear_model2.score(X[test], y[test])))

[fold 0]  coeficiente de correlación: 0.4553764654572192
[fold 1]  coeficiente de correlación: 0.4970449650050526
[fold 2]  coeficiente de correlación: 0.5075811884365067


# Ejercicio 1

1.1 Automatizar la búsqueda del mejor valor de alpha. Por ejemplo, realizar una búsqueda de 50 elementos en el rango [0,1]

Emplear validación cruzada de 4 folds

1.2 Discutir cómo afecta el número de folds en el proceso de entrenamiento y validación; cuál valor es el adecuado.

In [6]:
#*EXTRA
def frange(start,stop,step):
    while(start<stop):
        yield start
        start = start+step
        


In [19]:
#Ejercicio 1.1 Busqueda del Alpha !!
n = 4
k_fold2 = KFold(n_splits=n)
AALPHA = 0
KALPHA = 0
IALPHA = 0
for i in frange(0.02,1,.02):
    AALPHA = 0
    print("alpha = {}".format(i))
    linear_model3 = Lasso(alpha = i)
    for k2, (train, test) in enumerate(k_fold2.split(X, y)):
        linear_model3.fit(X[train], y[train])
        # Se valida con el conjunto de datos de prueba
        print("[fold {}]  coeficiente de correlación: {}".format(k2, linear_model3.score(X[test], y[test])))
        AALPHA = AALPHA + (linear_model3.score(X[test],y[test]))    
    print(AALPHA/4)
    if(KALPHA == 0):
        KALPHA = (AALPHA/4)
    else:
        if(KALPHA < (AALPHA/4)):
            print("Mejor coeficiente previo: {} ".format(KALPHA))
            print("Coeficiente actual: {} ".format(AALPHA/4))
            IALPHA = i
            KALPHA = (AALPHA/4)
print("Mejor alpha en promedio {} con un coeficiente de correlacion de : {}".format(IALPHA,KALPHA))

            
        
        
        


alpha = 0.02
[fold 0]  coeficiente de correlación: 0.6386361584381104
[fold 1]  coeficiente de correlación: 0.5420141956242923
[fold 2]  coeficiente de correlación: -1.5756739409366065
-0.09875589671855095
alpha = 0.04
[fold 0]  coeficiente de correlación: 0.6604816288707768
[fold 1]  coeficiente de correlación: 0.5441728027861938
[fold 2]  coeficiente de correlación: -1.164022838202662
0.010157898363577167
Mejor coeficiente previo: -0.09875589671855095 
Coeficiente actual: 0.010157898363577167 
alpha = 0.06
[fold 0]  coeficiente de correlación: 0.6554374208003224
[fold 1]  coeficiente de correlación: 0.5384133077582318
[fold 2]  coeficiente de correlación: -0.8191817785631624
0.09366723749884795
Mejor coeficiente previo: 0.010157898363577167 
Coeficiente actual: 0.09366723749884795 
alpha = 0.08
[fold 0]  coeficiente de correlación: 0.6567892768289585
[fold 1]  coeficiente de correlación: 0.5247278539322486
[fold 2]  coeficiente de correlación: -0.5313517303129636
0.1625413501120609
M

# Ejercicio 2

Programar los siguientes errores: $sse$, $mse$, $rmse$

Agregar las métricas en el proceso de validación del modelo

In [8]:
def SSEf(Yr,Yi):
    return (Yr-Yi)**2
    
def SSE(Yr,Yi):
    Sum = 0
    for i in range(0,len(Yr)):
        Sum = Sum + SSEf(Yr[i],Yi[i])    
        

def MSE(Yr,Yi):
    n = len(Yr)
    Y = SSE(Yr,Yi)
    return (Y/n)

    

# Ejercicio 3
Graficar los valores obtenidos por el modelo, con el mejor hiper-parámetro, y los valores reales de cada uno de los folds.

# Ejercicio 4

Replicar los ejercicios 1, 2 y 3 con el dataset boston.

Ejemplo:

In [14]:
from sklearn.datasets import load_boston
boston = load_boston()
Z = boston.data
a = boston.target

In [21]:

n = 4 
k_fold3 = KFold(n_splits=n)
AALPHA = 0
KALPHA = 0
IALPHA = 0
for i in frange(0.02,1,.02):
    AALPHA = 0
    print("alpha = {}".format(i))
    linear_model4 = Lasso(alpha = i)
    for k2, (train, test) in enumerate(k_fold3.split(Z, a)):
        linear_model4.fit(Z[train], a[train])
        # Se valida con el conjunto de datos de prueba
        print("[fold {}]  coeficiente de correlación: {}".format(k2, linear_model4.score(Z[test], a[test])))
        AALPHA = AALPHA + (linear_model4.score(Z[test],a[test]))    
    print(AALPHA/4)
    if(KALPHA == 0):
        KALPHA = (AALPHA/4)
    else:
        if(KALPHA < (AALPHA/4)):
            print("Mejor coeficiente previo: {} ".format(KALPHA))
            print("Coeficiente actual: {} ".format(AALPHA/4))
            IALPHA = i
            KALPHA = (AALPHA/4)
print("Mejor alpha en promedio {} con un coeficiente de correlacion promedio de : {}".format(IALPHA,KALPHA))

            
        
        

alpha = 0.02
[fold 0]  coeficiente de correlación: 0.6633413096718084
[fold 1]  coeficiente de correlación: 0.635630844301446
[fold 2]  coeficiente de correlación: 0.6613704594057834
[fold 3]  coeficiente de correlación: 0.6321873944274884
[fold 4]  coeficiente de correlación: 0.5453950782961197
[fold 5]  coeficiente de correlación: -0.3247250801962971
[fold 6]  coeficiente de correlación: 0.3489970246999469
0.7905492576515739
alpha = 0.04
[fold 0]  coeficiente de correlación: 0.6694035481480622
[fold 1]  coeficiente de correlación: 0.6639731743825339
[fold 2]  coeficiente de correlación: 0.6354035079412601
[fold 3]  coeficiente de correlación: 0.6477531155163992
[fold 4]  coeficiente de correlación: 0.5501092167419295
[fold 5]  coeficiente de correlación: -0.30718841343455505
[fold 6]  coeficiente de correlación: 0.28184390307279317
0.7853245130921057
alpha = 0.06
[fold 0]  coeficiente de correlación: 0.6719397475142541
[fold 1]  coeficiente de correlación: 0.6811933711557631
[fold 2]

[fold 1]  coeficiente de correlación: 0.6420782656106012
[fold 2]  coeficiente de correlación: 0.5168094356441304
[fold 3]  coeficiente de correlación: 0.41478069811229756
[fold 4]  coeficiente de correlación: 0.39954526828444326
[fold 5]  coeficiente de correlación: 0.08470513004396185
[fold 6]  coeficiente de correlación: 0.32910436062516946
0.7568929665691766
alpha = 0.6800000000000003
[fold 0]  coeficiente de correlación: 0.638089428638376
[fold 1]  coeficiente de correlación: 0.6400118256087142
[fold 2]  coeficiente de correlación: 0.512441800791035
[fold 3]  coeficiente de correlación: 0.40405607123520393
[fold 4]  coeficiente de correlación: 0.3932305769099438
[fold 5]  coeficiente de correlación: 0.09409344198152103
[fold 6]  coeficiente de correlación: 0.33174498792585194
0.7534170332726614
alpha = 0.7000000000000003
[fold 0]  coeficiente de correlación: 0.6355415776135941
[fold 1]  coeficiente de correlación: 0.6379171045391421
[fold 2]  coeficiente de correlación: 0.50804209