## Inteligencia Artificial para la Ciencia de los Datos
## Máster en Lógica, Computación e Inteligencia Artificial 
## Tema 3: Modelos lineales

### Ejercicio: aprendizaje en regresión lineal

In [None]:
import numpy as np

#### Apartado 1 

Supongamos que tenemos los datos proporcionados en la hoja de cálculo `datos-regresion-ipppd-prueba.csv`. Se trata de un conjunto de 100 datos, con 11 columnas. Se quiere modelar la última columna como combinación lineal las 10 anteriores. Se pide:


* Dividir el conjunto en los primeros 90 datos y en los 10 restantes (que llamaremos test), en arrays de numpy.  
* Evaluar los errores cuadráticos que se cometerían con cada uno de los siguientes vectores de pesos `w1` a `w5`, tanto en el conjunto de 90 ejemplos como en el test. 

¿Qué vector de pesos sería el mejor?   

In [None]:

w1=np.array([-1.29534026,  1.23835128,  0.12877138, -2.96549057, -0.35841744,
             2.82746578,  2.21482984, -1.65336872, -0.47153383, -0.44702348,
             -3.3547648 ])
w2=np.array([ 3.89328892,  1.35129463, -2.53506133, -2.04672724,  1.45909327,
            3.23755072, -0.15481467,  0.09800942,  2.73737855,  4.53587465,
            -0.0633372 ])

w3=np.array([ 2.35038563, -0.45615946, -1.46526707,  1.11298963, -0.1708379 ,
             0.55773606, -2.11062204,  -1.65842872,  3.25673974, -0.91793153,
             -0.83749571])

w4=np.array([-2.44018926,  0.99262032, -1.3226565 , -2.07167792,  2.2708178 ,
            3.11581296,  1.76699122,  1.25716116,  1.04054152, -0.60208891,
            -1.01754336])

w5=np.array([ 1.61374819, -2.08690754,  1.58248754,  2.95886602, -0.31980219,
            2.31724431, -2.31581768, -2.79049173,  1.43366351, -1.12239852,
            -1.333636  ])


# ### Solución:

In [None]:
import pandas as pd

tabla=pd.read_table("datos-regresion-ipppd-prueba.csv",sep=",",header=None).values
tabla.shape

In [None]:
# crearlo con unos
tabla_1=np.hstack((np.ones((100,1)),tabla))

# entr es entrenamiento
# test es testing

X_entr=tabla_1[:90,:-1]
y_entr=tabla_1[:90,-1]
X_test=tabla_1[90:,:-1]
y_test=tabla_1[90:,-1]

In [None]:
def error_cuadratico_medio(X, y, w):
    # un vector de resultados de prediccion es lo que devuelve
    # W es un vector de una dimension con n+1 pesos
    # las X es un array de filas que sean
    #np.dot toma el vector y lo multipliplica la cantidad de filas de X
    return np.square(y-np.dot(X,w)).mean()
    # return np.square(np.subtract(y,np.dot(X,w)).mean()
 

In [None]:
# pregunta que vector de pesos es el mejor?
print("Error con pesos 1: {}".format(error_cuadratico_medio(X_entr, y_entr,w1)))
print("Error con pesos 2: {}".format(error_cuadratico_medio(X_entr, y_entr,w2)))
print("Error con pesos 3: {}".format(error_cuadratico_medio(X_entr, y_entr,w3)))
print("Error con pesos 4: {}".format(error_cuadratico_medio(X_entr, y_entr,w4)))
print("Error con pesos 5: {}".format(error_cuadratico_medio(X_entr, y_entr,w5)))

In [None]:
# como los vectores son del mismo experimento eso genera que el error sera comparablemente inferior por su propia naturaleza
print("Error con pesos 1: {}".format(error_cuadratico_medio(X_entr, y_test,w1)))
print("Error con pesos 2: {}".format(error_cuadratico_medio(X_entr, y_test,w2)))
print("Error con pesos 3: {}".format(error_cuadratico_medio(X_entr, y_test,w3)))
print("Error con pesos 4: {}".format(error_cuadratico_medio(X_entr, y_test,w4)))
print("Error con pesos 5: {}".format(error_cuadratico_medio(X_entr, y_test,w5)))

#### Apartado 2

Tratar de aprender un vector de pesos que minimize el error cuadrático, usando para ello el algoritmo de descenso por el gradiente, versión estocástica. 

En concreto, de pide definir una función `aprende_pesos(X,y,rango_inicial,n_epochs,tasa)` que recibiendo un conjunto de datos `X` con sus valores esperados `y`, un rango inicial $r$ (para que los pesos iniciales se tomen aleatriamente entre $-r$ y $r$), el número de epochs  y la `tasa` de aprendizaje, devuelve el peso aprendido aplicando el algoritmo de descenso por el gradiente, versión estocástica.

Mostrar también la evolución del error cuadrático medio que se va obteniendo en los sucesivos epochs.  

### Solución:

In [29]:
import random

def combinacion_lineal(x,y):
    return x*y

def aprende_pesos(X,y,r,n_epochs,tasa=0.1):
   n_caract=X.shape[1]
   w=np.random.uniform(low=-r,high=r,size=(n_caract,))
   indices=list(range(X.shape[0]))
   for n in range(n_epochs):
       random.shuffle(indices)
       for j in indices:
           x=X[j]
           y_esperado=y[j]
           y_calculado=combinacion_lineal(x,w)
           for i in range(n_caract):
               w[i]+=tasa*(y_esperado-y_calculado)*x[i]
       print("Pesos: {}".format(w))
       mse=error_cuadrático_medio(X,y,w)
       print("Error cuadrático: {}".format(mse))
       print("-----------------------------------------------")
   return w

    # # algoritmo de descenso por gradiente
    
    # # caracteristicas
    
    # n_caract = X.shape[1]
    
    # # pesos aleatorios uniformes
    

    # w=np.random.uniform(low=-r, high=r, size=(n_caract,))
    # # truco de indice para reordenar pero no perder correspondencia
    # indice=list(range(X.shape[0]))
    # for n in range (n_epochs):
    #     # barajamos indices
    #     random.shuffle(indices)
    #     # tomamos ejemplo
    #     for j in indices:
    #         # operamos
    #         x=X[j]
    #         y_esperado=y[j]
    #         y_calculado=combinacion_lineal(x,w)
    #         # por cada peso actualizamos
    #         for i range(n_caract):
    #             w[i]+=tasa*(y_esperado-y_calculado)*x[i]
               
    #     print("Pesos: "{}.format[w])
    #     mse=error_cuadratico_medio(X,y,w)
    #     print("Error cuadratico medio {}.format(mse)")
    # return 1


In [33]:
w=aprende_pesos(X_entr,y_entr,4,40,tasa=0.001)

ValueError: setting an array element with a sequence.

In [31]:
def algunos_ejemplos_entr():
       for i in range(0,len(X_entr),20):
       ejemplo=X_entr[i]
       print("Ejemplo: {}".format(ejemplo))
       print("Valor_esperado: {}".format(y_entr[i]))
       print("Predicción: {}".format(np.dot(ejemplo,w)))
       print("---------------------------------------")
algunos_ejemplos_entr()

IndentationError: expected an indented block (Temp/ipykernel_3400/681482513.py, line 3)

In [32]:
def algunos_ejemplos_test():
       for i in range(len(X_test)):
       ejemplo=X_test[i]
       print("Ejemplo: {}".format(ejemplo))
       print("Valor_esperado: {}".format(y_test[i]))
       print("Predicción: {}".format(np.dot(ejemplo,w)))
       print("---------------------------------------")
algunos_ejemplos_test()

IndentationError: expected an indented block (Temp/ipykernel_3400/2033459491.py, line 3)

#### Apartado 3

Sobre varios ejemplos tanto de entrenamiento como de test, comparar las predicciones obtenidas con el vector de pesos aprendido, respecto al valor real. 

### Solución: