# Regresión Lineal: L1 vs L2
-------------------------------

Esta función muestra cómo usar TensorFlow para resolver la regresión lineal a través de la matriz inversa.

Es importante conocer el efecto de las funciones de pérdida en la convergencia de algoritmos. Aquí ilustraremos cómo las funciones de pérdida de L1 y L2 afectan la convergencia en la regresión lineal. Utilizaremos el mismo conjunto de datos de iris que en la receta anterior, pero cambiaremos nuestras funciones de pérdida y tasas de aprendizaje para ver cómo cambia la convergencia.

<img src="images/04_L1_L2_learningrates.png" width="512">

Comenzamos cargando las bibliotecas necesarias.

In [None]:
import matplotlib.pyplot as plt
import numpy as np
import tensorflow as tf
from sklearn import datasets
from tensorflow.python.framework import ops
ops.reset_default_graph()

# Pérdida L1
--------------

Aquí, ilustraremos la regresión lineal con la pérdida L1. Más adelante en este script, ilustraremos el mismo problema con L2-Loss.

La ecuación para la pérdida L1 para cuadrados mínimos lineales es

$$S = \sum_{i=1}^{N}\left| y_{i} - \hat{y_{i}} \right|$$

Donde $N$ es el número de puntos de los datos, $y_{i}$ es el  actual i-ésimo valor de y, $\hat{y_{i}}$ es el valor de y predicho.

Comenzamos una sesión del grafo computacional.

In [None]:
sess = tf.Session()

Ahora cargamos los datos de Iris.

In [None]:
# iris.data = [(Sepal Length, Sepal Width, Petal Length, Petal Width)]
iris = datasets.load_iris()
x_vals = np.array([x[3] for x in iris.data])
y_vals = np.array([y[0] for y in iris.data])

Establecer algunos parámetros del modelo.

Un parámetro importante a tener en cuenta es la tasa de aprendizaje. Si la velocidad de aprendizaje es demasiado grande, el modelo no convergerá. Si la velocidad de aprendizaje es demasiado pequeña, el modelo convergerá demasiado lentamente.

Aquí hay dos valores de tasa de aprendizaje para mostrar la convergencia y la no convergencia.

La convergencia ocurre por debajo de 0.35, intente establecer la velocidad de aprendizaje inferior a la de la convergencia. Para ilustrar la no convergencia, establezca la tasa de aprendizaje en 0.4 o superior.

In [None]:
batch_size = 25
learning_rate = 0.4 # No convergerá con la tasa de aprendizaje a 0.4
iterations = 50

Ahora podemos inicializar marcadores de posición, variables de modelo y operaciones de modelo.

In [None]:
# Inicializar los marcadores de posición
x_data = tf.placeholder(shape=[None, 1], dtype=tf.float32)
y_target = tf.placeholder(shape=[None, 1], dtype=tf.float32)

# Crear las variables para la Regresión lineal
A = tf.Variable(tf.random_normal(shape=[1,1]))
b = tf.Variable(tf.random_normal(shape=[1,1]))

# Declarar las operaciones del modelo
model_output = tf.add(tf.matmul(x_data, A), b)

A continuación, declaramos la función de pérdida de l1 y la función de optimización. Después de eso inicializamos las variables del modelo.

In [None]:
# Declarar las funciones de pérdida
loss_l1 = tf.reduce_mean(tf.abs(y_target - model_output))

# Declarar los optimizadores
my_opt_l1 = tf.train.GradientDescentOptimizer(learning_rate)
train_step_l1 = my_opt_l1.minimize(loss_l1)

# Inicializar las variables
init = tf.global_variables_initializer()
sess.run(init)

Ahora empezamos el ciclo de entrenamiento.

In [None]:
# Ciclo de entrenamiento
loss_vec_l1 = []
for i in range(iterations):
    rand_index = np.random.choice(len(x_vals), size=batch_size)
    rand_x = np.transpose([x_vals[rand_index]])
    rand_y = np.transpose([y_vals[rand_index]])
    sess.run(train_step_l1, feed_dict={x_data: rand_x, y_target: rand_y})
    temp_loss_l1 = sess.run(loss_l1, feed_dict={x_data: rand_x, y_target: rand_y})
    loss_vec_l1.append(temp_loss_l1)
    if (i+1)%25==0:
        print('Step #' + str(i+1) + ' A = ' + str(sess.run(A)) + ' b = ' + str(sess.run(b)))

# Pérdida L2
--------

Aquí, ilustraremos la regresión lineal con la pérdida L2...

La ecuación para la pérdida L2 para cuadrados mínimos lineales es

$$S = \sum_{i=1}^{N}\left( y_{i} - \hat{y_{i}} \right)^{2}$$

Donde $N$ es el número de puntos de datos, $y_{i}$ es el valor actual del iésimo y, $\hat{y_{i}}$ es el i-ésimo y predicho.

Comenzamos una sesión del grafo computacional.

In [None]:
# Pérdida L2
# Reiniciar el grafo
ops.reset_default_graph()

# Crear el grafo
sess = tf.Session()

Igual que antes, inicializamos los marcadores de posición, las variables y las operaciones de modelo.

In [None]:
# Inicializar los marcacdores de posición
x_data = tf.placeholder(shape=[None, 1], dtype=tf.float32)
y_target = tf.placeholder(shape=[None, 1], dtype=tf.float32)

# Crear las variables para la Regresión lineal
A = tf.Variable(tf.random_normal(shape=[1,1]))
b = tf.Variable(tf.random_normal(shape=[1,1]))

# Declarar las operaciones del modelo
model_output = tf.add(tf.matmul(x_data, A), b)

Aquí están las funciones de pérdida, inicialización de variables y funciones de optimización.

In [None]:
# Declarar las funciones de pérdida
loss_l2 = tf.reduce_mean(tf.square(y_target - model_output))

#Declarar los optimizadores
my_opt_l2 = tf.train.GradientDescentOptimizer(learning_rate)
train_step_l2 = my_opt_l2.minimize(loss_l2)

# Inicializar las variables
init = tf.global_variables_initializer()
sess.run(init)

Ahora podemos comenzar nuestro entrenamiento de regresión lineal con la función L2.

In [None]:
loss_vec_l2 = []
for i in range(iterations):
    rand_index = np.random.choice(len(x_vals), size=batch_size)
    rand_x = np.transpose([x_vals[rand_index]])
    rand_y = np.transpose([y_vals[rand_index]])
    sess.run(train_step_l2, feed_dict={x_data: rand_x, y_target: rand_y})
    temp_loss_l2 = sess.run(loss_l2, feed_dict={x_data: rand_x, y_target: rand_y})
    loss_vec_l2.append(temp_loss_l2)
    if (i+1)%25==0:
        print('Step #' + str(i+1) + ' A = ' + str(sess.run(A)) + ' b = ' + str(sess.run(b)))

Aquí está el código matplotlib para trazar la pérdida de las funciones de pérdida L1 y L2 aplicadas al mismo problema de regresión lineal.

In [None]:
# Graficar la pérdida a través del tiempo
plt.plot(loss_vec_l1, 'k-', label='L1 Loss')
plt.plot(loss_vec_l2, 'r--', label='L2 Loss')
plt.title('L1 and L2 Loss per Generation')
plt.xlabel('Generation')
plt.ylabel('L1 Loss')
plt.legend(loc='upper right')
plt.show()