# Ejercicio: Pérdida Logística

## Objetivos
En este ejercicio, vas a:
- examinar la implementación y utilizar la función de pérdida para regresión logística.

In [None]:
import numpy as np
#%matplotlib widget
import matplotlib.pyplot as plt
from plt_logistic_loss import  plt_logistic_cost, plt_two_logistic_loss_curves, plt_simple_example
from plt_logistic_loss import soup_bowl, plt_logistic_squared_error
plt.style.use('./deeplearning.mplstyle')

## Conjunto de datos
Comencemos con el mismo conjunto de datos que se usó en el ejercicio de frontera de decisión.

Usaremos una función auxiliar para graficar estos datos. Los puntos de datos con etiqueta $y=1$ se muestran como cruces rojas, mientras que los puntos con $y=0$ se muestran como círculos azules.

In [None]:
soup_bowl()

## Función de pérdida

En un ejercicio anterior, desarrollaste la función de *pérdida logística*. Recuerda, la pérdida se define para un solo ejemplo. Aquí combinas las pérdidas para formar el **costo**, que incluye todos los ejemplos.

Recuerda que para la regresión logística, la función de costo es de la forma:

$$ J(\mathbf{w},b) = \frac{1}{m} \sum_{i=0}^{m-1} \left[ loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) \right] \tag{1}$$

donde
* $loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)})$ es el costo para un solo punto de datos, que es:

    $$loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) = -y^{(i)} \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - y^{(i)}\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) \tag{2}$$
    
*  donde m es el número de ejemplos de entrenamiento en el conjunto de datos y:
$$
\begin{align}
  f_{\mathbf{w},b}(\mathbf{x^{(i)}}) &= g(z^{(i)})\tag{3} \\
  z^{(i)} &= \mathbf{w} \cdot \mathbf{x}^{(i)}+ b\tag{4} \\
  g(z^{(i)}) &= \frac{1}{1+e^{-z^{(i)}}}\tag{5} 
\end{align}
$$
 

In [None]:
x_train = np.array([0., 1, 2, 3, 4, 5],dtype=np.longdouble)
y_train = np.array([0,  0, 0, 1, 1, 1],dtype=np.longdouble)
plt_simple_example(x_train, y_train)

<a name='ex-02'></a>
#### Descripción del código

El algoritmo para `compute_cost_logistic` recorre todos los ejemplos calculando la pérdida para cada uno y acumulando el total.

Nota que las variables X e y no son valores escalares sino matrices de forma(shape) ($m, n$) y ($m$,) respectivamente, donde $n$ es el número de X características y $m$ es el número de ejemplos de entrenamiento.


In [None]:
plt.close('all')
plt_logistic_squared_error(x_train,y_train)
plt.show()

Verifica la implementación de la función de costo usando la siguiente celda.

**Salida esperada**: 0.3668667864055175

## Ejemplo
Ahora, veamos cuál es la salida de la función de costo para un valor diferente de $w$. 

* En un ejercicio anterior, graficaste la frontera de decisión para  $b = -3, w_0 = 1, w_1 = 1$. Es decir, tenías `b = -3, w = np.array([1,1])`.

* Supón que quieres ver si $b = -4, w_0 = 1, w_1 = 1$, o `b = -4, w = np.array([1,1])` proporciona un mejor modelo.

Primero graficaremos la frontera de decisión para estos dos valores diferentes de $b$ para ver cuál se ajusta mejor a los datos.

* Para $b = -3, w_0 = 1, w_1 = 1$, graficaremos $-3 + x_0+x_1 = 0$ (en azul)
* Para $b = -4, w_0 = 1, w_1 = 1$, graficaremos $-4 + x_0+x_1 = 0$ (en magenta)

In [None]:
plt_two_logistic_loss_curves()

Puedes ver en este gráfico que `b = -4, w = np.array([1,1])` es un peor modelo para los datos de entrenamiento. Veamos si la implementación de la función de costo refleja esto.

The loss function above can be rewritten to be easier to implement.
    $$loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) = (-y^{(i)} \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - y^{(i)}\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right)$$
  
This is a rather formidable-looking equation. It is less daunting when you consider $y^{(i)}$ can have only two values, 0 and 1. One can then consider the equation in two pieces:  
when $ y^{(i)} = 0$, the left-hand term is eliminated:
$$
\begin{align}
loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), 0) &= (-(0) \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - 0\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) \\
&= -\log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right)
\end{align}
$$
and when $ y^{(i)} = 1$, the right-hand term is eliminated:
$$
\begin{align}
  loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), 1) &=  (-(1) \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - 1\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right)\\
  &=  -\log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right)
\end{align}
$$

OK, with this new logistic loss function, a cost function can be produced that incorporates the loss from all the examples. This will be the topic of the next lab. For now, let's take a look at the cost vs parameters curve for the simple example we considered above:

In [None]:
plt.close('all')
cst = plt_logistic_cost(x_train,y_train)

**Salida esperada**

Costo para b = -3 :  0.3668667864055175

Costo para b = -4 :  0.5036808636748461


Puedes ver que la función de costo se comporta como se espera y el costo para `b = -4, w = np.array([1,1])` es efectivamente mayor que el costo para `b = -3, w = np.array([1,1])`

## ¡Felicitaciones!
En este ejercicio examinaste y utilizaste la función de costo para regresión logística.