# Ejercicio: Función de Costo para Regresión Logística

## Objetivos
En este ejercicio, vas a:
- examinar la implementación y utilizar la función de costo para regresión logística.

In [None]:
import numpy as np
#%matplotlib widget
import matplotlib.pyplot as plt
from lab_utils_common import  plot_data, sigmoid, dlc
plt.style.use('./deeplearning.mplstyle')

## Conjunto de datos
Comencemos con el mismo conjunto de datos que se usó en el ejercicio de frontera de decisión.

In [None]:
X_train = np.array([[0.5, 1.5], [1,1], [1.5, 0.5], [3, 0.5], [2, 2], [1, 2.5]])  #(m,n)
y_train = np.array([0, 0, 0, 1, 1, 1])                                           #(m,)

Usaremos una función auxiliar para graficar estos datos. Los puntos de datos con etiqueta $y=1$ se muestran como cruces rojas, mientras que los puntos con $y=0$ se muestran como círculos azules.

In [None]:
fig,ax = plt.subplots(1,1,figsize=(4,4))
plot_data(X_train, y_train, ax)

# Set both axes to be from 0-4
ax.axis([0, 4, 0, 3.5])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.show()

## Función de costo

En un ejercicio anterior, desarrollaste la función de *pérdida logística*. Recuerda, la pérdida se define para un solo ejemplo. Aquí combinas las pérdidas para formar el **costo**, que incluye todos los ejemplos.

Recuerda que para la regresión logística, la función de costo es de la forma:

$$ J(\mathbf{w},b) = \frac{1}{m} \sum_{i=0}^{m-1} \left[ loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) \right] \tag{1}$$

donde
* $loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)})$ es el costo para un solo punto de datos, que es:

    $$loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) = -y^{(i)} \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - y^{(i)}\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) \tag{2}$$
    
*  donde m es el número de ejemplos de entrenamiento en el conjunto de datos y:
$$
\begin{align}
  f_{\mathbf{w},b}(\mathbf{x^{(i)}}) &= g(z^{(i)})\tag{3} \\
  z^{(i)} &= \mathbf{w} \cdot \mathbf{x}^{(i)}+ b\tag{4} \\
  g(z^{(i)}) &= \frac{1}{1+e^{-z^{(i)}}}\tag{5} 
\end{align}
$$
 

<a name='ex-02'></a>
#### Descripción del código

El algoritmo para `compute_cost_logistic` recorre todos los ejemplos calculando la pérdida para cada uno y acumulando el total.

Nota que las variables X e y no son valores escalares sino matrices de forma(shape) ($m, n$) y ($m$,) respectivamente, donde $n$ es el número de X características y $m$ es el número de ejemplos de entrenamiento.


In [None]:
def compute_cost_logistic(X, y, w, b):
    """
    Calcula costo

    Args:
      X (ndarray (m,n)): Datos, m ejemplos con n características
      y (ndarray (m,)) : valores objetivo
      w (ndarray (n,)) : parametros del modelo  
      b (scalar)       : parametro del modelo
      
    Returns:
      costo (scalar): costo
    """

    m = X.shape[0]
    cost = 0.0
    for i in range(m):
        z_i = np.dot(X[i],w) + b
        f_wb_i = sigmoid(z_i)
        cost +=  -y[i]*np.log(f_wb_i) - (1-y[i])*np.log(1-f_wb_i)
             
    cost = cost / m
    return cost


Verifica la implementación de la función de costo usando la siguiente celda.

In [None]:
w_tmp = np.array([1,1])
b_tmp = -3
print(compute_cost_logistic(X_train, y_train, w_tmp, b_tmp))

**Salida esperada**: 0.3668667864055175

## Ejemplo
Ahora, veamos cuál es la salida de la función de costo para un valor diferente de $w$. 

* En un ejercicio anterior, graficaste la frontera de decisión para  $b = -3, w_0 = 1, w_1 = 1$. Es decir, tenías `b = -3, w = np.array([1,1])`.

* Supón que quieres ver si $b = -4, w_0 = 1, w_1 = 1$, o `b = -4, w = np.array([1,1])` proporciona un mejor modelo.

Primero graficaremos la frontera de decisión para estos dos valores diferentes de $b$ para ver cuál se ajusta mejor a los datos.

* Para $b = -3, w_0 = 1, w_1 = 1$, graficaremos $-3 + x_0+x_1 = 0$ (en azul)
* Para $b = -4, w_0 = 1, w_1 = 1$, graficaremos $-4 + x_0+x_1 = 0$ (en magenta)

In [None]:
import matplotlib.pyplot as plt

# Choose values between 0 and 6
x0 = np.arange(0,6)

# Plot the two decision boundaries
x1 = 3 - x0
x1_other = 4 - x0

fig,ax = plt.subplots(1, 1, figsize=(4,4))
# Plot the decision boundary
ax.plot(x0,x1, c=dlc["dlblue"], label="$b$=-3")
ax.plot(x0,x1_other, c=dlc["dlmagenta"], label="$b$=-4")
ax.axis([0, 4, 0, 4])

# Plot the original data
plot_data(X_train,y_train,ax)
ax.axis([0, 4, 0, 4])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.legend(loc="upper right")
plt.title("Frontera de Decisión")
plt.show()

Puedes ver en este gráfico que `b = -4, w = np.array([1,1])` es un peor modelo para los datos de entrenamiento. Veamos si la implementación de la función de costo refleja esto.

In [None]:
w_array1 = np.array([1,1])
b_1 = -3
w_array2 = np.array([1,1])
b_2 = -4

print("Costo para b = -3 : ", compute_cost_logistic(X_train, y_train, w_array1, b_1))
print("Costo para b = -4 : ", compute_cost_logistic(X_train, y_train, w_array2, b_2))

**Salida esperada**

Costo para b = -3 :  0.3668667864055175

Costo para b = -4 :  0.5036808636748461


Puedes ver que la función de costo se comporta como se espera y el costo para `b = -4, w = np.array([1,1])` es efectivamente mayor que el costo para `b = -3, w = np.array([1,1])`

## ¡Felicitaciones!
En este ejercicio examinaste y utilizaste la función de costo para regresión logística.