# Fonction de co√ªt pour la r√©gression logistique

## Objectifs
Dans ce TP, vous allez :
- √âtudier l'impl√©mentation et utiliser la fonction de co√ªt pour la r√©gression logistique.

In [None]:
import numpy as np
%matplotlib widget
import matplotlib.pyplot as plt
from lab_utils_common import  plot_data, sigmoid, dlc
plt.style.use('./deeplearning.mplstyle')

## Ensemble de donn√©es 
Commen√ßons avec le m√™me ensemble de donn√©es que celui utilis√© dans le TP d√©di√© √† la fronti√®re de d√©cision.

In [None]:
X_train = np.array([[0.5, 1.5], [1,1], [1.5, 0.5], [3, 0.5], [2, 2], [1, 2.5]])  #(m,n)
y_train = np.array([0, 0, 0, 1, 1, 1])                                           #(m,)

Nous utiliserons une fonction d√©j√† impl√©ment√©e pour tracer ces donn√©es. Les points de donn√©es avec l'√©tiquette $y=1$ sont repr√©sent√©s par des croix rouges, tandis que les points de donn√©es avec l'√©tiquette $y=0$ sont repr√©sent√©s par des cercles bleus.

In [None]:
fig,ax = plt.subplots(1,1,figsize=(4,4))
plot_data(X_train, y_train, ax)

# On fixe les deux axes entre 0 et 4
ax.axis([0, 4, 0, 3.5])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.show()

## Fonction de co√ªt

Dans un TP pr√©c√©dent, vous avez d√©velopp√© la fonction de *perte logistique (logistic loss)*. Rappelez-vous, la perte est d√©finie pour s'appliquer √† un seul exemple. Ici, vous combinez les pertes pour former le **co√ªt**, qui inclut tous les exemples.

Rappelez-vous que pour la r√©gression logistique, la fonction de co√ªt est de la forme 

$$ J(\mathbf{w},b) = \frac{1}{m} \sum_{i=0}^{m-1} \left[ loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) \right] \tag{1}$$

o√π
* $loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)})$ est le co√ªt pour un seul point de donn√©es, qui est :

    $$loss(f_{\mathbf{w},b}(\mathbf{x}^{(i)}), y^{(i)}) = -y^{(i)} \log\left(f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) - \left( 1 - y^{(i)}\right) \log \left( 1 - f_{\mathbf{w},b}\left( \mathbf{x}^{(i)} \right) \right) \tag{2}$$
    
* o√π m est le nombre d'exemples d'entra√Ænement dans l'ensemble de donn√©es et :
$$
\begin{align}
  f_{\mathbf{w},b}(\mathbf{x^{(i)}}) &= g(z^{(i)})\tag{3} \\
  z^{(i)} &= \mathbf{w} \cdot \mathbf{x}^{(i)}+ b\tag{4} \\
  g(z^{(i)}) &= \frac{1}{1+e^{-z^{(i)}}}\tag{5} 
\end{align}
$$


#### Description du code

L'algorithme pour `compute_cost_logistic` it√®re sur tous les exemples en calculant la perte pour chaque exemple et en accumulant le total.

Notez que les variables X et y ne sont pas des valeurs scalaires mais des matrices de forme ($m, n$) et ($ùëö$,) respectivement, o√π  $ùëõ$ est le nombre de caract√©ristiques et $ùëö$ est le nombre d'exemples d'entra√Ænement.

In [None]:
def compute_cost_logistic(X, y, w, b):
    """
    Calcule le co√ªt

    Args:
      X (ndarray (m,n)): Donn√©es, m exemples avec n caract√©ristiques
      y (ndarray (m,)) : valeurs cibles
      w (ndarray (n,)) : param√®tres du mod√®le  
      b (scalaire)     : param√®tre du mod√®le
      
    Returns:
      co√ªt (scalaire): co√ªt
    """
    #d√©finir une variable pour le nombre d'√©chantillons

    #d√©finir le co√ªt total
    
    #utiliser une boucle for sur les √©chantillons
    # calculer le z(X) en utilisant le produit scalaire vectoris√© de numpy
    # calculer le fwb
    #calculer la fonction de co√ªt en utilisant la fonction log de numpy
    
    
    
    
    
    return cost


V√©rifiez l'impl√©mentation de la fonction de co√ªt en utilisant la cellule ci-dessous.

In [None]:
w_tmp = np.array([1,1])
b_tmp = -3
print(compute_cost_logistic(X_train, y_train, w_tmp, b_tmp))

**Expected output**: 0.3668667864055175

## Exemple
Maintenant, voyons ce que donne la fonction de co√ªt pour une valeur diff√©rente de $w$. 

* Dans un TP pr√©c√©dent, vous avez trac√© la fronti√®re de d√©cision pour  $b = -3, w_0 = 1, w_1 = 1$. C'est-√†-dire que vous aviez `b = -3, w = np.array([1,1])`.

* Disons que vous voulez voir si $b = -4, w_0 = 1, w_1 = 1$, ou `b = -4, w = np.array([1,1])` fournit un meilleur mod√®le.

Commen√ßons par tracer la fronti√®re de d√©cision pour ces deux diff√©rentes valeurs de $b$ pour voir laquelle s'adapte le mieux aux donn√©es.

* Pour $b = -3, w_0 = 1, w_1 = 1$, nous tracerons $-3 + x_0+x_1 = 0$ (repr√©sent√© en bleu)
* Pour $b = -4, w_0 = 1, w_1 = 1$, nous tracerons $-4 + x_0+x_1 = 0$ (repr√©sent√© en magenta)

In [None]:
import matplotlib.pyplot as plt


# On choisit des valeurs entre 0 et 6
x0 = np.arange(0,6)

# On affiche les deux fronti√®res de d√©cision
x1 = 3 - x0
x1_other = 4 - x0

fig,ax = plt.subplots(1, 1, figsize=(4,4))

#¬†On affiche la fronti√®re de d√©cision
ax.plot(x0,x1, c=dlc["dlblue"], label="$b$=-3")
ax.plot(x0,x1_other, c=dlc["dlmagenta"], label="$b$=-4")
ax.axis([0, 4, 0, 4])


# On affiche les donn√©es originales
plot_data(X_train,y_train,ax)
ax.axis([0, 4, 0, 4])
ax.set_ylabel('$x_1$', fontsize=12)
ax.set_xlabel('$x_0$', fontsize=12)
plt.legend(loc="upper right")
plt.title("Decision Boundary")
plt.show()

Vous pouvez voir sur ce graphique que `b = -4, w = np.array([1,1])` est un mod√®le moins bon pour les donn√©es d'entra√Ænement. Voyons si l'impl√©mentation de la fonction de co√ªt refl√®te cela.

In [None]:
w_array1 = np.array([1,1])
b_1 = -3
w_array2 = np.array([1,1])
b_2 = -4

print("Co√ªt pour b = -3 : ", compute_cost_logistic(X_train, y_train, w_array1, b_1))
print("Co√ªt pour b = -4 : ", compute_cost_logistic(X_train, y_train, w_array2, b_2))

**R√©sultat attendu**

Co√ªt pour b = -3 :  0.3668667864055175

Co√ªt pour b = -4 :  0.5036808636748461


Vous pouvez voir que la fonction de co√ªt se comporte comme pr√©vu et que le co√ªt pour `b = -4, w = np.array([1,1])` est en effet plus √©lev√© que le co√ªt pour `b = -3, w = np.array([1,1])`