# Régression logistique

Dans ce TP, vous allez :
- explorer la fonction sigmoïde (également connue sous le nom de fonction logistique)
- explorer la régression logistique ; qui utilise la fonction sigmoïde

In [None]:
import numpy as np
#%matplotlib widget
import matplotlib.pyplot as plt
from plt_one_addpt_onclick import plt_one_addpt_onclick
from lab_utils_common import draw_vthresh
plt.style.use('./deeplearning.mplstyle')

## Fonction sigmoïde (logistique)
Comme vu dans de cours, pour une tâche de classification, nous pouvons commencer par utiliser notre modèle de régression linéaire, $f_{\mathbf{w},b}(\mathbf{x}^{(i)}) = \mathbf{w} \cdot  \mathbf{x}^{(i)} + b$, pour prédire $y$ étant donné $x$. 
- Cependant, nous aimerions que les prédictions de notre modèle de classification soient entre 0 et 1 puisque notre variable de sortie $y$ est soit 0, soit 1. 
- Cela peut être accompli en utilisant une "fonction sigmoïde" qui mappe toutes les valeurs d'entrée à des valeurs entre 0 et 1. 


Implémentons la fonction sigmoïde et voyons ça par nous-mêmes.

## Formule de la fonction sigmoïde

La formule d'une fonction sigmoïde est la suivante -  

$$g(z) = \frac{1}{1+e^{-z}}\tag{1}$$

Dans le cas de la régression logistique, z (l'entrée de la fonction sigmoïde), est la sortie d'un modèle de régression linéaire. 
- Dans le cas d'un seul exemple, $z$ est un scalaire.
- dans le cas de plusieurs exemples, $z$ peut être un vecteur composé de $m$ valeurs, une pour chaque exemple. 
- L'implémentation de la fonction sigmoïde devrait couvrir ces deux formats d'entrée potentiels.

NumPy a une fonction appelée [`exp()`](https://numpy.org/doc/stable/reference/generated/numpy.exp.html), qui offre un moyen pratique de calculer l'exponentielle ( $e^{z}$) de tous les éléments dans le tableau d'entrée (`z`).
 
Elle fonctionne également avec un seul nombre en entrée, comme le montre l'exemple ci-dessous.

In [None]:
# L'entrée est un tableau.
input_array = np.array([1,2,3])
exp_array = np.exp(input_array)

print("Entrée pour exp:", input_array)
print("Sortie de exp:", exp_array)

# L'entrée est un seul nombre
input_val = 1  
exp_val = np.exp(input_val)

print("Entrée pour exp:", input_val)
print("Sortie de exp:", exp_val)

Définissez la fonction `sigmoid` en python dans la cellule ci-dessous.

In [None]:
def sigmoid(z):
    """
    Calcule la sigmoïde de z

    Args:
        z (ndarray): Un scalaire, un tableau numpy de n'importe quelle taille.

    Returns:
        g (ndarray): sigmoid(z), de la même forme que z
         
    """
    #utilisez numpy pour définir le nombre d'Euler e

    return g

Voyons ce que cette fonction renvoie pour différentes valeurs de `z`.

In [None]:
# Générer un tableau de valeurs régulièrement espacées entre -10 et 10
z_tmp = np.arange(-10,11)

# Utiliser la fonction implémentée ci-dessus pour obtenir les valeurs de la sigmoïde
y = sigmoid(z_tmp)

# Code pour afficher les deux tableaux côte à côte
np.set_printoptions(precision=3) 
print("Entrée (z), Sortie (sigmoid(z))")
print(np.c_[z_tmp, y])

Si votre implémentation est correcte, alors vous devriez voir
Entrée (z), Sortie (sigmoid(z))

[[-1.000e+01  4.540e-05]

 [-9.000e+00  1.234e-04]

[-8.000e+00  3.354e-04]

[-7.000e+00  9.111e-04]

[-6.000e+00  2.473e-03]

[-5.000e+00  6.693e-03]

[-4.000e+00  1.799e-02]

[-3.000e+00  4.743e-02]

[-2.000e+00  1.192e-01]

[-1.000e+00  2.689e-01]

[ 0.000e+00  5.000e-01]

[ 1.000e+00  7.311e-01]

[ 2.000e+00  8.808e-01]

[ 3.000e+00  9.526e-01]

[ 4.000e+00  9.820e-01]

[ 5.000e+00  9.933e-01]

[ 6.000e+00  9.975e-01]

[ 7.000e+00  9.991e-01]

[ 8.000e+00  9.997e-01]

[ 9.000e+00  9.999e-01]

[ 1.000e+01  1.000e+00]]

Les valeurs dans la colonne de gauche sont `z`, et les valeurs dans la colonne de droite sont `sigmoid(z)`. Comme vous pouvez le voir, les valeurs d'entrée de la sigmoïde varient de -10 à 10, et les valeurs de sortie varient de 0 à 1. 

Maintenant, essayons de tracer cette fonction en utilisant la bibliothèque `matplotlib`.

In [None]:
# Plot z vs sigmoid(z)
fig,ax = plt.subplots(1,1,figsize=(5,3))
ax.plot(z_tmp, y, c="b")

ax.set_title("Fonction Sigmoïde")
ax.set_ylabel('sigmoid(z)')
ax.set_xlabel('z')
draw_vthresh(ax,0)

Comme vous pouvez le voir, la fonction sigmoïde tend vers `0` lorsque `z` tend vers des valeurs très négatives  et tend vers `1` lorsque `z` tend vers des valeurs très positives

## Régression logistique
<img align="left" src="./images/C1_W3_LogisticRegression_right.png"     style=" width:300px; padding: 10px;">
Un modèle de régression logistique applique la sigmoïde au modèle de régression linéaire comme montré ci-dessous :

$$ f_{\mathbf{w},b}(\mathbf{x}^{(i)}) = g(\mathbf{w} \cdot \mathbf{x}^{(i)} + b ) \tag{2} $$ 

  où

$$g(z) = \frac{1}{1+e^{-z}}\tag{3}$$


Appliquons la régression logistique à l'exemple de classification des tumeurs (moins joyeux que les prix immobiliers, je l'accorde...).  
Tout d'abord, chargeons les exemples et les valeurs initiales pour les paramètres.

In [None]:
x_train = np.array([0., 1, 2, 3, 4, 5])
y_train = np.array([0,  0, 0, 1, 1, 1])

w_in = np.zeros((1))
b_in = 0

Essayez les étapes suivantes :
- Cliquez sur 'Exécuter la régression logistique' pour trouver le meilleur modèle de régression logistique pour les données d'entraînement données
    - Notez que le modèle résultant correspond assez bien aux données.
    - Notez que la ligne orange est '$z$' ou $\mathbf{w} \cdot \mathbf{x}^{(i)} + b$ ci-dessus. Elle ne correspond pas à la ligne dans un modèle de régression linéaire.
Améliorez encore ces résultats en appliquant un *seuil*. 
- Cochez la case 'Basculer le seuil 0.5' pour montrer les prédictions si un seuil est appliqué.
    - Ces prédictions semblent bonnes. Les prédictions correspondent aux données
    - Maintenant, ajoutez d'autres points de données dans la plage de grande taille de tumeur (proche de 10), et relancez la régression logistique.
    - contrairement au modèle de régression linéaire, ce modèle continue de faire des prédictions correctes.

In [None]:
plt.close('all') 
addpt = plt_one_addpt_onclick( x_train,y_train, w_in, b_in, logistic=True)