# Régression logistique

Un petit rappel en vu des réseaux de neurones.

## Principe de la régression logistique

La régression logistique consiste, comme son nom l'indique, à appliquer la fonction logistique (aussi appeler sigmoïde) à une régression
$$f_{logistique} : x \rightarrow \frac{1}{1 + e^-x}$$

Donc :  
$$y = \frac{1}{1 + e^{-\theta^\intercal X}}$$

La fonction logistique possède deux caractéristiques intéressantes : elle prend des valeurs dans ]0, 1[ et elle est simple.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# evenly sampled time at 200ms intervals
x = np.arange(-5, 5, 0.2)

# red dashes, blue squares and green triangles
plt.plot(x, 1/(1 + np.exp(-x)))
plt.show()

L'intérêt pour prédire des valeurs binaires (vrai / faux) est évident car cela permet de prédire ces valeurs sans effets de saturation.

## Exemples : régression linéaire vs logistique

In [None]:
import numpy as np
import matplotlib.pyplot as plt

import sklearn.linear_model
import sklearn.metrics

np.random.seed(0)

x = np.sort(10 * np.random.random(1000) - 5)
y = x > 0
x = x.reshape(-1, 1)

reg_lineaire = sklearn.linear_model.LinearRegression().fit(x, y)
print(f"R2 regression lineaire : {reg_lineaire.score(x, y):.4f}")

reg_logistique = sklearn.linear_model.LogisticRegression(penalty='none').fit(x, y)
log_predict = reg_logistique.predict_proba(x)[:,1]
print(f"R2 regression logistique : {sklearn.metrics.r2_score(log_predict, y):.4f}")

Sur un modèle simplissime comme celui-ci, on voit que la régression linéaire ne s'en sort pas très bien, la régression logistique beaucoup mieux

In [None]:
plt.plot(x, reg_lineaire.predict(x), 'r')
plt.plot(x, reg_logistique.predict_proba(x)[:,1], 'b')
plt.plot(x, y, 'go')
plt.show()

Et avec un peu de bruit, qu'est ce que cela donne ?

In [None]:
import numpy as np
import matplotlib.pyplot as plt

import sklearn.linear_model

x = 2 * np.sort(np.random.random(100) - 0.5)
y = x + np.random.normal(loc = 0, scale = 0.05, size = 100) > 0
x = x.reshape(-1, 1)

reg_lineaire = sklearn.linear_model.LinearRegression().fit(x, y)
print(f"R2 regression lineaire : {reg_lineaire.score(x, y):.4f}")

reg_logistique = sklearn.linear_model.LogisticRegression(penalty='none').fit(x, y)
log_predict = reg_logistique.predict_proba(x)[:,1]
print(f"R2 regression logistique : {sklearn.metrics.r2_score(log_predict, y):.4f}")

In [None]:
plt.plot(x, reg_lineaire.predict(x), 'r')
plt.plot(x, reg_logistique.predict_proba(x)[:,1], 'b')
plt.plot(x, y, 'go')
plt.show()

In [None]:
x[50:52]

In [None]:
reg_logistique.predict(x[50:52])

In [None]:
reg_logistique.predict_proba(x[50:52])

In [None]:
reg_logistique.predict_log_proba(x[50:52])

## Comparaison réseaux de neurones

Faisons notre régression logistique avec un réseau de neurone (logistique parce que activation = 'sigmoid')

In [None]:
x = 2 * np.sort(np.random.random(100) - 0.5)
y = x + np.random.normal(loc = 0, scale = 0.05, size = 100) > 0

In [None]:
import tensorflow as tf

regression_logistique = tf.keras.Sequential([tf.keras.layers.Dense(1, activation = 'sigmoid')])
regression_logistique.compile(loss='binary_crossentropy', optimizer = tf.keras.optimizers.SGD(learning_rate=0.1, momentum=0.9))
regression_logistique.fit(x, y, epochs = 200, verbose=0)
regression_logistique.fit(x, y, epochs = 1)

In [None]:
plt.plot(x, regression_logistique.predict(x), 'r')
plt.plot(x, y, 'go')
plt.show()

Et mintenant, obtenons la même chose avec une régression linéaire

In [None]:
import tensorflow as tf

regression_lineaire = tf.keras.Sequential([tf.keras.layers.Dense(1)])
regression_lineaire.compile(loss=tf.keras.losses.BinaryCrossentropy(from_logits=True), optimizer = tf.keras.optimizers.SGD(learning_rate=0.1, momentum=0.9))
regression_lineaire.fit(x, y, epochs = 200, verbose=0)
regression_lineaire.fit(x, y, epochs = 1)

In [None]:
plt.plot(x, regression_lineaire.predict(x), 'r')
plt.plot(x, y, 'go')
plt.show()

Ce qui est produit ici est ce qui s'appelle un score, plus c'est élevé, plus il y a de chances que cela soit vrai