# Cours de mathématiques : Régression linéaire, Logistique, Classification logistique et Descente de gradient

## Régression linéaire

La régression linéaire est une méthode d'analyse statistique permettant de modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes. Elle est utilisée pour prédire la valeur de la variable dépendante en fonction des valeurs des variables indépendantes. La formule de la régression linéaire est donnée par :

$$y = \beta_0 + \beta_1x_1 + \beta_2x_2 + ... + \beta_nx_n + \epsilon$$

où :

- $y$ est la variable dépendante,
- $x_1$, $x_2$, ..., $x_n$ sont les variables indépendantes,
- $\beta_0$, $\beta_1$, $\beta_2$, ..., $\beta_n$ sont les coefficients de régression,
- $\epsilon$ est l'erreur résiduelle.

## Régression logistique

La régression logistique est une méthode statistique utilisée pour prédire une variable binaire (0 ou 1) en fonction des valeurs des variables indépendantes. La fonction de régression logistique est donnée par :

$$P(Y=1|X) = \frac{1}{1+e^{-(\beta_0+\beta_1x_1+\beta_2x_2+...+\beta_nx_n)}}$$

où :

- $P(Y=1|X)$ est la probabilité que la variable dépendante $Y$ prenne la valeur 1 compte tenu des valeurs des variables indépendantes $X$,
- $x_1$, $x_2$, ..., $x_n$ sont les variables indépendantes,
- $\beta_0$, $\beta_1$, $\beta_2$, ..., $\beta_n$ sont les coefficients de régression.

## Classification logistique

La classification logistique est similaire à la régression logistique, mais elle est utilisée pour prédire une variable catégorique plutôt que binaire. La fonction de classification logistique est donnée par :

$$P(Y=k|X) = \frac{e^{\beta_k+\beta_1x_1+\beta_2x_2+...+\beta_nx_n}}{\sum_{i=1}^{K} e^{\beta_i+\beta_1x_1+\beta_2x_2+...+\beta_nx_n}}$$

où :

- $P(Y=k|X)$ est la probabilité que la variable dépendante $Y$ prenne la valeur $k$ compte tenu des valeurs des variables indépendantes $X$,
- $x_1$, $x_2$, ..., $x_n$ sont les variables indépendantes,
- $\beta_k$, $\beta_1$, $\beta_2$, ..., $\beta_n$ sont les coefficients de régression,
- $K$ est le nombre de catégories pour la variable dépendante.

## Descente de gradient

La descente de gradient est une méthode d'optimisation utilisée pour trouver les valeurs des coefficients de régression qui minimisent l'erreur dans le modèle de régression. Elle fonctionne en ajustant les coefficients de régression de manière itérative jusqu'à ce qu'une valeur minimale de l'erreur soit atteinte. La formule de la descente de gradient est donnée par :

$$\beta_j = \beta_j - \alpha \frac{\partial}{\partial\beta_j} J(\beta)$$

où :

- $\beta_j$ est le coefficient de régression j,
- $\alpha$ est le taux d'apprentissage,
- $J(\beta)$ est la fonction de coût.

La fonction de coût est donnée par :

$$J(\beta) = \frac{1}{2m} \sum_{i=1}^{m} (h_{\beta}(x^{(i)})-y^{(i)})^2$$

où :

- $h_{\beta}(x^{(i)})$ est la prédiction du modèle pour l'observation $i$,
- $y^{(i)}$ est la valeur réelle de la variable dépendante pour l'observation $i$,
- $m$ est le nombre total d'observations dans l'ensemble de données.