# TP4 - Descente de gradient en 1 variable

In [None]:
# Chargement des bibliothèques Python

# Mathématiques 
import numpy as np

# Graphique
from matplotlib import pyplot as plt

print('Bibliothèques chargées')

## Problème A

On cherche le minimum sur $\mathbb{R}$ de la fonction $f(d)=d^2-6d+1$.

**Exercice**

Résoudre le problème par un calcul exact.

Réponse : $f$ atteint son minimum en $d
^*=...$

Dans la suite, on va illustrer le fonctionnement de l'algorithme de descente de gradient afin de résoudre le problème A de manière approchée.

**Rappels de cours**

En une dimension, l'algorithme de gradient construit une séquence *décroissante* $f(d_0)$, $f(d_1)$, ..., en sorte de s'approcher d'un minimum au moins local de $f$.

L'algorithme fonctionne ainsi :
- Choisir un facteur $\tau$ et une valeur initiale $d_0$.
- Tant que $f'(d_i)$ n'est pas suffisamment proche de zéro :
 - Définir $d_{i+1}=d_i-\tau\times f'(d_i)$
 - Calculer $f'(d_{i+1})$

**Exercice**

Calculer, pour la fonction $f$ du Problème A les valeurs $d_1$ et $d_2$ de l'algorithme de descente de gradient initialisé à $d_0=0.5$, avec un facteur $\tau=0.8$.

Réponses :

Pour tout $d$, on a $f'(d)=$....

On en déduit :
- $f'(d_0)=$ ... , et donc $d_1=$ ....
- $f'(d_1)=$ ..., et donc $d_2=$ ...

## Programmation de l'algorithme de descente de gradient

### Définition de la fonction et de sa dérivée

Compléter le code suivant avec la fonction et sa dérivée (attention : x^2 en python s'écrit `x**2`)

In [None]:
# Fonction à optimiser
def f(d):           
    return ...

# fonction dérivée
def gf(d):          
    return ...

print('Fonctions f et f\' définies')

### Représentation graphique de $f$

In [None]:
# Tableau de valeurs de f
dvaleurs=np.linspace(-1,6,50) # 5à valeurs régulièrement espacées entre -1 et 6 (compris)
fvaleurs=[f(d) for d in dvaleurs]
# Graphique
plt.axis([-1,6,-10,5]) #xmin,xmax,ymin,ymax
plt.plot(dvaleurs,fvaleurs)
plt.show()

### Algorithme de descente de gradient

In [None]:
def descente(d0,tau,tolerance,NbIterationsMax):
    diverge=False
    d=d0
    # Pour la visualisation graphique de l'algorithme
    # on va stocker les valeurs de d dans la liste L
    L=[] 
    for i in range(NbIterationsMax):
        try: # traitement des erreurs (voir plus bas)
            g = gf(d) # Calcul de la dérivée en d
            if abs(g)< tolerance: # abs renvoie la valeur absolue
                print('L\'algorithme a convergé en',i,'itérations.')
                print('Solution atteinte : d=',d)
                print('Dérivée en d:',g)
                return L
            L.append(d) # on ajoute la valeur de d à la liste L
            d=d-tau*g # on affecte à d la nouvelle valeur d-tau*g
        # Si l'algorithme diverge, les valeurs atteintes peuvent être trop grandes pour Python
        except OverflowError as err: # traitement de l'erreur "overflow" 
            print('L\'algorithme a divergé.')
            print('Valeur atteinte : d=',d)
            print('Dérivée en d :',g)
            diverge=True
            break
    if (diverge==False):
        print('L\'algorithme n\'a pas convergé en au plus',NbIterationsMax)
        print('Valeur atteinte: d=',d)
        print('Dérivée en d :',g)
    return L

**Exercice**

Décrire le rôle de chacun des paramètres de la fonction `descente(x0,tau,tolerance,nbiterations)` définie ci-dessus :

Réponses :

- d0 : ...
- tau : ...
- tolerance : ...
- nbiterations : ...

### Recherche de la solution
Dans le code ci-dessous, on lance l'algorithme, puis on affiche la séquence $(d_i)$ (égale à $d_0$, $d_1$, $d_2$, ...) calculée par l'algorithme, et enfin on affiche le chemin de l'algorithme sur la courbe de $f$.

In [None]:
# Lancement de l'algorithme et récupération des points d_i d0, d1, ... dans la liste D
di=descente(0.5,0.8,1e-5,1000)

# Affichage des di
print('Liste des valeurs calculées :')
print(di)

# Représentation graphique
plt.axis([-2,6,-10,5]) #xmin,xmax,ymin,ymax
plt.plot(dvaleurs,fvaleurs) # Courbe de f

# Représentation des segments reliant les points
# (d_i,f(d_i)) et (d_(i+1),f(d_(i+1)))
plt.plot(di,[f(d) for d in di],'o--')

plt.show()

**Exercice**

À l'aide de la cellule ci-dessus, et en initialisant à $d_0=0.5$, déterminer par tâtonnement ou par le calcul un facteur $\tau$ tel que le comportement de l'algorithme vérifie la propriété suivante.

1. La séquence $d_0$, $d_1$, ... est croissante pour $\tau$= ...
2. L'algorithme diverge pour $\tau=$ ...
3. L'algorithme cycle pour $\tau$= ...
4. L'algorithme converge en 1 itération (facteur optimal) pour $\tau=$ ...

# Problème B

Compléter par copier coller les cellules suivantes afin de déterminer $d_0$ et $\tau$ et de représenter les étapes de l'algorithme appliqué à la fonction $$f(d)=d^4-7d^3+14d^2-8d,$$
en sorte que l'algorithme converge en au plus 10 itérations :
1. vers le minimum local ;
2. vers le minimum global ;
3. si possible, vers le minimum global mais en partant du << bassin >> associé au minimum local ;
4. si possible, vers le minimum local en partant du << bassin >> associé au minimum local.

In [None]:
# Définitions préliminaires 
# (f, f', dvaleurs, fvaleurs et représentation graphique : attention à bien choisir la fenêtre)


In [None]:
# Convergence vers le minimum local


In [None]:
# Convergence vers le minimum global


In [None]:
# Convergence vers le minimum local en partant du bassin du minimum global


In [None]:
# Convergence vers le minimum local en partant du bassin du minimum local
