In [None]:
import ocvx

import numpy as np
import matplotlib.pyplot as plt

## Partie 1: Méthode de Newton

Avant de commencer à étudier la méthode de Newton, générons des problèmes d'optimisation convexe sans contraintes.

In [None]:
unconstrained = ocvx.getUnconstrainedProblems()

La méthode de Newton est une méthode permettant de résoudre des problèmes d'optimisation convexe. Sa principale différence par rapport à la descente de gradient est l'utilisation de la héssienne de la fonction objectif. Cela fait de la méthode de Newton une méthode de second ordre. Son fonctionnement ayant déjà été expliqué en cours, nous ne la décririons pas dans cette partie.

In [None]:
for i in range(unconstrained.shape[0]):
    print("Problem", i, ":", unconstrained.iloc[i]["name"], "with constant")
    P = unconstrained.iloc[i]["probleme"]
    if P.f.dim == 1:
        x0 = np.array([10])
    else:
        x0 = np.array([15, 20])
    meth = ocvx.Newton(P, ocvx.constant)
    print("x* =", meth(x0))
    print("Nombre d'itération:", meth.save.shape[0])
    meth.plot()
    
    print("Problem", i, ":", unconstrained.iloc[i]["name"], "with backtracking")
    meth = ocvx.Newton(P, ocvx.backtracking)
    print("x* =", meth(x0))
    print("Nombre d'itération:", meth.save.shape[0])
    meth.plot()

Sur les graphiques ci-dessus, les points rouges représentent les points à chaque itération de l'algorithme. Pour les fonction en deux dimensions, nous avons choisi de les représenter sous la forme de lignes de niveau. Plus la couleur de la courbe est sombre, plus la valeur de la fonction objectif est petite.

La première observation que l'on peut faire est que la méthode de Newton avec une valeur de pas constant (dans notre cas fixé empiriquement à une valeur de 0.01) est beaucoup plus lente qu'avec une valeur de pas calculée à chaque itération de notre algorithme à l'aide du **backtracking**.

Comparons maintenant la descente de gradient (classique) à la méthode de Newton.

In [None]:
for i in range(unconstrained.shape[0]):
    print("Problem", i, ":", unconstrained.iloc[i]["name"], "with constant")
    P = unconstrained.iloc[i]["probleme"]
    if P.f.dim == 1:
        x0 = np.array([10])
    else:
        x0 = np.array([15, 20])
    meth = ocvx.GradientDescent(P, ocvx.constant)
    print("x* =", meth(x0))
    print("Nombre d'itération:", meth.save.shape[0])
    meth.plot()
    
    print("Problem", i, ":", unconstrained.iloc[i]["name"], "with backtracking")
    meth = ocvx.GradientDescent(P, ocvx.backtracking)
    print("x* =", meth(x0))
    print("Nombre d'itération:", meth.save.shape[0])
    meth.plot()

La méthode de Newton et la descente de gradient présente plusieurs différences plusieurs différences. Premièrement, la descente de gradient avec un pas constant prend moins d'itérations pour minimiser la fonction objectif. Cela est surement dû au fait que la descente de gradient est une méthode de premier ordre qui dépend du gradient alors que la méthode de Newton dépend de la Hessienne.

Ensuite, on observe que la descente de gradient utilisant le backtracking pour le calcul du pas va parfois trop loin et donc nécéssite de retourner en arrière pour minimiser la fonction objectif. On a donc plus d'itération pour la descente de gradient que pour la méthode de Newton en utilisant le backtracking.