In [1]:
import numpy as np
import time

In [2]:
def oracle_1(x,mode=2):
    if mode == 1:
        return x[0]**2 + x[1]**2 - 2*x[1]*x[0]
    if mode == 3:
        return np.array([-1,1])*2*(x[1]-x[0])
    if mode == 2:
        return x[0]**2 + x[1]**2 - 2*x[1]*x[0], np.array([-1,1])*2*(x[1]-x[0])

def oracle_2(x,mode=2):
    if mode == 1:
        return 10*(x[1]-x[0]**2)**2 + (1-x[0])**2
    if mode == 3:
        return np.array([-40*x[0]*(x[1]-x[0]**2) - 2 * (1 - x[0]), 20 * (x[1] - x[0]**2)])
    if mode == 2:
        return 10*(x[1]-x[0]**2)**2 + (1-x[0])**2, np.array([-40*x[0]*(x[1]-x[0]**2) - 2 * (1 - x[0]), 20 * (x[1] - x[0]**2)])

def oracle_3(x,mode=2):
    if mode == 1:
        return np.linalg.norm(x)
    if mode == 3:
        return x/np.linalg.norm(x)
    if mode == 2:
        return np.linalg.norm(x),x/np.linalg.norm(x)

In [3]:
def gradient_descent(x0, t, oracle, epsilon=1e-2, max_iter=1e6):
    '''effectue la descente de gradient vue en cours'''
    
    start = time.time()
    
    x_n = x0
    liste = [x0]
    iter = 1
    while np.linalg.norm(oracle(x_n,3)) > epsilon and iter < max_iter:
        iter +=1
        x_n_plus_1 = x_n - t*oracle(x_n,3)
        x_n = x_n_plus_1
        if iter % 15 == 0:
            liste.append(x_n)
        if np.linalg.norm(x_n)>10000:
            print(f"L'algorithme de descente de gradient a divergé au bout de {iter} itérations")
            print(f"norme dernier gradient:{np.linalg.norm(oracle(x_n,mode=3))}")
            break
    if iter == max_iter:
        print(f"L'algorithme de descente de gradient n'a pas convergé en moins de {iter} itérations")
        print(f"dernier gradient:{oracle(x_n,mode=3)}")
        print(f"norme dernier gradient:{np.linalg.norm(oracle(x_n,mode=3))}")
    else:
        print("L'algorithme de descente de gradient a convergé au bout de {} itérations".format(iter))
        print(f"solution optimale({x_n})")
        print(f"minimum : {oracle(x_n,mode=1)}")
        print(f"dernier gradient:{oracle(x_n,mode=3)}")
        
    end = time.time()
    print("Temps d'exécution :", round(end-start), "secondes")
    
    return x_n, liste

In [4]:
Listes = {}
t = 0.5
x,Listes[f"oracle 1, t={t}"] = gradient_descent(x0=np.array([1,-1]), t=t, oracle=oracle_1, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient n'a pas convergé en moins de 1000 itérations
dernier gradient:[-4.  4.]
norme dernier gradient:5.656854249492381
Temps d'exécution : 0 secondes


In [5]:
x,Listes[f"oracle 2, t={t}"] = gradient_descent(x0=np.array([1,-1]), t=0.5, oracle=oracle_2, epsilon=1e-2, max_iter=100)

L'algorithme de descente de gradient a divergé au bout de 3 itérations
norme dernier gradient:6.432128391102122e+19
L'algorithme de descente de gradient a convergé au bout de 3 itérations
solution optimale([1171561.   15039.])
minimum : 1.8839076718600384e+25
dernier gradient:[ 6.43212839e+19 -2.74511032e+13]
Temps d'exécution : 0 secondes


In [6]:
x,Listes[f"oracle 3, t={t}, n = 2"] = gradient_descent(x0=np.ones(2), t=0.5, oracle=oracle_3, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient n'a pas convergé en moins de 1000 itérations
dernier gradient:[-0.70710678 -0.70710678]
norme dernier gradient:1.0
Temps d'exécution : 0 secondes


In [7]:
x,Listes[f"oracle 3, t={t}, n = 10000"] = gradient_descent(x0=np.ones(10000), t=0.5, oracle=oracle_3, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient n'a pas convergé en moins de 1000 itérations
dernier gradient:[0.01 0.01 0.01 ... 0.01 0.01 0.01]
norme dernier gradient:1.000000000000006
Temps d'exécution : 0 secondes


In [8]:
t = 0.01
x,Listes[f"oracle 1, t={t}"] = gradient_descent(x0=np.array([1,-1]), t=t, oracle=oracle_1, epsilon=1e-2, max_iter=100)

L'algorithme de descente de gradient n'a pas convergé en moins de 100 itérations
dernier gradient:[ 0.070293 -0.070293]
norme dernier gradient:0.0994093101618774
Temps d'exécution : 0 secondes


In [9]:
x,Listes[f"oracle 2, t={t}"] = gradient_descent(x0=np.array([1,-1]), t=t, oracle=oracle_2, epsilon=1e-2, max_iter=100)

L'algorithme de descente de gradient n'a pas convergé en moins de 100 itérations
dernier gradient:[-0.23475691 -0.32628779]
norme dernier gradient:0.4019633444205609
Temps d'exécution : 0 secondes


In [10]:
x,Listes[f"oracle 3, t={t},n=2"] = gradient_descent(x0=np.ones(2), t=t, oracle=oracle_3, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient n'a pas convergé en moins de 1000 itérations
dernier gradient:[0.70710678 0.70710678]
norme dernier gradient:1.0
Temps d'exécution : 0 secondes


In [11]:
x,Listes[f"oracle 3, t={t},n=1000"] = gradient_descent(x0=np.ones(10000), t=t, oracle=oracle_3, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient n'a pas convergé en moins de 1000 itérations
dernier gradient:[0.01 0.01 0.01 ... 0.01 0.01 0.01]
norme dernier gradient:1.0000000000000075
Temps d'exécution : 0 secondes


In [12]:
import plotly.graph_objects as go

import pandas as pd

def visualisation(oracle,inf,sup,Array_points,title):
    N = 100

    A = np.zeros((N,N))
    Intervalle = np.linspace(inf,sup,N)

    for i,x in enumerate(Intervalle):
        for j, y in enumerate(Intervalle):
            A[i,j] = oracle(np.array([x,y]),1)
    # Read data from a csv

    fig = go.Figure(go.Surface(x=Intervalle, y=Intervalle, z=A))
    fig.update_traces(contours_z=dict(show=True, usecolormap=True,
                                    highlightcolor="limegreen", project_z=True))
    fig.add_trace(
        go.Scatter3d(
            x = Array_points[:,0],
            y = Array_points[:,1],
            z = np.apply_along_axis(lambda x:oracle(x,1) ,1,Array_points),
            mode="markers",
            marker=dict(
                size = 5,
                color="black"
            )
        )
    )

    fig.update_layout(title=title, autosize=False,
                    scene_camera_eye=dict(x=1.87, y=0.88, z=1),
                    margin=dict(l=65, r=50, b=65, t=90)
    )
    fig.show()

In [13]:
visualisation(oracle_1,-3,3,np.array(Listes["oracle 1, t=0.5"]),'Descente de gradient avec oracle 1, t = 0.5,x0=(-1,1)')

In [14]:
visualisation(oracle_1,-2.5,2.5,np.array(Listes["oracle 1, t=0.01"]),'Descente de gradient avec oracle 1, t = 0.01,x0=(-1,1)')

In [15]:
visualisation(oracle_2,-2,2,np.array(Listes["oracle 2, t=0.01"]),'Descente de gradient avec oracle 2, t = 0.01,x0=(-1,1)')

In [16]:
visualisation(oracle_3,-2,2,np.array(Listes["oracle 3, t=0.01,n=2"]),'Descente de gradient avec oracle 3, n=2, t = 0.01,x0=(-1,1)')

In [17]:
def Armijo(x_k,d_k,f_x_k,scalar_product,oracle,theta=0.2,m_1=0.001):
    p = 0
    t = 1
    while (oracle(x_k + t*d_k, mode = 1) > f_x_k + m_1 * t * scalar_product)&(p<50):
        t = theta * t
        p += 1
    return t


In [18]:
def gradient_descent_Armijo(x0, oracle, epsilon=1e-2, max_iter=1e6):
    '''effectue la descente de gradient vue en cours'''
    
    start = time.time()
    
    x_n = x0
    liste = [x0]
    iter = 1
    while np.linalg.norm(oracle(x_n,3)) > epsilon and iter < max_iter:
        iter +=1
        t = Armijo(x_n,-oracle(x_n,3),oracle(x_n,1),np.dot(oracle(x_n,3),oracle(x_n,3)),oracle)
        x_n_plus_1 = x_n - t*oracle(x_n,3)
        x_n = x_n_plus_1
        liste.append(x_n)
        if np.linalg.norm(x_n)>10000:
            print(f"L'algorithme de descente de gradient avec Armijo a divergé au bout de {iter} itérations")
            print(f"norme dernier gradient:{np.linalg.norm(oracle(x_n,mode=3))}")
            break
    if iter == max_iter:
        print(f"L'algorithme de descente de gradient avec Armijo n'a pas convergé en moins de {iter} itérations")
        print(f"dernier gradient:{oracle(x_n,mode=3)}")
        print(f"norme dernier gradient:{np.linalg.norm(oracle(x_n,mode=3))}")
    else:
        print("L'algorithme de descente de gradient avec Armijo a convergé au bout de {} itérations".format(iter))
        print(f"solution optimale({x_n})")
        print(f"minimum : {oracle(x_n,mode=1)}")
        print(f"dernier gradient:{oracle(x_n,mode=3)}")
        
    end = time.time()
    print("Temps d'exécution :", round(end-start), "secondes")
    
    return x_n, liste

In [19]:
x,Listes[f"Armijo,oracle 1"] = gradient_descent_Armijo(x0=np.array([1,-1]), oracle=oracle_1, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient avec Armijo a convergé au bout de 5 itérations
solution optimale([ 0.0016 -0.0016])
minimum : 1.0239999999999976e-05
dernier gradient:[ 0.0064 -0.0064]
Temps d'exécution : 0 secondes


In [20]:
visualisation(oracle_1,-2.5,2.5,np.array(Listes["Armijo,oracle 1"]),'Descente de gradient Armijo avec oracle 1,x0=(-1,1)')

In [21]:
x,Listes[f"Armijo,oracle 2"] = gradient_descent_Armijo(x0=np.array([1,-1]), oracle=oracle_2, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient avec Armijo a convergé au bout de 225 itérations
solution optimale([0.98992494 0.9794773 ])
minimum : 0.000103754446744351
dernier gradient:[-0.0013779  -0.00948164]
Temps d'exécution : 0 secondes


In [25]:
visualisation(oracle_2,-1.5,1.5,np.array(Listes["Armijo,oracle 2"]),'Descente de gradient Armijo avec oracle 2,x0=(-1,1)')

In [22]:
x,Listes[f"Armijo,oracle 3"] = gradient_descent_Armijo(x0=np.array([1,-1]), oracle=oracle_3, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient avec Armijo n'a pas convergé en moins de 1000 itérations
dernier gradient:[ 0.70710678 -0.70710678]
norme dernier gradient:1.0
Temps d'exécution : 0 secondes


In [26]:
visualisation(oracle_3,-1.5,1.5,np.array(Listes["Armijo,oracle 2"]),'Descente de gradient Armijo avec oracle 2,x0=(-1,1)')

In [27]:
x0 = np.ones(10)*10
x0[-1] = -10
x0

array([ 10.,  10.,  10.,  10.,  10.,  10.,  10.,  10.,  10., -10.])

array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10])

In [31]:
np.dot(x0**2,np.arange(10)+1)

5500.0

In [45]:
(np.arange(10)+1)*2*x0+40*x0**3

ValueError: operands could not be broadcast together with shapes (10,) (2,) 

In [46]:
def oracle_4(x,mode):
    if mode == 1:
        return np.dot(x**2,np.arange(x.shape[0])+1) + 10 * np.sum(x**4)
    if mode == 3:
        return np.sum((np.arange(x.shape[0])+1)*2*x+40*x**3)
    if mode == 2:
        return np.dot(x**2,np.arange(x.shape[0])+1) + 10 * np.sum(x**4),np.sum((np.arange(10)+1)*2*x+40*x**3)

In [47]:
x0 = np.ones(2)*10
x0[-1] = -10
x,Listes[f"Armijo,oracle 4"] = gradient_descent_Armijo(x0=x0, oracle=oracle_4, epsilon=1e-2, max_iter=1000)

L'algorithme de descente de gradient avec Armijo a convergé au bout de 14 itérations
solution optimale([10.00083338 -9.99916662])
minimum : 200299.9916687503
dernier gradient:0.006084371139877476
Temps d'exécution : 0 secondes


In [49]:
visualisation(oracle_4,-20,20,np.array(Listes["Armijo,oracle 4"]),'Descente de gradient Armijo avec oracle 4,x0=(10,-10)')