# Projet d'optimisation 
Mohamed-Iadh BANI & Mohamed BEN FTIMA -- ISI A


## Phase 1 : Visualiser une HQ de paramètres donnés

In [None]:
# bibliotheques des graphes et fonctions mathematiques
import matplotlib.pyplot as plt
import numpy as np

### Visualisation d'hyperquadratique et de droites enveloppantes
Ci-dessous les fonctions récurrentes :

In [None]:
#fonction hyperquadratique
def hyperQuad(x,y,hq):
    """Valeur en (x,y) de l'hyperquadratique `hq`."""
    sum = 0
    for a,b,c,g in hq:
        sum += abs(a*x + b*y + c)**g
    return sum-1

#affichage d'hyperquadratique
def hyperTrace(x2D, y2D, hq):
    """Tracé de l'hyperquadratique `hq`."""
    plt.contour(x2D, y2D, hyperQuad(x2D,y2D,hq), levels=[0], colors='k') # Isovaleurs
    
#affichage de droites enveloppantes
def droiteEnv(hq, limy):
    """tracé des droites enveloppantes de l'hyperquadratique `hq` dans le domaine limité en ordonnée par `limy`."""
    for a,b,c,_ in hq:
        if b == 0:
            plt.vlines([-(c+1)/a, (1-c)/a], *limy, lw=1.1)
        else:
            plt.axline((0, (c+1)/-b), slope=-a/b, lw=1.1)
            plt.axline((0, (c-1)/-b), slope=-a/b, lw=1.1)

#Parametres de l'hyperquadratique 
def hyperDescrip(hq):
    """Description des paramètres de l'hyperquadratique `hq`."""
    k = 1
    for terme in hq:
       print("Terme {0:2} : a = {1[0]:6.3f} ; b = {1[1]:6.3f} ; c = {1[2]:6.3f} ; gamma = {1[3]:3}".format(k, terme))
       k += 1

# Affichage
def affichage(titre, limx=[-1.1, 1.1], limy=[-1.1, 1.1]):
    """Mise en forme de base de plusieurs graphes par l'ajout du `titre` et du domaine du tracé `limx` et `limy`."""
    plt.axis('square')
    plt.title(titre)
    plt.xlabel('x')
    plt.ylabel('y')
    plt.xlim(*limx)
    plt.ylim(*limy)
    plt.grid()

On fait l'illustration de l'utilisation des fonctions du bloc ci-dessus.

In [None]:
x = np.linspace(-1,1)
y = np.linspace(-1,1)
x2D, y2D = np.meshgrid(x,y)

#Parametre d'un cercle
cercle = [[1,0,0,2], [0,1,0,2]]
#parametre d'hyperquadratique à 3 termes
patate = [[1,0,0,5], [0,1,0,5], [.7,-.7,0,5]]
#parametre d'hyperquadratique à 4 termes
pomme = [[1,0,0,5], [0,1,0,5], [.6, -.6, 0, 5], [.6, .6, 0, 5]]

fig = plt.figure(figsize=(20,6))

#Visualiser un cercle et les droites englobantes
plt.subplot(1,3,1)
affichage("Cercle")
hyperTrace(x2D, y2D, cercle)
droiteEnv(cercle, plt.ylim())

#Visualiser une hyperquadrique à 3 termes et les droites englobantes
plt.subplot(1,3,2)
affichage("Hyperquadratique à 3 termes")
hyperTrace(x2D, y2D, patate)
droiteEnv(patate, plt.ylim())

#Visualiser une hyperquadrique à 4 termes et les droites englobantes
plt.subplot(1,3,3)
affichage("Hyperquadratique à 4 termes")
hyperTrace(x2D, y2D, pomme)
droiteEnv(pomme, plt.ylim())

plt.show()

#Affichage des paramètres de l'hyperquadratique à 3 termes
print("Paramètres de l'hyperquadratique a 3 termes :")
hyperDescrip(patate)

### Influence des paramètres de l'hyperquadratique

In [None]:
x = np.linspace(-2,2)
y = np.linspace(-2,2)
x2D, y2D = np.meshgrid(x,y)

def changemtParam(hq, i, j, param1, param2):
    temp = [terme[:] for terme in hq]
    hyperTrace(x2D, y2D, hq)

    temp[i][j] = param1
    plt.contour(x2D, y2D, hyperQuad(x2D,y2D,temp), levels=0, colors='b', linewidths=1, linestyles='dashed')
    temp[i][j] = param2
    plt.contour(x2D, y2D, hyperQuad(x2D,y2D,temp), levels=0, colors='r', linewidths=1, linestyles='dashed')

    titre = "Influence du terme ${}_{}$".format(['a', 'b', 'c', '\\gamma'][j], i+1)
    affichage(titre, plt.xlim(), plt.ylim())
    
    del temp[i]
    droiteEnv(temp, plt.ylim())

In [None]:
#Visualiser les influence des paramètres d'une hyperquadrique à 4
plt.figure(figsize=[32,16], num="paramCercle")
plt.subplot(2,4,1); changemtParam(cercle, 0, 0, .5, 2)
plt.subplot(2,4,2); changemtParam(cercle, 0, 1, -1, 1)
plt.subplot(2,4,3); changemtParam(cercle, 0, 2, -1, 1)
plt.subplot(2,4,4); changemtParam(cercle, 0, 3, .5, 16)

plt.subplot(2,4,5); changemtParam(cercle, 1, 0, -1, 1)
plt.subplot(2,4,6); changemtParam(cercle, 1, 1, .5, 2)
plt.subplot(2,4,7); changemtParam(cercle, 1, 2, -1, 1)
plt.subplot(2,4,8); changemtParam(cercle, 1, 3, .5, 16)

plt.figure(figsize=[32,16], num="paramPatate")
plt.subplot(2,4,1); changemtParam(patate, 0, 0, .5, 1.5)
plt.subplot(2,4,2); changemtParam(patate, 0, 1, -.5, .5)
plt.subplot(2,4,3); changemtParam(patate, 0, 2, -.5, .5)
plt.subplot(2,4,4); changemtParam(patate, 0, 3, .01, 16)

plt.subplot(2,4,5); changemtParam(patate, 2, 0, .5, 1.5)
plt.subplot(2,4,6); changemtParam(patate, 2, 1, -.5, .5)
plt.subplot(2,4,7); changemtParam(patate, 2, 2, -.5, .5)
plt.subplot(2,4,8); changemtParam(patate, 2, 3, .01, 16)


Sur la figure ci-dessus (double-cliquer pour agrandir) on trace les hyperquadratiques (HQ) dans 3 cas de figures :
- le tracé noir est celui de l'hyperquadratique dans le cas initial ;
- le tracé bleu est celui de l'hyperquadratique pour laquelle on a diminué la valeur d'un paramètre donné ;
- le tracé rouge est celui de l'hyperquadratique pour laquelle on a augmenté la valeur d'un paramètre donné.

En jouant avec les paramètres des HQ, on remarque que chacun des paramètres $a$ , $b$ , $c$ et $γ$ ont une influence sur le tracé de l'HQ et sur deux droites englobantes contrairement aux autres droites qui restent fixes. On a approxmativement :

- le paramètre $a$ qui "écrase" l'HQ sur elle même quand il augmente ou "l'étire" quand il baisse,
- le paramètre $b$ qui déforme l'HQ à la manière d'une contrainte de cisaillement, 
- le paramètre $c$ qui translate l’HQ ou "l'écrase" contre les droites englobantes fixes,
- le paramètre $γ$ qui fait "gonfler" l'HQ de manière à occuper le domaine d'un carré de côté 1 quand il augmente et la fait "dégonfler" quand il baisse.

On constate que les rôles de $a$ et $b$ sont parfois intervertis (bien visible dans les figures avec le cercle) mais que cela change la direction des transformation (selon l'axe $y$ plutôt que selon $x$ et vice versa).

## Phase 2 : Fitter un nuage de points par une HQ dont une partie des paramètres est donnée

In [None]:
# Extraction de points
f = open('Data_HQ_Ph1et2.csv', 'r') #Données à fitter : Nuage de points
x = [float(u) for u in f.readline().split(',')]
y = [float(u) for u in f.readline().split(',')]
f.close()

# probleme simplifie
def psi(x,y,a,b):
    return (a*x+b*y)**4 + (x+y)**4 - 1  #Fonction utilisée pour le fit

# critere quadratique. Fonction objectif de minimisation de distance
def J(x,y,a,b):
    som = 0
    for u,v in zip(x,y):
        som += psi(u,v,a,b)**2
    return som

### Méthode 1 : Descente de gradient

In [None]:
# Descente de gradient
def dPsi(x,y,a,b):
    return [4*x*(a*x+b*y)**3, 4*y*(a*x+b*y)**3]

# Derivation sur a et b
def dJ(x,y,a,b): 
    som = [0, 0]
    for u,v in zip(x,y):
        etape = 8*psi(u,v,a,b)*(a*u+b*v)**3
        som[0] += u*etape
        som[1] += v*etape
    return som

def gradient(x,y,a0,b0,alpha,eps,nmax):
    dX = float('inf')   # reel
    n = 0               # entier
    Xa, Xb = [a0], [b0] # vecteurs de reels
    
    while dX > eps and n < nmax:
        D = dJ(x,y,Xa[-1],Xb[-1])
        Xa.append(Xa[-1] - alpha*D[0])
        Xb.append(Xb[-1] - alpha*D[1])
        dX = alpha*np.sqrt(D[0]**2 + D[1]**2)
        n += 1
    
    return Xa, Xb, n, (dX <= eps)

# Illustration de la méthode de gradient

a = np.linspace(-1, 1,100)
b = np.linspace(-1, 1,100)
a2D, b2D = np.meshgrid(a,b)

Xa, Xb, nIter, converge = gradient(x,y,.1,-.1,.007,1e-6,50)

iso = 3*(np.logspace(0,1)-1)

plt.figure(num='gradient')
plt.contour(a2D, b2D, J(x,y,a2D,b2D), levels=iso)
plt.plot(Xa, Xb, '-ro', lw=1.5, markersize=3)
plt.plot(Xa[-1], Xb[-1], 'ko', markersize=3)

plt.title("Méthode du gradient")
plt.xlabel('coefficient a')
plt.ylabel('coefficient b')
plt.axis('square')

plt.show()

Visuellement, on voit que la méthode du gradient arrive au paramétrage cible mais qu'il en ignore un autre vers la coordonnée (-0.9, 0.4).

###  Méthode 2 : méthode de Newton


In [None]:
# Derivation sur a et b
def HJ(x,y,a,b):
    som = [[0,0], [0,0]]
    for u,v in zip(x,y):
        etape1 = (a*u+b*v)
        etape2 = 8*etape1**2
        etape3 = etape2*(4*etape1**4 + 3*psi(u,v,a,b))
        som[0][0] += u*u*etape3
        som[0][1] += u*v*etape3
        som[1][0] += u*v*etape3
        som[1][1] += v*v*etape3
    return som

def newton(x,y,a0,b0,eps,nmax):
    dX = float('inf')   # reel
    n = 0               # entier
    Xa, Xb = [a0], [b0] # vecteurs de reels
    
    while dX > eps and n < nmax:
        d1J = np.array(dJ(x, y, Xa[-1], Xb[-1]))
        d2J = np.array(HJ(x, y, Xa[-1], Xb[-1]))
        
        DeltaX = np.tensordot(-np.linalg.inv(d2J), d1J, 1)
        Xa.append(Xa[-1]+DeltaX[0])
        Xb.append(Xb[-1]+DeltaX[1])
        dX = np.linalg.norm(DeltaX)
        
        n += 1
        
    return Xa, Xb, n, (dX <= eps)

# Illustration de la méthode de Newton

a = np.linspace(-1.5, 1.5,100)
b = np.linspace(-1.5, 1.5,100)
a2D, b2D = np.meshgrid(a,b)

iso = 3*(np.logspace(0,1)-1)
plt.figure(num='newton', figsize=[15,15])
plt.contour(a2D, b2D, J(x,y,a2D,b2D), levels=iso)
plt.colorbar()

departs = np.random.rand(7,2)*2-1
for X in departs:
    Xa, Xb, nIter, converge = newton(x,y,X[0],X[1],1e-6,20)
    plt.plot(Xa, Xb, '-ro', lw=1.5, markersize=3)
    plt.plot(Xa[-1], Xb[-1], 'ko', markersize=3)
    print(f"{Xa[-1]:9.6f}, {Xb[-1]:9.6f}\tconverge? {converge}")

plt.title("Méthode de Newton")

plt.xlabel('Coefficient a')
plt.ylabel('Coefficient b')
plt.axis('square')

plt.show()

On constate que la méthode de Newton ne fonctionne pas à tous les coups : elle converge parfois vers un maximum local plutôt qu'un minimum. Cependant nous obtenons facilement les deux paramétrages qui minimisent la fonction objectif :
- $(a,b)_1$ = (-0.803460,  0.373712)
- $(a,b)_2$ = (0.803460, -0.373712)

In [None]:
# Résultat sur le nuage de points
plt.figure('hyperquad')
plt.scatter(x,y)

A, B = 0.803460, -0.373712

borne = 1.5
u = np.linspace(-borne, borne)
v = np.linspace(-borne, borne)
u2D, v2D = np.meshgrid(u, v)
plt.contour(u2D, v2D, psi(u2D,v2D,A,B), levels=[0], colors='k')

plt.title('Hyperquadratique ajustée au nuage de points')
plt.xlabel('Coordonnée x')
plt.ylabel('Coordonnée y')
plt.show()

hq = [[A,B,0,4],[1,1,0,4]]
hyperDescrip(hq)

On remarque que l’hyperquadrique est bien superposée au nuage de points.