<table>
<tr style="background-color:#FFFFFF;">
<td width=15%>
    <table>
        <tr><img src="Fig/Ensimag.png"></img>
        </tr>
    </table>
</td>
<td>
    <table>
        <tr><center><h1>Optimisation Numérique - TP4</h1></center>
        </tr>
        <tr><center><h2>Bundle Methods (1.5h)</h2></center>
        </tr>
    </table>
</td>
<td width=15%>
    <table>
        <tr><a href="https://ljk.imag.fr/membres/Jerome.Malick/teaching.html" style="font-size: 16px; font-weight: bold">Jérôme Malick </br></a>
        </tr>   
        <tr><a href="http://grishchenko.org" style="font-size: 16px; font-weight: bold">Dmitri Grishenko <br></a>
        </tr>
        <tr><a href="https://yassine-laguel.github.io/teaching/" style="font-size: 16px; font-weight: bold">Yassine Laguel </br></a>
        </tr>
    </table>
</td>
</tr>
</table>

**Objectif :** Dans ce court premier TP sur les methodes
d'optimisation convexe non-différentiable, nous ecrivons un simulateur pour
une fonction non-différentiable que nous minimisons ensuite par la méthode des
faisceaux.

In [1]:
import numpy as np
from cvxopt import solvers, matrix
solvers.options['show_progress'] = False
%matplotlib inline

## Affectation linéaire
---

Considérons le problème d'affectation (P):
$$
\begin{array}{l}
min \quad \sum_{i=1}^n\sum_{j=1}^na_{ij}u_{ij}\\
\quad \sum_{j=1}^n\;u_{ij} = 1,\quad \textrm{pour tout }i=1,\dots,n,\\
\quad \sum_{i=1}^n\;u_{ij} = 1,\quad \textrm{pour tout }j=1,\dots,n,\\
\quad u_{ij}\in \{0,1\},\quad \textrm{pour tout }i,j=1,\dots,n.
\end{array}
$$


1. Écrire (P) sous forme matricielle, et donner une interpretation matricielle du probèlme. 

1. On veut dualiser les $n$ premieres contraintes dans (P), écrire le lagrangien $L(\cdot;\cdot)$ associe a ce problème. Definir la fonction duale associée.
1. Montrer qu'on peut calculer explicitement $U_{\lambda}$.

## Simulateur de la fonction duale
---

Pour la suite du TP, on fixe les donnees : 
on suppose qu'on est en dimension $n=10$ 
et que les couts sont donnes par la matrice 
$A = [1:n]*[1:n]^\top $

> Utiliser cette matrice pour ecrire un simulateur ``simdual`` de la fonction duale dont les sorties sont:
  - $\theta (\lambda) = L(U_{\lambda},\lambda)$, la valeur de la fonction duale,
  - $g(\lambda) = -c(U_{\lambda})$ (avec les notations du cours). 

In [2]:
def theta(lambda_, A):
    n = A.shape[0]
    theta = 0
    # TODO
    return theta

def U_(lambda_, A):
    n = A.shape[0]
    U = np.zeros((n, n))
    # TODO
    return U

def subgrad(U, A):
    n = A.shape[0]
    sg = np.zeros((n, 1))
    # TODO
    return sg

def simdual(lambda_, A):
    return theta(lambda_, A), subgrad(U_(lambda_, A), A) 

### Résolution par algorithme des faisceaux (Bundle)

> Trouver un minimum de la fonction duale par la méthode des faisceaux en formulant chaque mise à jour comme un problème QP et en faisant appel à cvxopt comme dans le premier TP sur la reformulation LP/QP.

####  Rappel de cours sur la méthode des faisceaux :

Soit $\theta : R^n\rightarrow R,\lambda\mapsto\theta(\lambda)$ une fonction convexe 
(non differentiable a priori). 

Rappelons rapidement le principe de la methode 
des faisceaux pour minimiser $\theta$.

A l'iteration $k$, on dispose du  faisceau d'information
$$
\{(\theta(\lambda^j),g^j):j=1,\ldots,k\}.
$$
(Dans tout ce qui suit, les indices superieurs noteront un numero
d'iteration.)



On definit $\bar{\lambda}^k$ comme le meilleur des
$\lambda^j$, i.e.
$\theta(\bar{\lambda}^k)\leqslant\theta(\lambda^j)$, $j=1,\ldots,k$.
L'itere suivant est alors obtenu comme solution de :
$$ 
  \begin{aligned}
  \min r+\frac{1}{2} \| \lambda-\bar{\lambda}^k \|^2 \\
  (\lambda,r)\in R^n\times R \\
  \quad r\geqslant \theta(\lambda^j)+(\lambda-\lambda^j)^\top g^j,  j=1,\ldots,k
  \end{aligned}
$$

#### Structure du l'algo

Pour l'algorithme de faisceaux rudimentaire de ce TP, nous allons utiliser le méta-algorithme suivant, avec le simulateur (f_simulator) et le calcul de l'itération suivante (next_x) à spécifier 

In [3]:
def minimize(f_simulator, next_x, x0, nb_iter):
    """
    Minimizes the function simulated by 'f_simulator'. 
    
    Parameters:
    - the simulator 'f_simulator' of a function f
    - a function 'next_x' that computes x_k+1 based on data computed at the iteration k
    - the number of iterations 'nb_iter'
    - the initial value of x 'x0'
    
    Returns:
    - the final point x that aproaches the optimal solution of minimization problem
    - the list of x_k found during the 'nb_iter' iterations
    - the list of corresponding values of f
    - the list of corresponding values of subradient of f
    """
    
    # Initialization
    x           = np.copy(x0)
    x_tab       = [np.copy(x0)]
    f_tab       = [f_simulator(x)[0]]
    subgrad_tab = [f_simulator(x)[1]]
    
    for k in range(nb_iter):
        # Simulation of f and its subgradient in x 
        f, subgrad = f_simulator(x)
        
        # Updating the list of xs and the corresponding values of f and its subgradient
        f_tab       += [f]
        subgrad_tab += [np.copy(subgrad)]
        x            = next_x(x, x_tab, f_tab, subgrad_tab)
        x_tab       += [np.copy(x)]
    
    return x, x_tab, f_tab, subgrad_tab

#### Itération `next_x`

Le calcul de l'itération suivante consiste à résoudre un sous-probleme quadratique. 

In [4]:
def bundle_next_x(x, x_tab, f_tab, subgrad_tab):
    P = P_(x)
    q = q_(x)
    G = G_(subgrad_tab[:-1])
    h = h_(x_tab, f_tab[:-1], subgrad_tab[:-1])
    solution = solvers.qp(P, q, G, h)
    x = np.array(solution['x'])[1:]
    return x

Il reste donc à spécifier les entrées du solver quadratique.

In [5]:
def P_(lambda_):
    n = lambda_.shape[0]
    P = np.zeros(n+1)
    # TODO
    return matrix(P)

def q_(lambda_):
    q = 0 # TODO
    return matrix(q)

def G_(subgrad_tab):
    # TODO
    return matrix(G)

def h_(lambda_tab, theta_tab, subgrad_tab):
    # TODO     
    return matrix(h)