# Démonstration 10

## 1. Algorithmes de points intérieurs

In [2]:
using LinearAlgebra
using JuMP, Clp

# Question 2

Déterminons le centre analytique de l'ensemble
\begin{align*}
S = \{ 1-x_1 \geq 0, 1-x_2 \geq 0, x_1 \geq0, x_2 \geq 0 \}.
\end{align*}

## Solution 

On cherche un minimum de la fonction potentielle associée à S:
\begin{align*}
 \min_x \psi (x_1, x_2) = \{ -\log(1-x_1) - \log(1-x_2) - \log(x_1) - \log(x_2) \,|\, (x_1, x_2) \in \text{Int(S)} \},
\end{align*}

 où Int(S) désigne l'intérieur de S. 
 
 Pour trouver un minimum, on annule le gradient de la fonction potentielle:
 $$\nabla \psi(x_1,x_2) = 0 \Leftrightarrow
 \begin{Bmatrix}
   -\frac{1}{x_1} + \frac{1}{1-x_1}  = 0\\
   -\frac{1}{x_2} + \frac{1}{1-x_2}  = 0
\end{Bmatrix},$$
et donc
\begin{align*}
\frac{-1}{x_1} + \frac{1}{1-x_1} &= \frac{-1+2x_1}{x_1(1-x_1)}, \\
\frac{-1}{x_2} + \frac{1}{1-x_2} &= \frac{-1+2x_2}{x_1(1-x_2)}.
\end{align*}

 $$\nabla \psi (x_1,x_2) = 0 \Leftrightarrow
   \left \{
   \begin{matrix}
      -1 + 2x_1  & = & 0 \\
      -1 + 2x_2  & = &  0
   \end{matrix}
   \right.
$$
(1/2, 1/2) est donc centre analytique de S.

# Question 3

Déterminons le centre analytique de l'ensemble 
$$S_2 = \{ x_1 + x_2 \leq 1 , x_1 \geq 0, x_2 \geq 0 \}$$

## Solution 

 $$\nabla \psi(x_1,x_2) = 0 \Leftrightarrow
 \begin{pmatrix}
   \frac{-1}{x_1} + \frac{1}{1-x_1-x_2}  = 0\\
   \frac{-1}{x_2} + \frac{1}{1-x_1-x_2}  = 0
\end{pmatrix}$$

 $$\nabla \psi (x_1,x_2) = 0 \Leftrightarrow
   \left \{
   \begin{matrix}
      -1 + 2x_1 +x_2  & = & 0 \\
      -1 + x_1 + 2x_2 & = &  0\\
   \end{matrix}
   \right.
$$

(1/3, 1/3) est centre analytique de l'ensemble $S_2$.

# Question 4

Déterminons le centre analytique du dual du problème linéaire suivant:
\begin{align*}
  \min & x_1 - x_2 \\
      & x_1 + x_2 \leq 1  \\
      & x_1,  x_2 \geq 0
\end{align*}

## Solution 

Le dual se formule ainsi
\begin{align*}
\max_y \{y_1 \,|\, y_1\leq 1, \  y_1\leq -1, \  y_1 \leq 0\},
\end{align*}
ce qui revient à
\begin{align*}
\max_y \{ y_1 | y_1 \leq -1 \}.
\end{align*}

Soit $y_1^*$ solution optimale du dual, $y_1^* = -1 \in ]-\infty, -1]$.

Nous allons montrer que le centre analytique associé au problème dual n'existe pas.

En effet, si nous cherchons  à annuler le gradient de la fonction potentielle comme précédemment, nous obtenons que. Or
\begin{align*}
 \psi(y_1) = -\log (1-y_1) - \log (-1-y_1) - \log (-y_1).
\end{align*}

L'annulation du gradient donne l'équation
\begin{align*}
\frac{1}{1-y_1} +\frac{1}{-1-y_1} - \frac{1}{y_1} = 0,
\end{align*}

impliquant
\begin{align*}
 (1+y_1)y_1 - (1-y_1)y_1 + (-1-y_1)(1-y_1) = 0.
\end{align*}

Quelques calculs simples conduisent à l'équation
\begin{align*}
3y_1^2-1 = 0.
\end{align*}

Les racines sont $-1/\sqrt{3}$ et $1/\sqrt{3}$, en dehors du domaine de la fonction potentiel, à savoir $(-\infty, -1]$.
Par conséquent, la fonction potentiel ne s'annule jamais dans le domaine d'intérêt, et donc le centre analytique n'existe pas.

Il est en outre facile de vérifier que le gradient du potentiel est positif pour $y_1 < -1$, comme ce gradient vaut
\begin{align*}
\frac{3y_1^2-1}{(1-y_1^2)y_1}.
\end{align*}

La fonction est dès lors croissante, et dès lors, minimiser cette fonction revient à prendre $y_1 = -\infty$, ce qui est cohérent avec l'idée que l'on s'éloigne au maximum des contraintes.

# Question 5

$\textbf{Note : }$ Le terme vérifier signifie, dans les points a) et b), que vous pouvez entrer la solution proposée dans les équations correspondantes; vous ne devez pas mener les calculs jusqu'à obtenir le résultat énoncé.

Considérons le système d'inégalités suivant:
\begin{align*}
x_1 + x_2 & \leq 3 \\
-x_1 - x_2 & \leq -1 \\
x_1 - x_2 & \leq 1 \\
x_2 - x_1 & \leq 1.
\end{align*}


**(a)** 

Vérifiez que le centre analytique est le point $(1,1)$.

**(b)** 
Ajoutons les deux inégalités suivantes:
\begin{align*}
x_1 & \leq 2 \\
x_2 & \leq 2
\end{align*}
A-t-on modifié l'ensemble réalisable? $(1,1)$ est-il toujours le centre analytique?

**(c)** 
Soit le problème primal
\begin{align*}
\min_y \ & 3y_1 - y_2 + y_3 + y_4 \\
\mbox{s.à. }
 & y_1 - y_2 + y_3 - y_4 = 0 \\
 & y_1 - y_2 - y_3 + y_4 = 1 \\
 & y_1, y_2, y_3, y_4 \geq 0.
\end{align*}


Ecrivez les conditions d'optimalités du chemin central puis, pour $\mu$ fixé à 0, vérifiez que $x_1 = 1$, $x_2 = 2$ est solution optimale du problème (dual), et determiner la solution du primal.

## Solution

**(a)**
Pour vérifier que $(1,1)$ est le centre analytique, nous devons minimiser la fonction potentiel:
\begin{align*}
\phi(x) = - \ln (3 - x_1 - x_2) -  \ln (x_1 + x_2 - 1) - \ln ( 1 - x_1 + x_2 ) - \ln ( 1 + x_1 - x_2 )
\end{align*}
Pour ce faire, on annule le gradient, qui est
\begin{align*}
\nabla_x \phi(x) =
\begin{pmatrix}
\frac{1}{3-x_1-x_2} - \frac{1}{x_1 + x_2 - 1} +\frac{1}{1-x_1+x_2}-\frac{1}{1+x_1-x_2} \\
\frac{1}{3-x_1-x_2} - \frac{1}{x_1 + x_2 - 1} -\frac{1}{1-x_1+x_2}+\frac{1}{1+x_1-x_2}
\end{pmatrix}
\end{align*}
Avec $x_1 = 1$, $x_2 = 1$, cela donne
\begin{align*}
\nabla_x \phi(x) =
\begin{pmatrix}
1 - 1 + 1 - 1 \\
1 - 1 - 1 + 1  
\end{pmatrix}
=
\begin{pmatrix}
0 \\ 0
\end{pmatrix}
\end{align*}

**(b)**

L'ensemble réalisable n'est pas modifier, on peut le déduire en additionnant la première et la troisième contraintes, et en additionnant la première et la quatrième contraintes. De plus, 
\begin{align*}
\phi(x) = & - \ln (3 - x_1 - x_2) -  \ln (x_1 + x_2 - 1) - \ln ( 1 - x_1 + x_2 ) \\
& - \ln ( 1 + x_1 - x_2 ) - \ln (2 - x_1) - \ln (2 - x_2)
\end{align*}
Le gradient est
\begin{align*}
\nabla_x \phi(x) =
\begin{pmatrix}
\frac{1}{3-x_1-x_2} - \frac{1}{x_1 + x_2 - 1} +\frac{1}{1-x_1+x_2}-\frac{1}{1+x_1-x_2} + \frac{1}{2-x_1} \\
\frac{1}{3-x_1-x_2} - \frac{1}{x_1 + x_2 - 1} -\frac{1}{1-x_1+x_2}+\frac{1}{1+x_1-x_2} + \frac{1}{2-x_2}
\end{pmatrix}
\end{align*}
qui ne s'annule pas en (1,1).

**(c)**


On doit écrire les équations du chemin central primal-dual.
\begin{align*}
y_1 s_1 &= \mu \\
y_2 s_2 &= \mu \\
y_3 s_3 &= \mu \\
y_4 s_4 &= \mu \\
y_1 - y_2 + y_3 - y_4 &= 0 \\
y_1 - y_2 - y_3 + y_4 &= 1 \\
x_1 + x_2 + s_1 &= 3 \\
-x_1 - x_2 + s_2 &= -1 \\
x_1 - x_2 + s_3 &= 1 \\
-x_1 + x_2 + s_4 &= 1.
\end{align*}
En posant $x_1 = 1$, $x_2 = 2$, on a directement $s_1 = s_4 = 0$, $s_2 = s_3 = 2$. Pour $\mu = 0$, cela implique que $y_2 = y_3 = 0$, et les équations du primal se réduisent à
\begin{align*}
y_1 - y_4 &= 0 \\
y_1 + y_4 &= 1
\end{align*}
On en déduit la solution optimale du primal $y_1 = y_4 = \frac{1}{2}$, $y_2 = y_3 = 0$, compatible avec la solution duale $x_1 = 1$, $x_2 =2$.

## Question 6

Nous considérons un problème de programmation linéaire sous forme standard et
nous supposons que les ensemble réalisables du primal et du dual ont des
intérieurs non vides. Montrer que si l'ensemble réalisable du primal est borné,
alors l'ensemble réalisable du dual ne peut pas être borné. Est-il possible
d'avoir des ensembles réalisables non bornés pour le primal et le dual?

Soit $\left(x(\mu), y(\mu), s(\mu) \right)$, $0<\mu<\infty$ Si l'ensemble réalisable de primal
est borné, $x(\mu)$ converge vers le centre analytique de l'ensemble réalisable
du primal. Dès lors, $x(\mu)$ tend vers un certain $x^{\star} $ pour $\mu \to
\infty$, avec $x^{\star} $ fini.  D'autre part, on sait que

\begin{align*}
c^{t} x(\mu) - b^{t} y(\mu) = \eta \mu
\end{align*}
Dès lors, pour $\mu \to \infty$, 
\begin{align*}
\lim_{\mu\to \infty} b^t y(\mu) = c^t x^{\star} - \infty = - \infty
\end{align*}
Dès lors, $y(\mu)$ ne peut pas converger vers un certain $y^{\star} $ fini comme $\mu$ tend vers l'infini. 
Or ce serait le cas si l'ensemble dual était borné.

On peut avoir des ensembles non bornés pour le primal et le dual. Considérions la paire
\begin{align*}
&\min\ x_1 + x_2 \\
&\begin{aligned}
\text{s.a.} &\\
&  x_1 = 1 ,\\
& x_1, x_2 \ge 0.
\end{aligned}
\end{align*}

\begin{align*}
&\max\ \lambda \\
&\begin{aligned}
\text{s.a.} &\\
& \lambda \le 1 ,\\
\end{aligned}
\end{align*}
Les deux ensemble ont des intérieurs non vides et ne sont pas bornés.

# Implémentation de la Méthode de Mehrotra

Arnaud L'Heureux, Décembre 2019

Étant donné la paire primale-duale d'un problème de programmation linéaire : 
$$\min_x c^Tx$$
$$\text{s.à.}\ \ Ax = b$$
$$x \geq 0$$
et
$$\max_{\lambda,s} b^T\lambda$$
$$\text{s.à.}\ \ A^T\lambda + s = c$$
$$s \geq 0$$
Nous avons les conditons KKT suivantes qui doivent être satisfaites pour que la solution au problème soit optimale:
$$Ax = b$$
$$A^T\lambda + s = c$$
$$XSe = 0$$
$$(x,s) \geq 0$$
où $X$ et $S$ sont des matrices diagonales ayant $x$ et $s$ comme diagonales. La condition $Ax = b$, nous indique que la solution est réalisable pour le primal alors que $A^T\lambda + s = c$ implique que le dual est réalisable. Tout point réalisable pour le primal ainsi que le dual satisfaisant la condition $XSe = 0$ implique que ce point est optimal pour le primal et le dual.

In [None]:
using LinearAlgebra

# Heuristique proposée par Mehrotra
function genStart(A:: Matrix, b:: Vector, c:: Vector)
    x̅ = A'*((A*A')\b)
    λ̅ = (A*A')\A*c
    s̅ = c - A'*λ̅

    δx = max(-1.5*minimum(x̅),0)
    δs = max(-1.5*minimum(s̅),0)

    # δx et δs sont des scalaires, et doivent être ajoutés à chaque composante, c'est pourquoi nous utilisons .+
    num = dot(x̅ .+ δx, s̅ .+ δs)
    δx̅ = δx + num/(2*sum(s̅ .+ δs))
    δs̅ = δs + num/(2*sum(x̅ .+ δx))

    return (x̅ .+ δx̅, λ̅ , s̅ .+ δs̅)
end

L'algorithme de Mehrotra suit.

In [None]:
using SparseArrays

function Mehrotra(A:: Matrix, b:: Vector, c:: Vector,
                  ε:: Float64, maxIter:: Int64 = 1000, sparseMode:: Bool = True)

    (m,n) = size(A)  # calcul la dimension de A
    
    if (sparseMode)
        temp = sparse(A)
        density = nnz(temp)/(m*n)
       
        # Si la densité de A est inférieure à 20%, nous travaillons avec une matrice creuse
        if (density < .2)
            A = sparse(A)
            b = sparse(b)
            c = sparse(c)
        end
    end

    # Calcul du point de départ
    res = genStart(A,b,c)
    x = res[1]
    λ = res[2]
    s = res[3]
    
    iter = 0

    # Nous utilisons le critère d'arrêt par défaut dans le test de boucle.
    # Le test de convergence se fera en interne, et nous pourrons alors quitter la fonction.
    while (iter < maxIter)
        iter += 1
        
        # Calcul des résidus
        rp = A*x-b
        rd = A'*λ + s - c
        rc = x .* s

        # μ est aligné sur le saut de dualité
        μ = dot(x,s)/n
        
        # Nous testons la qualité de la solution
        if (max(μ, norm(rd), norm(rp)) < ε)
            return (x,λ,s)
        end
        
        # Calcul de M = AXS^-1A' et du factory de Cholesky R de M (M=R'R)
        M = A*diagm(x./s)*A'
        R = cholesky(M).U

        # Calcul des termes de droite
        td = rp - A*((rc - x.*rd)./s)
        
        # Étape prédictrice
        Δλ_p = R\(R'\td)
        Δs_p = rd - A'*Δλ_p
        Δx_p = (rc - x.*Δs_p)./s
 
        # Calculs des longueur de pas potentiels les plus longs
        # Pas primal
        α_p = 1/maximum([1 ; Δx_p ./ x])
        # Pas dual
        α_d = 1/maximum([1 ; Δs_p ./ s])
        
        # Paramètre centralisant
        σ = (dot(x - α_p*Δx_p, s - α_d*Δs_p)/(n*μ))^3
        
        # Étape correctrice
        rc = rc .- σ*μ + Δx_p.*Δs_p
        td = rp - A*((rc - x.*rd)./s)
        
        Δλ_c = R\(R'\td)
        Δs_c = rd - A'*Δλ_c
        Δx_c = (rc - x.*Δs_c)./s
        
        η = max(0.995, 1-μ)
        
        # Pas primal
        α_p = η/maximum([η ; Δx_c./x])
        # Pas dual
        α_d = η/maximum([η ; Δs_c./s])
        
        # Mise à jour da la solution
        x -= α_p*Δx_c
        λ -= α_d*Δλ_c
        s -= α_d*Δs_c
    end
end

### Exemple

Soit le problème:
\begin{align*}
\min z\ &= 5x_1 + 2x_2 -4x_3 \\
\text{s.à. } & 6x_1 + x_2 - 2x_3 - x_4 = 5 \\
& x_1 + x_2 + x_3 + x_5 = 4 \\
& 6x_1 + 4x_2 -2x_3 - x_6= 10 \\
& x_i \geq 0, \ i = 1,\ldots,6.
\end{align*}

In [None]:
A = [6 1 -2 -1 0 0; 1 1 1 0 1 0; 6 4 -2 0 0 -1]
b = [5; 4; 10]
c = [5; 2; -4; 0; 0; 0]

Nous commençons par trouver un point de départ $(x_0, \lambda_0, s_0)$.

In [None]:
start = genStart(A,b,c)

println(A*start[1]-b)
println(A'*start[2]-c)
println(start[1], " ", start[3])

Nous voyons que seules les contraintes de non-négativité sont satisfaite, mais ni $x_0$, ni $\lambda_0$, ne sont réalisables.

Appliquons l'algorithe de Mehrotra.

In [None]:
x = Mehrotra(A,b,c,0.0000000000001,10,true)[1]

println("x = ", x)
println("Ax = ", A*x)
println("z = c^Tx = ", dot(c,x))

Nous obtenons la solution:

$$x = \begin{pmatrix}
  0.9999999999999999 \\
  1.6666666666666656 \\
  1.3333333333333355 \\
  3.5867130386728067 \times 10^{-19}\\
  1.5140739781564760 \times 10^{-19}\\
  3.8753111845137296 \times 10^{-19}
 \end{pmatrix}  \approx \begin{pmatrix}
  1 \\
  \frac{5}{3} \\
  \frac{4}{3} \\
  0\\
  0\\
  0
 \end{pmatrix}
$$
La solution est
$$x_1 = 1, \ \ x_2 = \frac{5}{3}, \ \ x_3 = \frac{4}{3}, \ \ x_4 = x_5 = x_6 = 0,$$
qui est bien réalisable puisque $Ax = b$. Cette solution nous donne la valeur de la fonction objectif $z = 3$.