# üìò Tutoriel D√©taill√© UNLOCBOX : La Puissance de l'Optimisation Convexe Proximal

Ce Notebook interactif MATLAB (Live Script) est con√ßu pour les utilisateurs souhaitant appliquer l'**Optimisation Convexe** √† des probl√®mes d'ing√©nierie ou d'analyse de donn√©es, en utilisant la bo√Æte √† outils **UNLocBoX**. Nous allons explorer le concept cl√© de l'**Op√©rateur Proximal** et l'appliquer au probl√®me fondamental de la **R√©gression *Fused Lasso***.

## 1\. Concepts Fondamentaux de l'Optimisation Convexe

### 1.1. Pourquoi l'Optimisation Convexe ? 

L'optimisation convexe est une branche de l'optimisation math√©matique o√π l'on minimise une fonction objectif convexe sur un ensemble de contraintes convexe. La propri√©t√© cruciale est que **tout minimum local est un minimum global**, garantissant que nos algorithmes trouvent la meilleure solution possible (pour peu qu'une solution existe).

### 1.2. Le Principe du *Proximal Splitting* 

Lorsque la fonction objectif $f(x)$ peut √™tre d√©compos√©e en une somme de termes $f(x) = f_1(x) + f_2(x) + \dots + f_K(x)$, les m√©thodes classiques de gradient peuvent √™tre inefficaces ou impossibles √† appliquer si certains termes $f_n$ sont **non-diff√©rentiables** (par exemple, la norme $l_1$, souvent utilis√©e pour l'induction de parcimonie).

Le *proximal splitting* contourne cela en traitant chaque terme s√©par√©ment.

| Type de Fonction | Caract√©ristique | Outil Requis pour UNLocBoX |
| :--- | :--- | :--- |
| **Lisse** (*Smooth*) | Diff√©rentiable | **Gradient** $\nabla f_n(x)$ et **Constante de Lipschitz** $\beta$ |
| **Non-Lisse** (*Nonsmooth*) | Non-diff√©rentiable | **Op√©rateur Proximal** $prox_{\lambda f_n}(x)$ |



## 2\. Installation et Initialisation d'UNLocBoX

### 2.1. Pr√©paration de l'Environnement 

Commencez par ajouter le chemin d'UNLocBoX √† votre session MATLAB et ex√©cutez le script d'initialisation.

In [1]:

% Assurez-vous d'avoir t√©l√©charg√© UNLocBoX (souvent nomm√© unlocbox-master)
% Naviguez dans le r√©pertoire racine d'UNLocBoX.

% 1. Ajout du chemin (remplacez par votre chemin r√©el)
addpath(genpath('./unlocbox-master')); 

% 2. Initialisation de la bo√Æte √† outils
init_unlocbox;

disp(' UNLocBoX a √©t√© initialis√©. Nous sommes pr√™ts √† r√©soudre des probl√®mes d''optimisation.');


UnLocBoX version 1.8.0. Copyright 2012-2015 LTS2-EPFL, by Nathanael Perraudin
 UNLocBoX a √©t√© initialis√©. Nous sommes pr√™ts √† r√©soudre des probl√®mes d'optimisation.


## 3\. Le Cas d'√âtude : La R√©gression Fused Lasso

Nous allons r√©soudre le probl√®me de la **R√©gression *Fused Lasso***, qui est id√©al pour illustrer le *proximal splitting* car il comporte trois termes :

$$\min_{x} \underbrace{\frac{1}{2}||Ax-y||_{2}^{2}}_{f_{1}(x)} + \underbrace{\lambda_1 ||x||_{1}}_{f_{2}(x)} + \underbrace{\lambda_2 ||Dx||_{1}}_{f_{3}(x)}$$

O√π :

  * $f_1(x)$ est le terme d'ajustement aux donn√©es (lisse).
  * $f_2(x)$ est la r√©gularisation **Lasso** (induit la parcimonie, non-lisse).
  * $f_3(x)$ est la r√©gularisation ***Fused*** (induit la parcimonie des diff√©rences, non-lisse).
  * $D$ est la matrice de diff√©rence finie, et $\lambda_1, \lambda_2$ sont les coefficients de pond√©ration.

### 3.1. Simulation des Donn√©es 

G√©n√©rons des donn√©es synth√©tiques pour notre probl√®me de r√©gression.

In [2]:
% 1. D√©finition des dimensions et des param√®tres
N = 100; % Longueur du signal (nombre de variables)
M = 50;  % Nombre d'observations
lambda1 = 0.5; % Poids du terme Lasso
lambda2 = 1.5; % Poids du terme Fused Lasso

% 2. Cr√©ation de la matrice de mesure (A)
A = randn(M, N);
A = A ./ norm(A); % Normalisation

% 3. Cr√©ation du signal vrai (sparse et parcimonieux en diff√©rences)
x_true = zeros(N, 1);
x_true(20:40) = 5;
x_true(60:80) = -3; 
y = A * x_true + 0.1 * randn(M, 1); % Observation bruit√©e

% 4. Matrice de diff√©rence finie (D)
D = spdiags([-ones(N, 1) ones(N, 1)], [0 1], N-1, N); % D*x approxime la d√©riv√©e

% 5. Point d'initialisation
x0 = zeros(N, 1); 

disp(['Taille du probl√®me: N = ', num2str(N), ', M = ', num2str(M)]);

Taille du probl√®me: N = 100, M = 50



### 3.2. D√©finition de la Fonction Lisse $f_1(x)$ 

La fonction $f_1(x) = \frac{1}{2}||Ax-y||_{2}^{2}$ est quadratique.

#### 3.2.1. Calcul de la Constante de Lipschitz ($\beta$) 

Pour les fonctions lisses, l'algorithme *Forward-Backward* (FISTA) n√©cessite la constante de Lipschitz du gradient.
$$\beta = \text{Lipschitz}(\nabla f_1) = ||\nabla^2 f_1||_2 = ||A^T A||_2 = ||A||_2^2$$

In [3]:

% Structure pour la fonction Lisse f1
f1.eval = @(x) 0.5 * norm(A*x - y)^2;
f1.grad = @(x) A' * (A*x - y);
f1.beta = norm(A)^2; % Calcul de la constante de Lipschitz
f1.name = 'Data Fidelity (L2 squared)';

disp('D√©tails f1: eval, grad, beta d√©finis.');

D√©tails f1: eval, grad, beta d√©finis.



### 3.3. D√©finition de la R√©gularisation Lasso $f_2(x)$ 

$f_2(x) = \lambda_1 ||x||_{1}$ est non-lisse. Nous devons utiliser l'op√©rateur proximal `prox_l1`.

#### 3.3.1. L'Op√©rateur Proximal $\text{prox}_{\tau \lambda_1 ||\cdot||_1}$ 

L'op√©rateur proximal de $\lambda_1 ||\cdot||_1$ est la fonction de **seuil souple** (*Soft Thresholding*), essentielle pour l'induction de parcimonie.


In [4]:

% Structure pour la fonction Non-Lisse f2 (Lasso)
f2.eval = @(x) lambda1 * norm(x, 1);
% L'op√©rateur prox_l1 prend x, et le pas de temps T (tau) qui est multipli√© par lambda1
f2.prox = @(x, T) prox_l1(x, T * lambda1); 
f2.name = 'Lasso Regularization (L1)';

disp('D√©tails f2: eval, prox (Soft Thresholding) d√©finis.');

D√©tails f2: eval, prox (Soft Thresholding) d√©finis.


### 3.4. D√©finition de la R√©gularisation Fused Lasso $f_3(x)$ 

$f_3(x) = \lambda_2 ||Dx||_{1}$ est aussi non-lisse. UNLocBoX g√®re cela avec l'op√©rateur proximal `prox_l1` appliqu√© dans l'espace des diff√©rences.


In [5]:
% Structure pour la fonction Non-Lisse f3 (Fused Lasso)
f3.eval = @(x) lambda2 * norm(D*x, 1);

% Pour appliquer prox_l1 √† D*x, nous devons utiliser un op√©rateur de projection
% prox_l1_linop, qui est un op√©rateur proximal avanc√© pour les fonctions de la forme f(L*x).
% Nous devons d√©finir l'op√©rateur lin√©aire (L=D) et son adjoint (D')
param_fl.A = D;     % L'op√©rateur lin√©aire
param_fl.At = D';   % Son adjoint (transpos√©e)

% Le prox_l1_linop utilise le pas de temps T pour l'algorithme ADMM ou Douglas-Rachford.
f3.prox = @(x, T) prox_l1_linop(x, T * lambda2, param_fl); 
f3.name = 'Fused Lasso Regularization (L1 on differences)';

disp('D√©tails f3: eval, prox (l1 sur op√©rateur lin√©aire) d√©finis.');

D√©tails f3: eval, prox (l1 sur op√©rateur lin√©aire) d√©finis.


## 4\. Choix du Solveur et R√©solution

Le probl√®me a la forme $f_1(x) + f_2(x) + f_3(x)$, soit une fonction lisse ($f_1$) plus deux fonctions non-lisses ($f_2$ et $f_3$).

  * **Solveurs adapt√©s :**
      * **Douglas-Rachford (DR) :** Excellent pour les sommes de deux fonctions non-lisses. N√©cessite de grouper $f_1+f_2$ (lisse + non-lisse) ou $f_2+f_3$ (non-lisse + non-lisse).
      * **Forward-Backward (FISTA) :** Id√©al pour $f_{\text{lisse}} + f_{\text{non-lisse}}$.

Puisque nous avons trois termes, nous utiliserons la fonction g√©n√©rique `solvep` qui choisira le meilleur algorithme (souvent une version du **Douglas-Rachford** ou du **SDMM** qui g√®re la somme de trois prox).

### 4.1. Param√©trage G√©n√©ral 

D√©finissons les param√®tres pour tous les solveurs.

In [6]:
param.verbose = 2; % Afficher les informations d√©taill√©es
param.maxit = 2000; % Augmentation des it√©rations pour la convergence
param.tol = 1e-4; % Tol√©rance d'arr√™t
param.method = 'solvep'; % Utilisation du solveur universel

% üí° Plugin de monitoring (Optionnel : pour afficher les r√©sultats en cours de route)
fig = figure(1);
param.do_sol = @(x) plot(x_true, 'b', x, 'r--', 'LineWidth', 1.5);
param.rel_obj = 1; % Calculer la diff√©rence relative entre les it√©rations

disp('Param√®tres du solveur d√©finis. R√©solution en cours...');

Param√®tres du solveur d√©finis. R√©solution en cours...



### 4.2. Ex√©cution et R√©sultats 

Lan√ßons l'optimisation en passant l'ensemble des structures au solveur `solvep`.

In [7]:
% R√©solution du probl√®me Fused Lasso complet
sol_fl = solvep(x0, {f1, f2, f3}, param); 

% Affichage final
figure(2);
plot(x_true, 'b', 'LineWidth', 2);
hold on;
plot(sol_fl, 'r--', 'LineWidth', 1.5);
title('R√©solution Fused Lasso par UNLocBoX');
legend('Signal Vrai (x\_true)', 'Solution Fused Lasso (sol\_fl)');
xlabel('Indice du Signal');
ylabel('Valeur');
grid on;

disp('‚úÖ Optimisation termin√©e. La solution est affich√©e.');

A function has both the prox and a grad fields. The gradient is used
Algorithm selected: FB_BASED_PRIMAL_DUAL 
Iter 001:     prox_L1: ||A x-y||_1 = 1.021061e+01, REL_OB, iter = 2


Error using fb_based_primal_dual_alg>fb_based_primal_dual_algorithm (line 158)
Unknown method

Error in fb_based_primal_dual_alg>@(x_0,fg,Fp,sol,s,param)fb_based_primal_dual_algorithm(fg,Fp,sol,s,param) (line 21)
    fb_based_primal_dual_algorithm(fg, Fp, sol, s, param);

Error in solvep (line 209)
    [sol, s] = algo.algorithm(x_0, fg, Fp, sol, s, param);


## 5\. Algorithmes Sp√©cifiques et Options Avanc√©es

UNLocBoX vous permet d'appeler directement des algorithmes pour un contr√¥le plus fin.

### 5.1. Algorithme FISTA (*Fast Iterative Shrinkage-Thresholding Algorithm*) 

FISTA est l'impl√©mentation acc√©l√©r√©e du *Forward-Backward*. Il ne peut r√©soudre que $f_{\text{lisse}} + f_{\text{non-lisse}}$.

Pour l'utiliser, nous devons grouper $f_2$ et $f_3$ dans un terme non-lisse unique $g(x) = f_2(x) + f_3(x)$, puis r√©soudre $\min f_1(x) + g(x)$ avec `forward_backward`. Cependant, trouver le `prox` de $g(x)$ est un autre probl√®me d'optimisation complexe (sauf cas sp√©ciaux), ce qui justifie l'utilisation de **DR** ou **Chambolle-Pock** pour trois termes.

### 5.2. Algorithme Douglas-Rachford (DR) 

DR est efficace pour r√©soudre $\min f_{A}(x) + f_{B}(x)$, o√π $f_A$ et $f_B$ sont toutes deux non-lisses (ou lisses). Nous pouvons le forcer √† r√©soudre $f_1(x) + (f_2(x)+f_3(x))$ en regroupant deux termes.


In [11]:
% Pour DR, nous allons r√©soudre : min (f1 + f2) + f3
% Cette d√©composition n√©cessite la somme des prox de f1 et f2.
% Dans ce cas, il est plus simple de laisser solvep g√©rer les trois termes, 
% ou d'utiliser une fonction comme 'sum_prox' si elle est disponible.

% Alternative : Utiliser DR pour r√©soudre min f1 + f2 (sans f3 pour l'exemple)
% f1 est lisse, mais DR peut quand m√™me la g√©rer en tant que prox.
% param_dr = param;
% param_dr.maxit = 500;
% sol_dr = douglas_rachford(x0, f1, f2, param_dr);
% disp('R√©solu avec Douglas-Rachford (pour f1 + f2).');

## 6\. Conclusion et Ressources 

Vous avez appris √† :

1.  Structurer des fonctions convexes (lisses ou non-lisses) pour UNLocBoX.
2.  Utiliser les concepts cl√©s de **gradient**, de **constante de Lipschitz** et d'**op√©rateur proximal**.
3.  R√©soudre un probl√®me d'optimisation complexe (*Fused Lasso*) √† trois termes √† l'aide de la fonction g√©n√©rique `solvep`.

UNLocBoX offre une flexibilit√© incroyable, permettant d'assembler des briques de fonctions comme des Legos pour cr√©er des probl√®mes d'optimisation sur mesure. R√©f√©rez-vous au guide utilisateur complet pour la liste des op√©rateurs proximaux disponibles (`prox_tv`, `prox_l2`, `prox_positive`, etc.) et des solveurs avanc√©s (Chambolle-Pock, SDMM).