# Implémentation de Coordinate Descent
---
**Aymen.B**

Je me repose sur l'article *"Coordinate Descent Algorithms"* de **Stephen J. Wright**

## Formulation du problème

On cherche à résoudre un problème de cette forme :

$$\min_xh(x):=f(x)+\lambda\Omega(x),$$

- $f:\mathbb{R}^n\to\mathbb{R}$ doit être continue lisse.
- $\Omega:\mathbb{R}^n\to\mathbb{R}$ est la fonction de pénalisation, non lisse mais séparable.
  - $\Omega(x)=\sum_{i=1}^n\Omega_i(x_i)$ avec $\Omega_i:\mathbb{R}\to\mathbb{R}$ pour tout $i$.
- $\lambda > 0$

## CD (Coordinate Descent)

### Théorie

L'idée est de mettre à jour une seule coordonnée $x_i$ à la fois. À chaque itération $k$, on choisit un indice $i_k \in [{1, \ldots, n}]$, et on résout le problème unidimensionnel :

$$x_{i_k}^{k+1}=\arg\min_{\chi\in\mathbb{R}}\left\{f(x^k)+\nabla f(x^k)_i(\chi-x_i^k)+\frac{1}{2\alpha_k}(\chi-x_i^k)^2+\lambda\Omega_i(\chi)\right\}.$$

Ceci correspond à un développement de Taylor à l’ordre 1 de $f$ autour de $x^k$ en la direction $i$, régularisé par un terme quadratique. On utilise ici une condition de Lipschitzianité du gradient selon $x_i$. Ce qui fais intervenir une constante $L_i$ telle que:

$$|\nabla f(x+te_i)_i-\nabla f(x)_i|\leq L_i|t|$$

On note $\alpha_k = 1 / L_i$

On obtiens donc la mise à jour suivante :

$$x^{k+1} = x^k + (z^k_{i_k} - x^k_{i_k})e_{i_k}$$

avec

$$z^k_{i_k} := \arg\min_{\chi} \left\{ \nabla f(x^k)_{i_k}(\chi - x^k_{i_k}) + \frac{1}{2\alpha_k}(\chi - x^k_{i_k})^2 + \lambda\Omega_{i_k}(\chi) \right\}$$

Or on remarque que :

$$z^k_{i_k} = \text{prox}_{\lambda\alpha_k\Omega_{i_k}}\left(x^k_{i_k} - \alpha_k \nabla f(x^k)_{i_k}\right)$$

avec 

$$\mathrm{prox}_{\gamma g}(z):=\arg\min_{x\in\mathbb{R}^n}\left\{\frac{1}{2\gamma}\|x-z\|^2+g(x)\right\}$$


### Algorithme

$$ \boxed{ \begin{array}{ll} 
\textbf{Coordinate Descent Algorithm} \\
\\
\textbf{Step 0.} & \text{Take } x^0 \in \mathbb{R}^n \text{ and set } k \leftarrow 0. \\
\\
\textbf{Step k.} & \text{Repeat until convergence:} \\
& \quad \text{Choose index } i_k \in \{1, 2, \ldots, n\} \\
& \quad z^k_{i_k} \leftarrow \text{prox}_{\lambda\alpha_k\Omega_{i_k}}\left(x^k_{i_k} - \alpha_k \nabla f(x^k)_{i_k}\right) \\
& \quad x^{k+1} \leftarrow x^k + (z^k_{i_k} - x^k_{i_k})e_{i_k} \\
& \quad k \leftarrow k + 1
\end{array} } $$

In [None]:
from linear_tools import cd