Евклидова проекция на $\tau$-симплекс (стандартный симплекс, если $\tau=1$).

<img src="https://upload.wikimedia.org/wikipedia/commons/thumb/3/38/2D-simplex.svg/150px-2D-simplex.svg.png">

\begin{gather}
\underset{x}{\text{min}} & \frac{1}{2} \|x - y\|^2 \\
\text{s.t.} & 1^Tx = \tau\\
& x_k \geq 0 \\
\end{gather}

Лагранжиан:

$L(x, \lambda, \nu) = \frac{1}{2} \|x - y\|^2 - \lambda^Tx + \nu(1^Tx - \tau)$

Условия Каруша-Куна-Таккера:

\begin{gather}
\nabla_x L(x, \lambda, \nu) = x - y - \lambda + \nu1 = 0\\
\lambda_k x_k = 0\\
1^Tx = \tau \\
x_k \geq 0 \\
\lambda_k \geq 0 \\
\end{gather}

Для ненулевых $x_k$ будет выполнять равенство $\lambda_k = 0$. Следовательно $x_k = y_k  - \nu \geq 0$ и $\sum_k (y_k - \nu) = \tau$.

In [1]:
import numpy as np
import matplotlib.pyplot as plt
from numpy.linalg import norm

In [4]:
from utils.simplex_projection import euclidean_proj_simplex

In [5]:
def proj_simplex(x, s=1):
    dim = len(x)
    x_sorted = np.sort(x)[::-1]
    ind = np.arange(dim) + 1
    x_cum = np.cumsum(x_sorted)
    cond = (x_sorted - (x_cum - s)/ind) > 0
    n = ind[cond][-1]
    nu = 1./n*(x_cum[n-1] - s)
    return np.clip(x - nu, 0, np.inf)

In [7]:
from scipy.linalg import norm

dim = 100

for i in range(50):
    x = np.random.rand(dim,)    
    xp = proj_simplex(x)    
    xp_ = euclidean_proj_simplex(x)    
    d = norm(xp - xp_)/norm(xp)
    assert(d < 1e-8)
