# Проект по Методам Оптимизации
##### Участники: _Вихрев Евгений, Родионов Дмитрий, Гарнов Юрий_

### Проблема

Требуется минимизировать ранг частично заполненой матрицы.

$E \subset N \times N$ - Множество наблюдаемых значений. \
$M \in Mat_{n,m}$ - Наблюдаемые значения (Б.О.О. $n > m$).

$$ \min_X rank(X),\ subject\ to\ X_{i,j} = M_{i,j} \  \  \forall i, j \in E $$
$$\text{Where } X \in Mat_{n,m},\ n > m \ \ \&\ \  r << n$$

Это NP-трудная задача. Но с некоторыми предположения её можно решить с высокой точностью.

In [18]:
import numpy as np
import scipy.stats as sps
import matplotlib.pyplot as plt
from als_minimization import als_minimization
from conv_relax import nuclear_norm_minimalization


In [19]:
def create_case(N=100, M=100, est=1000, mode="norm"):
    if mode == "norm":
        A = np.random.randn(N, M)
    elif mode == "linear":
        A = sps.randint.rvs(low=-10, high=10, size=(N, M))
    mask = sps.bernoulli.rvs(est/(N*M), size=(N, M))
    return A, mask

In [20]:
def test_als(runs=5, K=50, est=1000):
    """
    Dimentions of the test matrix is 100x100.
    """
    epsilon = 1e-6
    mu = 1e-6
    N, M = 100, 100

    rank = np.zeros(K)
    max_distance = np.zeros(K)

    for k in range(1, K + 1):
        local_rank = np.zeros(runs)
        local_max_distance = np.zeros(runs)
        for i in range(runs):
            A, mask = create_case(N, M, est)
            X = als_minimization(A, mask, k=k, mu=mu, epsilon=epsilon)
            local_rank[i] = np.linalg.matrix_rank(X)
            local_max_distance[i] = np.max(np.abs(np.multiply(X, mask) - np.multiply(A, mask)))
        rank[k-1] = local_rank.mean()
        max_distance[k-1] = local_max_distance.mean()

    plt.figure(figsize=(10,5), dpi=100)
    plt.plot(np.arange(0, K), rank, label=r'estimated rank')
    plt.plot(np.arange(0, K), max_distance, label=r'estimated max variation')
    plt.legend()
    plt.show()

    plt.figure(figsize=(10,5), dpi=100)
    plt.plot(np.arange(5, K), max_distance[5:], label=r'estimated max variation')
    plt.legend()
    plt.show()
    

In [1]:
test_als()

NameError: name 'test_als' is not defined

Как мы видим _ранг_ возвращаемой алгоритмом натрицы тождественно равна $k$ до $k \sim 35$, после чего значение стабилизуется.

Также, видим что  $max_{i,j \in E} |X_{i,j}-A_{i,j}|$ - максимальный модуль разности $(>Var(X_{i,j}-A_{i,j}\ \ where\ \ i,j \in E))$, в начале имеет большое значение $\sim 3$, но быстро стабилизируется в нуле. Можно считать, что $\min_X rank(X) = min_k (max\_distance_k \sim 0)$. 

Для матриц из теста это $\sim 8$ или $9$.



# Convex relaxation
**Ядерная форма**

Идея следующая - давайте будем минимизировать не ранк матрицы, а ей ядерную норму.

Если мы приведем матрицу в ядерную форму, то она будет выглядеть следующим образом

$ x = U S V^* = \sum_{i=0}^{n-1} s_i u_i v_i^*$

где $S = diag(s_i)_i$ это диагональная матрица сингулярных значений.

$ s_0 \geq \ldots s_{r-1} &gt; 0 \space and \space
            \forall i \geq r, \: s_i=0 $
            
$where \space r=rank(x)$


**Ядерная норма**

${\displaystyle \|A\|_{*}=\operatorname {trace} \left({\sqrt {A^{*}A}}\right)=\sum _{i=1}^{\min\{m,n\}}\sigma _{i}(A),}$

$\sqrt {A^{*}A}$ - положительная полуопределённая матрица B, т.ч. $BB = AA^*$

Ядерная норма является выпуклой (вниз) оболочкой $rank(x)$ и соответственно $min$
ядерная формы будет совпадать с $min(rank)$


In [21]:
def compare_methods():
    results = [[]]
    N=100
    M=100
    test_count = 1000
    
    A, mask = create_case(N, M)
    print(nuclear_norm_minimalization(A, mask))
    # 
    # for i in range(test_count):
    #     A, mask = create_case(N, M)
    
compare_methods()
        

FATAL: Cannot solve SDPs with > 2x2 matrices without linked blas+lapack libraries
Install blas+lapack and re-compile SCS with blas+lapack libray locations
ERROR: init_cone failure
Failure:could not initialize work


SolverError: Solver 'SCS' failed. Try another solver, or solve with verbose=True for more information.