# Задача

В рамках данной задачи предстоит научиться получать наилучшее приближение $\sigma\in\mathbb{C}^n$ истинного квантового состояния $\rho\in\mathbb{C}^n$ по некоторой обучающей выборке $X_{train}=\{E_m,y_m\}_{m=0}^{N}$, где $E_m$ - некоторая матрица (называемая оператор, проектор), $y_m$ - некоторое наблюдение (проекция истинного состояния $\rho$ на этот оператор). 

В качестве оптимизируемого функционала предлагается минимизировать следующую функцию:
$$min_\sigma[f(\sigma)=\Sigma_m(Tr(E_m\sigma)-Tr(E_m\rho))^2=\Sigma_m(Tr(E_m\sigma)-y_m)^2]$$
$$\sigma\geq0,Tr(\sigma)=1$$
гдe $\sigma\geq0$ означает положительную полуопределённость обучаемой матрицы $\sigma$ 

# Решение

Поскольку матрица $\sigma$ - положительно полуопределённая, сделаем разложение Холецкого: $\sigma=M^*M$. 

Тогда 
$$Tr(\sigma)=Tr(M^*M)=\Sigma_{a_m\in M} a_m^*a_m=\Sigma_{a_m\in M} |a_m|^2$$

Поскольку для любой положительно полуопределённой матрицы существует разложение Холецкого, и, наоборот, для любой матрицы $M\in\mathbb{C}^n$ матрица $M^*M$ является положительно полуопределённой, мы можем переписать оптимизационную задачу в виде

$$min_M[f(M)=\Sigma_m(Tr(E_mM^*M)-y_m)^2]$$
$$Tr(M^*M)=\Sigma_{a_m\in M}|a_m|^2=1$$

Эту задачу можно было бы решать обычным методом множителей Лагранжа, но можно просто перенормировать $M$ на $\sqrt{Tr(M^*M)}$. Тогда задача сведётся к задаче безусловной оптимизации

$$min_M[f(M)=\Sigma_m(Tr(E_m\frac{M^*M}{Tr(M^*M)})-y_m)^2=\Sigma_m(Tr(E_m\frac{M^*M}{\Sigma_{a_m\in M}|a_m|^2})-y_m)^2]$$

# Код

## Генерация датасета

In [1]:
import numpy as np
import simulator
rho = np.array([[1., 0.], [0., 0.]]) # target state
dim = rho.shape[0]
projectors_cnt = 10
measurements_cnt = 100
train_size = projectors_cnt * measurements_cnt
train_X, train_y = simulator.generate_dataset(rho, projectors_cnt, measurements_cnt)

## Обучение модели

In [6]:
import torch
import sys
sys.path.append('pytorch-complex-tensor/')
from pytorch_complex_tensor import ComplexTensor
M = ComplexTensor(simulator.randomMixedState(rho.shape[0]))
M.requires_grad = True

In [None]:
from torch.optim import SGD
opt = SGD([M], lr=1e-1)
epoches = 1000
def trace(tensor):
    return sum([tensor[i:i+1,i:i+1] for i in range(tensor.shape[0])])

for epoch in range(epoches):
    sigma = M.t(conjugate=True).mm(M)
    norm = trace(sigma).real.sum()

    loss = 0
    for E_m,y_m in zip(train_X, train_y.astype('float64')):
        E_m = ComplexTensor(E_m)
        loss += ((trace(E_m.mm(sigma)/norm)-y_m)**2).sum()
    loss /= train_size
    loss.backward()
    opt.step()
    opt.zero_grad()
    print(f'Epoch: {epoch}, Loss: {loss.detach().cpu().numpy()}')

In [17]:
sigma = sigma/norm
sigma = sigma.detach().numpy()[:dim] + 1j*sigma.detach().numpy()[dim:]
sigma

array([[0.9615571 +0.j        , 0.11540203-0.15377726j],
       [0.11540203+0.15377726j, 0.03844294+0.j        ]], dtype=complex64)

In [35]:
simulator.isDensityMatrix(sigma)

True