In [1]:
%matplotlib inline
import itertools

import matplotlib as mpl
import matplotlib.pyplot as plt
import pennylane as qml
from pennylane import numpy as np
from pennylane.templates import BasisEmbedding, AmplitudeEmbedding, AngleEmbedding
from pennylane import QubitStateVector

n_qubits = 5
dev = qml.device('default.qubit', wires=n_qubits)

qml.enable_tape()
mpl.rcParams['figure.dpi'] = 100

# Quantum embedding (Квантовое представление)
- Что такое признаки (features)?
- Quantum feature map
- Основные типы представления

Quantum embedding -- это представление классических данных в виде параметров квантовой схемы-генератора. Состояние на выходе генератора зависит от заданных классических данных.

См. https://arxiv.org/pdf/2001.03622.pdf

Если рассматривать процесс гибридных вычислений в общем, то его можно описать такой схемой:

<img src="https://cfn-live-content-bucket-iop-org.s3.amazonaws.com/journals/2058-9565/4/4/043001/1/qstab4eb5f2_lr.jpg?AWSAccessKeyId=AKIAYDKQL6LTV7YY2HIK&Expires=1619883538&Signature=aL%2BkDaC5TB3WP%2BPQLj0BAJ%2Bter0%3D">

## Что такое признаки?
Признаки (features) -- это числовое представление особенностей объекта. То есть объекту сопоставляется некоторый числовой вектор, который отражает его уникальность. Например, если у нас есть кубы и шары двух разных цветов (синего и красного), то мы можем описать их с помощью двухмерного вектора признаков, если проведем сопоставление $\{0: "шар", 1: "куб"\}$, $\{0: "синий", 1: "красный"\}$. Красный шар будет иметь вектор признаков $\{0, 1\}$.

Помимо дискретных, могут быть непрерывные признаки, например угол поворота или координаты.

Раньше признаки разрабатывали вручную, сейчас зачастую они генерируются с помощью глубоких нейронных сетей.

## Quantum feature map
Quantum feature map -- это преобразование, действующее из пространства классических в пространство квантовых признаков.

## Основные типы представления
### Basis embedding
Классические данные -- битовые строки. Идет сопоставление между битовой строкой и базисным квантовым состоянием вида $"01010"\to |01010\rangle$. Для этого строится кодирующая квантовая схема, переводящая исходное состояние $|0\rangle$ в состояние, соответствующее битовой строке, которая, если $i$-й бит равен 1, действует на $i$-й кубит с помощью операторов $X_i$, переводя его в состояние $|1\rangle$. Если на вход подается набор битовых строк $\{x_1,\dots,x_M\}$, то создается суперпозиционное состояние вида

$$ |X\rangle = \frac{1}{\sqrt{M}}\sum_{m=1}^{M} |x_m\rangle. $$

Таким образом, все дальнейшие квантовые операции проводятся над набором данных параллельно. Для представления $M$ битовых строк размерности $N$ необходимо как минимум $n=N$ кубитов.

Представление отдельной битовой строки

In [2]:
@qml.qnode(dev)
def coding_node(bits, n_qubits=5):
    BasisEmbedding(bits, wires=range(n_qubits))
    return qml.probs(wires=range(n_qubits))

coding_node([0, 1, 1, 0, 0])
print(coding_node.draw())

 0: ─────╭┤ Probs 
 1: ──X──├┤ Probs 
 2: ──X──├┤ Probs 
 3: ─────├┤ Probs 
 4: ─────╰┤ Probs 



Представление массива битовых строк. Для их представления необходим препроцессинг -- преобразование битовых строк в коэффициенты при базисных состояниях. Если базисное состояние соответствует строке, то она включается в состояние с амплитудой $1/\sqrt{M}$, иначе не включается.

При таком способе представления удобно использовать класс **QubitStateVector**, который принимает на вход амплитуды базисных состояний и генерирует на выходе состояние с заданными амплитудами.

In [3]:
@qml.qnode(dev)
def coding_node(bits_data, n_qubits=5):
    QubitStateVector(bits_data, wires=range(n_qubits))
    return qml.probs(wires=range(n_qubits))


def preprocess_data(bits_data):
    str_data = [str(b) for b in bits_data]
    basis = [str(np.tensor(i)) for i in itertools.product([0, 1], repeat=len(bits_data[0]))]
    weights = []
    for b in basis:
        weights.append(int(b in str_data) / np.sqrt(len(bits_data) - 1))
    return np.array(weights)

Создадим набор случайных битовых строк и преобразуем его в амплитуды

In [4]:
N = n_qubits
M = 10
initial_data = [np.random.randint(2, size=5) for i in range(M)]
initial_data = list(filter(lambda b: (int(sum(b)) < N) & (int(sum(b)) > 0), initial_data))
basis_data = preprocess_data(initial_data)
[str(b) for b in initial_data]

['[0 0 0 1 1]',
 '[1 0 1 1 1]',
 '[0 1 1 0 0]',
 '[1 1 0 0 1]',
 '[1 0 0 1 0]',
 '[1 1 0 1 1]',
 '[0 0 0 1 1]']

In [5]:
print(basis_data)

[0.         0.         0.         0.40824829 0.         0.
 0.         0.         0.         0.         0.         0.
 0.40824829 0.         0.         0.         0.         0.
 0.40824829 0.         0.         0.         0.         0.40824829
 0.         0.40824829 0.         0.40824829 0.         0.
 0.         0.        ]


Посмотрим на сгенерированную схему

In [6]:
coding_node(basis_data)
print(coding_node.draw())

 0: ──╭QubitStateVector(M0)──╭┤ Probs 
 1: ──├QubitStateVector(M0)──├┤ Probs 
 2: ──├QubitStateVector(M0)──├┤ Probs 
 3: ──├QubitStateVector(M0)──├┤ Probs 
 4: ──╰QubitStateVector(M0)──╰┤ Probs 
M0 =
[0.         0.         0.         0.40824829 0.         0.
 0.         0.         0.         0.         0.         0.
 0.40824829 0.         0.         0.         0.         0.
 0.40824829 0.         0.         0.         0.         0.40824829
 0.         0.40824829 0.         0.40824829 0.         0.
 0.         0.        ]



### Amplitude embedding
Классические данные -- набор векторов ($x_m\in\mathbb{R}^N$) с целыми или действительными числами. Для представления данных в квантовом виде их выстраивают в одномерный массив $\{x_{m,n}:m=1,\dots,M,n=1,\dots,N\}\to\{x_k:k=m + n=1,\dots,M\cdot N\}$. Массив нормируют на единицу и передают в качестве параметров в квантовую схему, состояние на выходе которой имеет вид:

$$ |X\rangle = \sum_{k=1}^{M\cdot N} x_k|k\rangle $$

Здесь $|k\rangle$ -- базисное состояние в вычислительном базисе. Для представления $M$ векторов размерности $N$ необходимо как минимум $n=\log_2{(MN)}$ кубитов. Если $MN\neq 2^n,n\in\mathbb{N}$, то исходные данные дополняются "неинформативными" константами, например нулями.

В **pennylane** для представления данных в амплитуды есть класс **AmplitudeEmbedding**. Сгенерируем случайные векторные данные. У нас есть 5 кубитов, поэтому $NM\leq 32$.

In [7]:
N = 4
M = 2 ** n_qubits // N
initial_data = [np.random.random_sample((N,)) for i in range(M)]
initial_data

[tensor([0.03801044, 0.61784193, 0.907377  , 0.42514734], requires_grad=True),
 tensor([0.83548585, 0.00666215, 0.28316061, 0.31644644], requires_grad=True),
 tensor([0.26669963, 0.96888439, 0.40367749, 0.88690471], requires_grad=True),
 tensor([0.36860702, 0.03419988, 0.59609737, 0.4548561 ], requires_grad=True),
 tensor([0.79488447, 0.03622038, 0.7470054 , 0.93498491], requires_grad=True),
 tensor([0.60272652, 0.63393735, 0.12249939, 0.01428006], requires_grad=True),
 tensor([0.14200182, 0.29671661, 0.49590334, 0.59363674], requires_grad=True),
 tensor([0.79602024, 0.74328972, 0.2421571 , 0.46290405], requires_grad=True)]

In [8]:
@qml.qnode(dev)
def coding_node(data, n_qubits=5):
    AmplitudeEmbedding(features=data, wires=range(n_qubits), normalize=True)
    return qml.probs(wires=range(n_qubits))

In [9]:
amplitude_data = np.concatenate(initial_data)
coding_node(amplitude_data)
print(coding_node.draw())

 0: ──╭QubitStateVector(M0)──╭┤ Probs 
 1: ──├QubitStateVector(M0)──├┤ Probs 
 2: ──├QubitStateVector(M0)──├┤ Probs 
 3: ──├QubitStateVector(M0)──├┤ Probs 
 4: ──╰QubitStateVector(M0)──╰┤ Probs 
M0 =
[0.01205882 0.19601041 0.28786543 0.13487803 0.26505796 0.00211357
 0.08983273 0.10039266 0.08461048 0.30737866 0.12806672 0.2813706
 0.11694061 0.01084991 0.18911194 0.14430314 0.25217717 0.01149092
 0.23698753 0.29662405 0.19121504 0.20111668 0.03886294 0.00453035
 0.04505009 0.09413337 0.15732538 0.18833131 0.25253749 0.23580873
 0.07682436 0.14685635]



### Angle embedding
Еще один "простой" тип представления. Классические данные -- набор чисел $X=\{x_1,\dots,x_M\}\in\mathbb{R}^M$, и каждое число сопоставляется повороту кубита вокруг одной из трех осей. Например, при повороте вокруг оси $x$, состояние на выходе кодирующей схемы имеет вид:

$$ |X\rangle = \prod_{k=1}^M r_x(x_k)|0_k\rangle$$
Где $|0_k\rangle$ -- основное состояние $k$-го кубита. Для внедрения $M$ числе необходимо как минимум $n=M$ кубитов.

Для этого представления в **pennylane** есть класс **AngleEmbedding**. Создадим набор случайных чисел размерности $M=5$

In [10]:
M = n_qubits
initial_data = np.random.random_sample((M,))
initial_data

tensor([0.31384482, 0.91161775, 0.6870714 , 0.88037818, 0.63925135], requires_grad=True)

In [11]:
@qml.qnode(dev)
def coding_node(data, n_qubits=5):
    AngleEmbedding(features=data, wires=range(n_qubits))
    return qml.probs(wires=range(n_qubits))

In [12]:
coding_node(initial_data)
print(coding_node.draw())

 0: ──RX(0.314)──╭┤ Probs 
 1: ──RX(0.912)──├┤ Probs 
 2: ──RX(0.687)──├┤ Probs 
 3: ──RX(0.88)───├┤ Probs 
 4: ──RX(0.639)──╰┤ Probs 

