# Introdução

* Redes neurais artificiais: classe de modelos computacionais para reconhecimento de padrões
* Redes neurais físicsa: redes neurais implementadas em um hardware dedicado.
* Computadores quânticos levam a um aumento exponencial no armazenamento e poder de processamento
* Modelos mais simples são a base.
  * Modelo mais simples: McCulloch e Pitts (1943)
  * Depois: Rosenblatt (1957)
* "qubit neuron": Implementação de perceptrons em computador quântico, onde cada qubit atua como um neurônio individual.
* Artigo propõe um perceptron de Rosenblatt para computadores quânticos.
* O equivalente aos vetores clássicos de entrada e pesos de dimensão é codificado no hardware quântico usando N bits.
  * $m=2^{N}$



# Resultados

* Circuito quântico é modelado como um perceptron clássico.
* As entradas e pesos dos vetores são limitados a valores binários:
  * $i_{j},w_{j}\in\left\{ -1,1\right\} $
  * Como os neurônios de McCulloch-Pitts
* Um vetor de entrada com dimensão m é codificado usando m coefficientes necessários para gerar uma função de onda $\left|\psi_{i}\right\rangle $ de N qubits.
  * Na prático para um valor de entrada qualquer $\left(\overrightarrow{i}\right)$ e peso um vetor peso $\left(\overrightarrow{w}\right)$:
  
\begin{equation}
\overrightarrow{i}=\left(\begin{array}{c}
i_{0}\\
i_{1}\\
i_{m-1}
\end{array}\right)\qquad\overrightarrow{w}=\left(\begin{array}{c}
w_{0}\\
w_{1}\\
w_{m-1}
\end{array}\right)
\end{equation}

E como os valores são binários e precisamos que a probabilidade de encontrarmos o estado em qualquer sistema seja um, temos então as seguintes equações de estado

\begin{equation}
\left|\psi_{i}\right\rangle =\frac{1}{\sqrt{m}}\sum_{j=0}^{m-1}i_{j}\left|j\right\rangle \qquad\left|\psi_{w}\right\rangle =\frac{1}{\sqrt{m}}\sum_{j=0}^{m-1}w_{j}\left|j\right\rangle 
\end{equation}

Pois por exemplo para as entradas:
\begin{equation}
P\left(\psi_{i}\right)=\sum_{j=0}^{m-1}\left(\frac{i_{j}}{\sqrt{m}}\right)^{2}=\frac{m}{m}=1
\end{equation}

As bases computacionais do processo quântico se são as bases no espaço de Hilbert dos N qubits, que corresponde a todas possibilidades de estados dos qubits é $\left|j\right\rangle \in\left\{ \left|00\dots00\right\rangle ,\left|00\dots01\right\rangle ,\dots,\left|11\dots11\right\rangle \right\} $.

O primeiro passo  é preparar o estado $\left|\psi_{i}\right\rangle $ codificando  as entradas em $\overrightarrow{i}$. Assumindo que o estado é inicializado no estado $\left|0\right\rangle$, vamos uma transformação unitária de modo que:

\begin{equation}
U_{i}\left|0\right\rangle =\left|\psi_{i}\right\rangle 
\end{equation}
  
Qualquer matriz tendo $\overrightarrow{i}$ na primeira colune pode ser usado. 
* Matriz unitária: $U^{\dagger}U=UU^{\dagger}=\mathbb{I}_{n}$
  * $U^{\dagger}=U^{-1}$
  
Por exemplo, para um vetor de entrada $\overrightarrow{i}=\left(\begin{array}{cccc}
+1 & -1 & -1 & +1\end{array}\right)^{T}$, propomos a matriz unitária:

\begin{equation}
U_{i}=\left(\begin{array}{cccc}
+1 & +1 & +1 & -1\\
-1 & +1 & +1 & +1\\
-1 & -1 & +1 & -1\\
+1 & -1 & +1 & +1
\end{array}\right)
\end{equation}

E sendo:
\begin{equation}
\left|0\right\rangle =\left(\begin{array}{c}
1\\
0\\
0\\
0
\end{array}\right)
\end{equation}

No espaço com as bases $b=\left(\begin{array}{cccc}
\left|00\right\rangle  & \left|01\right\rangle  & \left|10\right\rangle  & \left|11\right\rangle \end{array}\right)^{T}$

In [31]:
import numpy as np                         # Biblioteca de funções matemáticas

m=4              # Dimensão
i=[1,-1,-1,1]    # Nosso vetor i
w=[1,1,-1,-1]     # Nosso vetor w

# Matriz identidade:
I=np.array([[1,0,0,0],
           [0,1,0,0],
           [0,0,1,0],
           [0,0,0,1]])

# Definmos nossa matriz
Ui=np.array([ [i[0], +1, +1, -1], 
              [i[1], +1, +1, +1],
              [i[2], -1, +1, -1],
              [i[3], -1, +1, +1]])/np.sqrt(m)

#Confirmamos se é unitária:
A=Ui.dot(Ui.transpose().conjugate()) 
B=Ui.transpose().conjugate().dot(Ui)

print((A==I).all() and  (B==I).all())

# O estado inicial
e0 = np.array([[1], 
              [0],
              [0],
              [0]])

pi=Ui.dot(e0)

print(pi)  # Vetor de estado do nosso sistema


True
[[ 0.5]
 [-0.5]
 [-0.5]
 [ 0.5]]


* **Observação**: As portas são construídas com matrizes unitáris porque elas não alteram o tamanho de um vetor. E o vetor de estado deve ter sempre tamanho 1.

O próximo passo é então calcular o produto interno entre $\overrightarrow{w}$ e $\overrightarrow{i}$. 

Por exemplo, se nosso vetor peso é $\overrightarrow{w}=\left(\begin{array}{cccc}
1 & 1 & -1 & -1\end{array}\right)^{T}$. Então nosso estado é: 

\begin{equation}
\left|\psi_{w}\right\rangle =\frac{1}{\sqrt{4}}\left(\left|0\right\rangle +\left|1\right\rangle -\left|2\right\rangle -\left|3\right\rangle \right)
\end{equation}

Ou em notação vetorial:

\begin{equation}
\left|\psi_{w}\right\rangle =\frac{1}{2}\left(\begin{array}{c}
1\\
1\\
-1\\
-1
\end{array}\right)
\end{equation}

Então vamos definir uma matriz unitária, deforma análoga ao caso anterior, mas com o estado inicial do sistema um pouco diferente: $u_{w}\left|m-1\right\rangle =\left|\psi_{w}\right\rangle $

Isso é dado para uma matriz unitária qualquer em que a última coluna seja $\overrightarrow{w}$. Temos então:

\begin{equation}
u_{w}=\left(\begin{array}{cccc}
-1 & +1 & +1 & +1\\
-1 & -1 & +1 & +1\\
-1 & -1 & -1 & -1\\
+1 & -1 & +1 & -1
\end{array}\right)
\end{equation}


In [32]:
# Definimos nossa matriz
uw=np.array([ [-1, +1, -1, w[0]], 
              [-1, -1, +1, w[1]],
              [-1, -1, -1, w[2]],
              [-1, +1, +1, w[3]]])/np.sqrt(4)

#Confirmamos se é unitária:
A=uw.dot(uw.transpose().conjugate()) 
B=uw.transpose().conjugate().dot(uw)

print((A==I).all() and  (B==I).all())

# O estado inicial
e3 = np.array([[0], 
              [0],
              [0],
              [1]])

print(uw.dot(e3))  # Vetor de estado do nosso sistema

True
[[ 0.5]
 [ 0.5]
 [-0.5]
 [-0.5]]


Então como é unitária:

\begin{equation}
u_{w}^{\dagger}u_{w}\left|m-1\right\rangle =u_{w}^{\dagger}\left|\psi_{w}\right\rangle 
\end{equation}

\begin{equation}
u_{w}^{\dagger}\left|\psi_{w}\right\rangle =\left|m-1\right\rangle 
\end{equation}

E como possui apenas números reais:
\begin{equation}
u_{w}^{T}\left|\psi_{w}\right\rangle =\left|m-1\right\rangle 
\end{equation}

Como vamos trabalhar principalmente com $u_{w}^{T}$, vamos renomear $U_{w}=u_{w}^{T}$. Então a primeira equação importante que temos é que:

\begin{equation}
U_{w}\left|\psi_{w}\right\rangle =\left|m-1\right\rangle 
\end{equation}

Agora se aplicamos $U_{w}$ a $\left|\psi_{i}\right\rangle$ ainda devemos ser capazes de escrever nosso vetor em termos da nossa base, isto é:

\begin{equation}
U_{w}\left|\psi_{i}\right\rangle =U_{w}U_{i}\left|0\right\rangle =\sum_{j=0}^{m-1}c_{j}\left|j\right\rangle 
\end{equation}

Então agora estamos prontos pra calcular o produto escalar $\left(\left|\psi_{w}\right\rangle ,\left|\psi_{i}\right\rangle \right)$. Pela linearidade do segundo argumento:

\begin{equation}
\left(\left|\psi_{w}\right\rangle ,\left|\psi_{i}\right\rangle \right)=\mathbb{I}\left(\left|\psi_{w}\right\rangle ,\left|\psi_{i}\right\rangle \right)
\end{equation}

\begin{equation}
=U_{w}^{\dagger}U_{w}\left(\left|\psi_{w}\right\rangle ,\left|\psi_{i}\right\rangle \right)
\end{equation}

\begin{equation}
=\left(U_{w}\left|\psi_{w}\right\rangle ,U_{w}\left|\psi_{i}\right\rangle \right)
\end{equation}

Então a partir das equações que calculamos:

\begin{equation}
=\left(\left|m-1\right\rangle ,\sum_{j=0}^{m-1}c_{j}\left|j\right\rangle \right)
\end{equation}

\begin{equation}
=\sum_{j=0}^{m-1}c_{j}\left\langle m-1|j\right\rangle 
\end{equation}

E como $\delta_{m-1,j}$, então:

\begin{equation}
\left\langle \psi_{w}|\psi_{i}\right\rangle =c_{m-1}
\end{equation}

Temos duas interpretações disso. O artigo aborda que se olharmos as definições, podemos notar que:

\begin{equation}
\left\langle \psi_{w}|\psi_{i}\right\rangle =\frac{\left\langle w|i\right\rangle }{m}
\end{equation}

Mas aqui talvez tenhamos algo mais interessante. Temos que:

\begin{equation}
U_{i}\left|0\right\rangle =\left|\psi_{i}\right\rangle 
\end{equation}

$\left|\psi_{i}\right\rangle $ é basicamente nosso vetor de entrada $\overrightarrow{i}$ com a probabilidade normalizada ($\overrightarrow{i}=\sqrt{m}\left|\psi_{i}\right\rangle $). Então quando fazemos:

\begin{equation}
U_{w}\left|\psi_{i}\right\rangle =\left|\phi_{i,w}\right\rangle 
\end{equation}

Sendo que nossa última linha de $U_{w}$ é o nosso vetor peso com a probabilidade também normalizada, então o último elemento do vetor resultante vai ser o produto interno entre $\overrightarrow{i}$ e $\overrightarrow{w}$ dividido por $m$.

\begin{equation}
\left(\left|\phi_{i,w}\right\rangle \right)_{m-1}=\frac{\left\langle w|i\right\rangle }{m}
\end{equation}

\begin{equation}
\left\langle m-1|\phi_{i,w}\right\rangle =\frac{\left\langle w|i\right\rangle }{m}
\end{equation}

O que demonstramos matematicamente.

Então nosso produto interno entre $\overrightarrow{i}=\left(\begin{array}{cccc}
+1 & -1 & -1 & +1\end{array}\right)^{T}$ e $\overrightarrow{w}=\left(\begin{array}{cccc}
1 & 1 & -1 & -1\end{array}\right)^{T}$ é $\overrightarrow{i} \cdot \overrightarrow{w} = 1 -1 +1 -1 =0$.

In [33]:
Uw=uw.transpose()          # Definimos nossa matriz Uw com a transposta de uw
c=Uw.dot(Ui.dot(e0))[m-1]  # Fazemos as operações Uw.Ui.e e pegamos o elemento (m-1)
print(c*m)                 # printamos o elemento

[0.]


Vamos usar um bit auxiliar ($a$), inicialmente no estado $\left|0\right\rangle $. Então usamos uma porta NOT multi controlado entre os $N$ bits e o bit alvo $a$, que leva a :

\begin{equation}
\left|\phi_{i,w}\right\rangle \left|0\right\rangle \rightarrow\sum_{j=0}^{m-2}c_{j}\left|0\right\rangle _{a}+c_{m-1}\left|m-1\right\rangle \left|1\right\rangle _{a}
\end{equation}

Como o nome sugere, é como uma extensão do cNOT para 2 qubits, ou a porta de Toffoli (ccNOT) para 3 bits. Isto é, se todos os bits de controle (nosso $N$ bits) forem $\left|1\right\rangle $, ele inverte o bit alvo (nosso $a$, inicialmente em $\left|0\right\rangle $).

Então precisamos apenas medir o estado do qubit auiliar na base computacional que produz a saída $\left|1\right\rangle _{a}$, com a probabilidade $\left|c_{m-1}\right|^{2}$.

* **Observação**: enquanto o perceptron clássico só pode ser empregado como um classificador linear, aparentemente o quantum não.

### Implementação das transformações unitárias