# Qiskit Fall Fest Argentina 2025

<div style="display: flex; align-items: flex-start;">
    <a href="https://qiskit.org/events/fall-fest/">
      <img src="Images/qff_100.png" alt="Alt Text" width="500" height="350" style="margin-right: 500px;" />
    </a>
    <div>
            El Qiskit Fall Fest es una serie de eventos de cómputo cuántico en los campus universitarios de todo el mundo. Cada evento 
            de Fall Fest es organizado y dirigido por los estudiantes en cada campus, con el apoyo de IBM Quantum. Los líderes 
            estudiantiles trabajan junto a IBM para diseñar y planificar su evento, que se lleva a cabo en octubre y noviembre. Cada 
            evento es independiente, diseñado exclusivamente para los estudiantes de ese campus en particular. Los eventos varían desde 
            hackatones técnicos hasta desafíos amigables para principiantes, todos con el objetivo de ayudar a desarrollar las 
            habilidades de la comunidad local.
  </div>
</div>

---

Presentador: **Pablo Conte**

<div style="display: flex; align-items: flex-start;">
  <a href="https://www.linkedin.com/in/pablo-conte">
    <img src="Images/pablo_pic.jpg" alt="Alt Text" width="200" height="300" style="margin-right: 400px;" />
  </a>
  <div>
  
    - Argentino. 37 años.
    - Ingeniero Químico (Universidad Nacional de Mar del Plata - UNMdP, Argentina)
    - Especialista en Producción de Petróleo y Gas (Insituto Tecnológico de Buenos Aires - ITBA, Argentina)
    - Científico de Datos (Colegio de Matemáticas Bourbaki, México)
    - Master Science en Computación y Tecnologías Cuánticas (Democritus University of Thrace, Grecia)
    - PhD Candidate UPatras (University of Patras)
  
    Quantum Highlights:
    - Linkedin AI & Algorithms Top Voice 2023
    - Quantum Excellence Advanced Bagde - Qiskit Global Summer School 2023-2024-205
    - Obtained QWorld 2023 Bronze, Silver, Nickel, Zinc, Mercury Diplommas 
    - Collaborative-Mentor Prize Winner at Womanium Quantum Scholarship 2023
    - Advanced Badge IBM Quantum Fall Challenge 2023
    - 1st place at Xanadu Open Hackaton QHack 2023 sponsored by Atom Computing - Top 18th Scored Xanadu Closed QHack 2023
    - Top 15th Scored en MIT IQuHack 2023
    - Top Ten Scored en IBM Quantum Fall Challenge 2022 - Advanced Badge IBM Quantum Fall Challenge 2022
    - Participante Escuela Computación Cuántica en Español Qiskit Fall Fest 2022
  </div>
</div>

---
## Agenda

1) Introducción al álgebra lineal:
* 1.1) Espacios Vectoriales y vectores
* 1.2) Matrices y sus operaciones
* 1.3) Conjuntos generadores, dependencia lineal y bases de un espacio vectorial
* 1.4) Espacios de Hilbert, notacion de Dirac, ortonormalidad y producto interno
* 1.5) Producto externo y tensorial
* 1.6) Autovectores y Autovalores
* 1.7) Matrices Exponenciales

2) Introducción a la computación cuántica:
* 2.1) Bits Cuánticos
* 2.2) Representación de un Qubit
* 2.3) Postulados de la mecánica cuántica aplicados a la computación cuántico
* 2.4) Mediciones y generalidades
* 2.5) Compuertas cuánticas simples
* 2.6) Compuertas cuánticas compuestas


---
## 1. Introducción al álgebra lineal

El álgebra lineal es el lenguaje de la computación cuántica. 
Por lo tanto, es crucial desarrollar una buena comprensión de los conceptos matemáticos básicos sobre los que se basa el álgebra lineal, para poder llegar a muchas de las construcciones sorprendentes e interesantes que se observan en la computación cuántica. 

El objetivo de esta sección es crear una base de conocimiento introductorio de álgebra lineal, sobre la cual podamos desarrollar durante nuestro estudio de la computación cuántica.

### 1.1 Espacios vectoriales y vectores

Comenzaremos nuestra investigación sobre la introducción al álgebra lineal analizando primero una de las cantidades matemáticas más importantes en la computación cuántica: el vector.

Formalmente, un **vector** $\mathit{|v\rangle}$ se define como elementos de un conjunto conocido como espacio vectorial. 

Una definición más intuitiva y geométrica es que un vector "es una cantidad matemática con dirección y magnitud". 

Por ejemplo, consideremos un vector con componentes $\mathit{x}$ e $\mathit{y}$ de la forma $\mathbf{(3 \space \space 5)}$. Este vector se puede visualizar como una flecha que apunta en la dirección de $\mathbf{3}$ unidades a lo largo del eje $\mathit{x}$ y $\mathbf{5}$ unidades a lo largo del eje $\mathit{y}$:

<div style="display: flex; align-items: flex-start;">
      <img src="Images/meme.jpg" alt="Alt Text" width="300" height="350" style="margin-right: 500px;" />
</div>

In [None]:
from matplotlib import pyplot as plt

In [None]:
plt.figure()
ax = plt.gca()
ax.quiver([3], [5], angles='xy', scale_units='xy', scale=1)
ax.set_xlim([-1, 10])
ax.set_ylim([-1, 10])
plt.grid()
plt.show()

En la computación cuántica, a menudo tratamos con **vectores de estado** , que son simplemente vectores que apuntan a un punto específico en el espacio que corresponde a un estado cuántico particular. 

Esto se puede visualizar usando una esfera de Bloch. Por ejemplo, un vector que represente el estado de un sistema cuántico podría parecerse a esta flecha, encerrada dentro de la esfera de Bloch, que es el llamado **"espacio de estados"** de todos los puntos posibles a los que nuestros vectores de estado pueden "apuntar":

In [None]:
from qiskit.visualization import plot_bloch_vector

In [None]:
plot_bloch_vector([1, 0, 0]) #coordenadas cartesianas (x,y,z)

Este estado particular corresponde a una superposición uniforme entre $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$ (la flecha está a medio camino entre $\mathbf{|0\rangle}$ en la cima y $\mathbf{|1\rangle}$ en la parte inferior de la esfera). 

Nuestros vectores pueden girar en cualquier lugar de la superficie de la esfera, y cada uno de estos puntos representa un estado cuántico diferente.

In [None]:
plot_bloch_vector([0, 1, 0])

In [None]:
plot_bloch_vector([0, 0, 1])

#### 1.1.1 Definición formal

Revisemos nuestra definición más formal de vector: **un vector es un elemento de un espacio vectorial**. 

Ahora debemos definir un espacio vectorial: 

Un **espacio vectorial** $\mathbf{V}$ sobre un **campo** $\mathbf{F}$ es un conjunto de objetos (vectores), donde se cumplen dos condiciones: 

* En primer lugar, la **suma vectorial** de dos vectores $\ket{a}, \ket{b} \in V$ dará lugar a un tercer vector $\ket{a} + \ket{b} = V$, también contenido en $\mathbf{V}$. 

* La segunda condición es que la **multiplicación escalar** entre algunos vectores $\ket{a} \in V$ y algún escalar $\mathbf{n \in F}$, denotado por $n\ket{a}$, también está contenido dentro de $\mathbf{V}$.

**Campo:** Un campo es un conjunto de elementos con dos operaciones, suma y multiplicación, que satisfacen propiedades algebraicas específicas. Los campos se utilizan principalmente como estructuras algebraicas para definir operaciones aritméticas en conjuntos de números. Son la base del álgebra y son esenciales en diversas áreas matemáticas y científicas. Los elementos de un campo suelen ser números, que pueden ser números reales (en el caso de un campo como $\mathbb{R}$) o números complejos (en el caso de $\mathbb{C}$). Los campos también pueden estar formados por otros elementos que satisfacen los axiomas de campo. En resumen, los campos son estructuras algebraicas utilizadas para definir números y sus propiedades aritméticas, mientras que los espacios vectoriales son estructuras matemáticas utilizadas para estudiar operaciones vectoriales y combinaciones lineales. Los espacios vectoriales suelen definirse sobre campos, y las propiedades del campo influyen en el comportamiento del espacio vectorial. Tanto los campos como los espacios vectoriales son fundamentales en matemáticas y tienen diversas aplicaciones en diferentes ámbitos.

In [None]:
plt.figure()
ax = plt.gca()
ax.quiver([3*10], [5*10], angles='xy', scale_units='xy', scale=1)
ax.set_xlim([-1, 100])
ax.set_ylim([-1, 100])
plt.grid()
plt.show()

Aclararemos esta definición anterior trabajando con un ejemplo básico. 

Demostremos que el conjunto $\mathbb{R}^2$ sobre el campo $\mathbb{R}$ es un espacio vectorial. Afirmaremos que:

$\begin{bmatrix} x_1 \\ y_1 \end{bmatrix} + \begin{bmatrix} x_2 \\ y_2 \end{bmatrix} = \begin{bmatrix} x_1 + x_2 \\ y_1 + y_2 \end{bmatrix}$



está contenido dentro de $\mathbb{R}^2$. 

Este es evidentemente el caso, ya que la suma de dos números reales es un número real, lo que hace que ambos componentes del vector recién formado sean números reales; por lo tanto, el vector está contenido en $\mathbb{R}^2$ por definición. 

In [None]:
plt.figure()
ax = plt.gca()
ax.quiver([3+5], [5+9], angles='xy', scale_units='xy', scale=1)
ax.set_xlim([-1, 20])
ax.set_ylim([-1, 20])
plt.grid()
plt.show()

También afirmaremos que:

\begin{align*}
n \ket{v} &= \begin{bmatrix}
nx \\
ny
\end{bmatrix} \in V
&\forall n \in \mathbb{R}
\end{align*}

Esto también es cierto, ya que el producto de un número real y un número real es un número real, lo que hace que todo el nuevo vector sea real y, por lo tanto, prueba esta afirmación.

In [None]:
plt.figure()
ax = plt.gca()
ax.quiver([3*10], [5*10], angles='xy', scale_units='xy', scale=1)
ax.set_xlim([-1, 100])
ax.set_ylim([-1, 100])
plt.grid()
plt.show()

---

### 1.2 Matrices y sus operaciones

Dirijamos nuestra atención a otro concepto fundamental: una **matriz**. 

Las matrices son objetos matemáticos que transforman vectores en otros vectores:

\begin{align*}
\ket{v} & \mapsto \ket{v'} = M \ket{v}
\end{align*}

Generalmente, las matrices se escriben como "arreglos" de números, con un aspecto similar a este:

\begin{align*}
M =
\begin{bmatrix}
1 & -2 & 3 \\
1 & 5i & 0 \\
1+i & 7 & -4
\end{bmatrix}
\end{align*}

Podemos "aplicar" una matriz a un vector realizando una multiplicación de matrices. 

En general, la multiplicación de matrices entre dos matrices implica tomar la primera fila de la primera matriz y multiplicar cada elemento por su "compañero" en la primera columna de la segunda matriz (el primer número de la fila se multiplica por el primer número de la columna, segundo número de la fila y segundo número de la columna, etc.). La suma de estos nuevos números se convierte en el primer elemento de la primera fila de la nueva matriz. Para completar el resto de la primera fila, repetimos este proceso para la segunda, tercera, etc., columnas de la segunda matriz. 

Luego tomamos la segunda fila de la primera matriz y repetimos el proceso para cada columna de la segunda matriz, para producir la segunda fila. 

Realizamos este proceso hasta haber utilizado todas las filas de la primera matriz. La matriz resultante es nuestra nueva matriz. 

Aquí hay un ejemplo:

$\begin{bmatrix} 2 & 0 \\ 5 & -1 \end{bmatrix} \cdot \begin{bmatrix} -3 & 1 \\ 2 & 1 \end{bmatrix} = \begin{bmatrix} 2 \cdot (-3) + 0 \cdot 2 & 2 \cdot 1 + 0 \cdot 1 \\ 5 \cdot (-3) + (-1) \cdot 2 & 5 \cdot 1 + (-1) \cdot 1 \end{bmatrix} = \begin{bmatrix} -6 & 2 \\ -17 & 4 \end{bmatrix}$ 


Para realizar un cálculo cuántico, tenemos algún **vector de estado cuántico** que manipulamos aplicando una matriz a ese vector. 

Un vector es simplemente una matriz con una columna. Por lo tanto, para aplicar una matriz a un vector, seguimos el mismo procedimiento de multiplicación de matrices descrito anteriormente. 

Yendo al punto que nos interesa, manipulamos qubits en nuestra computadora cuántica aplicando secuencias de **compuertas cuánticas**. 

Cada compuerta cuántica se puede expresar como una matriz que se puede aplicar a vectores de estado, cambiando así el estado. Por ejemplo, una compuerta cuántica que se ve comúnmente es la compuerta de **Pauli-X**, que está representada por la siguiente matriz:

\begin{align*}
\sigma_x = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}
\end{align*}

Esta compuerta actúa de manera similar a la clásica compuerta **NOT** lógica. 

Mapea el estado de la base computacional $\ket{0}$ a $\ket{1},$ y $\ket{1}$ a $\ket{0},$ ("voltea" el estado). 

Escribimos los dos estados básicos como vectores columna:

\begin{align*}
\ket{0} = \begin{bmatrix} 1 \\ 0 \end{bmatrix} \space \space \space \ket{1} = \begin{bmatrix} 0 \\ 1 \end{bmatrix}
\end{align*}

Cuando aplicamos esta matriz a cada uno de los vectores:

\begin{align*}
\sigma_x |0\rangle &= \sigma_x \begin{bmatrix} 1 \\ 0 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 1 \\ 0 \end{bmatrix}
= \begin{bmatrix} 0 \cdot 1 + 1 \cdot 0 \\ 1 \cdot 1 + 0 \cdot 0 \end{bmatrix}
= \begin{bmatrix} 0 \\ 1 \end{bmatrix}
= \ket{1}
\end{align*}

\begin{align*}
\sigma_x |1\rangle &= \sigma_x \begin{bmatrix} 0 \\ 1 \end{bmatrix}
= \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} \begin{bmatrix} 0 \\ 1 \end{bmatrix}
= \begin{bmatrix} 0 \cdot 0 + 1 \cdot 1 \\ 1 \cdot 0 + 0 \cdot 1 \end{bmatrix}
= \begin{bmatrix} 1 \\ 0 \end{bmatrix}
= \ket{0}
\end{align*}

La matriz actúa sobre los vectores de estado como se esperaba.

#### 1.2.1 Tipos de Matrices en computación cuántica

Dentro de la computación cuántica, a menudo encontramos dos tipos importantes de matrices: matrices **hermitianas** y **unitarias** . 

El primer concepto es más importante en el estudio de la mecánica cuántica, pero aún es necesario discutirlo en un algún tipo de estudio de computación cuántica.

El segundo es de **incomparable y crítica** importancia tanto en la mecánica cuántica como en la computación cuántica. Si quitaramos solo un concepto de esta sección sobre álgebra lineal, debería ser el concepto de matriz unitaria.


**Traduciendo la última oracion:** La lección clave aquí es que si eres nuevo en la computación cuántica, el concepto más importante que debemos comprender es el de las matrices unitarias. Estas matrices son fundamentales porque desempeñan un papel central en la computación cuántica. Aseguran que las computaciones cuánticas se realicen de manera coherente y puedan revertirse, convirtiéndose en el pilar de los algoritmos cuánticos y los circuitos cuánticos. Si bien las matrices hermíticas son significativas para comprender la mecánica cuántica, es el concepto de las matrices unitarias el que debemos priorizar al aprender sobre la computación cuántica.


##### 1.2.1.1 Matrices Hermitianas

Una matriz hermitiana es simplemente una matriz que es igual a su **transpuesta conjugada** (denotada con el símbolo $\dagger$). 

Esto significa que debemos invertir el signo de los componentes imaginarios de una matriz hermitiana y luego reflejando sus entradas a lo largo de su diagonal principal (desde las esquinas superior izquierda a inferior derecho) damos lugar a la misma matriz con la cual comenzamos.

Por ejemplo, la matriz **Pauli-Y**, comúnmente utilizada en computación cuántica, es hermitiana:

\begin{align*}
\sigma_y = \begin{bmatrix}
0 & -i \\
i & 0
\end{bmatrix}
\Rightarrow
\sigma_y^\dagger = \begin{bmatrix}
0 & -(i) \\
-(-i) & 0
\end{bmatrix}
=
\begin{bmatrix}
0 & -i \\
i & 0
\end{bmatrix}
=
\sigma_y
\end{align*}

Miremos cómo cambiamos los lugares de las unidades complejas $\mathit{i}$  e  $\mathit{-i}$ (a medida que reflejamos la diagonal principal, los ceros permanecen sin cambios) y luego invertimos el signo.

##### 1.2.1.2 Matrices Unitarias

Una matriz unitaria es algo similar. Específicamente, es una matriz tal que la **matriz inversa** (de la misma) es igual a la transpuesta conjugada de la matriz original.

La inversa de alguna matriz que llamamos $\mathbf{A}$, denotada como $\mathbf{A^{-1}}$, es una matriz tal que:

\begin{align*}
A^{-1}A = AA^{-1} = \mathbb{I},
\end{align*}

donde $\mathbb{I}$ es la matriz identidad. La matriz de identidad tiene $\mathbf{1}s$ a lo largo de la diagonal principal (de arriba a la izquierda hasta abajo a la derecha) y $\mathbf{0}s$ en todos los demás lugares. 

Se llama matriz identidad porque actúa trivialmente sobre cualquier otra matriz (no tiene ningún efecto). 

Pueden probar esto por su cuenta multiplicando una matriz identidad por cualquier otra matriz.

Cuando las matrices crecen más de dimensión $\mathbf{2 \times 2}$, calcular la inversa se vuelve lo suficientemente complicado como para que generalmente se deje que las computadoras clásicas la calculen. 

Para una matriz de dimensión $\mathbf{2 \times 2}$, la inversa se define como:

\begin{align*}
A = \begin{bmatrix} a & b \\ c & d \end{bmatrix}
\Rightarrow
A^{-1} = \frac{1}{\det(A)} \begin{bmatrix} d & -b \\ -c & a \end{bmatrix},
\end{align*}

donde $\det(A)$ es el **determinante** de la matriz. En el caso de $\mathbf{2 \times 2}$, $\mathbf{\det(A) = ad - bc}$.

Calcular matrices inversas rara vez es importante en la computación cuántica. Dado que la mayoría de las matrices que encontramos son unitarias, podemos suponer que la inversa está dada simplemente tomando la transpuesta conjugada.

Veamos un ejemplo básico. La matriz Pauli-Y, además de ser hermitiana, también es unitaria (es igual a su transpuesta conjugada, que también es igual a su inversa; por lo tanto, **¡la matriz Pauli-Y es su propia inversa!**). Podemos comprobar que esta matriz es en realidad unitaria:

\begin{align*}
\sigma_y = \begin{bmatrix}
0 & -i \\
i & 0
\end{bmatrix}
\sigma_y^\dagger = \begin{bmatrix}
0 & -i \\
i & 0
\end{bmatrix}
\Rightarrow
\sigma_y^\dagger \sigma_y
= \begin{bmatrix}
(0) \cdot (0) + (-i) \cdot (i) & (0) \cdot (-i) + (-i) \cdot (0) \\
(i) \cdot (0) + (0) \cdot (i) & (i) \cdot (-i) + (0) \cdot (0)
\end{bmatrix} =
\begin{bmatrix}
1 & 0 \\
0 & 1
\end{bmatrix} = \mathbb{I}
\end{align*}

La razón por la que las matrices unitarias son tan importantes se hará más evidente en la sección sobre **espacios de Hilbert**. 

**La idea básica es que la evolución de un estado cuántico mediante la aplicación de una matriz unitaria "preserva" la norma (magnitud) del estado cuántico.** (IMPORTANTE!)

##### 1.2.1.3 Matrices Normales

Una matriz $\mathit{A}$ se dice que es **normal** si conmuta con su mtranspuesta conjugada $\mathbb{A^\dagger}$. Entonces, para un matriz normal, $\mathit{A A^\dagger = A^\dagger A}$. Resaltemos algunas propiedades importantes de una matriz normal:

* Una matriz hermitiana A es naturalmente una matriz normal, ya que para matrices hermitianos $\mathit{A = A^\dagger}$, y, por lo tanto, la relación $\mathit{A A^\dagger = A^\dagger A}$ siempre sería cierta. Sin embargo, una matriz normal no necesita ser hermitiana.

* Las matrices normales admiten una *descomposición espectral*. En la forma de descomposición espectral, se puede representar a una matriz normal $\mathit{A}$ como:

$\hspace{1cm}$ $\mathit{A} = \sum_{i=0}^{n-1} \lambda_k \ket{k} \bra{k}$
donde ${λ_k}$ representa el autovalor correspondiente al autovector $\ket{k}$.

<img src="Images/LinearOp.png" alt="Alt Text" width="700" height="450"/>

*Source: "Quantum Machine Learning with Python Using Cirq from Google Researcg and IBM Qiskit"* 

---

### 1.3 Conjuntos generadores, dependencia lineal y bases de un espacio vectorial

Ahora estamos en condiciones de discutir la construcción de espacios vectoriales. 

Consideramos algún espacio vectorial $\mathbf{V}$. 

Decimos que algún conjunto de vectores $\mathbf{S}$ abarca un subespacio $\mathbf{V_s \subseteq V}$ (subconjunto cerrado bajo operaciones en el espacio vectorial) del espacio vectorial, si podemos escribir cualquier vector en el subespacio como una **combinación lineal** de vectores contenidos dentro del conjunto generador o (conjunto de generación).

Una combinación lineal de una colección de vectores $\ket{v_1}, ...,\ket{v_n}$ en algún espacio vectorial sobre un campo $\mathbf{F}$ se define como una suma arbitraria de estos vectores (que por supuesto será otro vector que llamaremos  $\ket{v}$):

\begin{align*}
\ket{v}
=
f_1\ket{v_1} + f_2\ket{v_2} + ... + f_n\ket{n_2}
=
\sum_i f_i \ket{v_i},
\end{align*}

donde cada $\mathbf{f_i}$ es algún elemento de $\mathbf{F}$. Si tenemos un conjunto de vectores que abarca un espacio, estamos diciendo que **cualquier otro vector** en el espacio vectorial se puede escribir como una combinación lineal de estos vectores.

Un conjunto de vectores $\ket{v_1}, ...,\ket{v_n}$ se dice que es **linealmente dependiente** si existen coeficientes correspondientes para cada vector, $\mathit{b_i \in F}$, tal que:

\begin{align*}
b_1\ket{v_1} + b_2\ket{v_2} + ... + b_n\ket{v_n}
=
\sum_i b_i \ket{v_i}
=
0,
\end{align*}

donde al menos uno de los coeficientes $\mathit{b_i}$ es distinto de cero. Esto intuitivamente equivale a la afirmación de que "el conjunto de vectores se puede expresar como combinaciones lineales entre sí". Dicho de otra manera, significa que los vectores dentro del conjunto pueden escribirse como combinaciones lineales unos de otros, lo que indica que son linealmente dependientes y pueden generar el espacio vectorial.

Por ejemplo, tengamos el conjunto {$\ket{v_1}, ...,\ket{v_n}$} junto con los coeficientes correspondientes {$\mathit{{b_1, ...,b_n}}$}, tal que la combinación lineal es igual a $\mathbf{0}$. Como hay al menos un vector con un coeficiente distinto de cero, elegimos un término en la combinación lineal $b_a\ket{v_a}$:

\begin{align*}
\sum_i b_i\ket{v_i}
=
b_a\ket{v_a} + \sum_{i, i \neq a} b_i\ket{v_i}
=
0
\Rightarrow
\ket{v_a}
=
- \sum_{i, i \neq a} \frac{b_i}{b_a} \ket{v_i}
=
\sum_{i, i \neq a} c_i\ket{v_i}
\end{align*}

En el caso de que $\mathit{b_a}$ sea el único coeficiente distinto de cero, es necesariamente cierto que $\ket{v_a}$ es el vector nulo, lo que automáticamente hace que el conjunto sea linealmente dependiente. 

Si este no es el caso, $\ket{v_a}$ se ha escrito como una combinación lineal de vectores distintos de cero, como mostramos arriba. 

Para demostrar lo contrario, suponemos que existe algún vector $\ket{v_a}$ en el subespacio $\ket{v_1}, ...,\ket{v_n}$ que se puede escribir como una combinación lineal de otros vectores del subespacio. 

Esto significa que:

\begin{align*}
\ket{v_a}
=
\sum_s b_s\ket{v_s},
\end{align*}

donde $\mathbf{s}$ es un índice que recorre un subconjunto del subespacio. Resulta que:



\begin{align*}
|v_a\rangle
-
\sum_s b_s|v_s⟩
=
|v_a\rangle - (b_1|v_{s_1}\rangle + b_2|v_{s_2}\rangle + ... + b_r|v_{s_r}\rangle)
=
0
\end{align*}

Para todos los vectores en el subespacio que no están incluidos en el subconjunto indexado por $\mathit{s}$, fijamos sus coeficientes, indexados por el índice $\mathit{q}$, igual a $\mathbf{0}$. De este modo,

\begin{align*}
|v_a\rangle - (b_1|v_{s_1}\rangle + b_2|v_{s_2}\rangle + ... + b_r|v_{n_r}\rangle)
+
(0)(|v_{q_1}\rangle + |v_{q_2}\rangle + ... + |v_{q_t}\rangle)
=
0
\end{align*}

que es una combinación lineal de todos los elementos en el subespacio $\mathit{|v_1\rangle,..., |v_n\rangle}$. Esto es igual a $\mathbf{0}$, completando así la prueba de que las dos definiciones de dependencia lineal se implican entre sí.

Consideremos ahora un ejemplo básico. Tenemos el conjunto de dos vectores en $\mathbb{R^2}$, que consiste en $\mathbf{|a\rangle = (1 \space \space \space 0)}$ y $\mathbf{|b\rangle = (2 \space \space \space 0)}$. 

Si elegimos el campo sobre nuestro espacio vectorial para que sea $\mathbb{R}$, entonces podemos crear una combinación lineal de estos vectores que equivale a $\mathbf{0}$.

Por ejemplo:

\begin{align*}
2|a\rangle - |b\rangle = 0
\end{align*}

Entonces, decimos que un conjunto de vectores es **linealmente independiente** si **NO** hay ningún vector en el conjunto que pueda expresarse como una combinación lineal de todos los demás.

La noción de **base** (vectorial) es simplemente un **conjunto generador linealmente independiente**. En este sentido, la base de un espacio vectorial es el conjunto mínimo posible que abarca todo el espacio. Al tamaño del conjunto base lo llamamos **dimensión** del espacio vectorial.

Las bases y los conjuntos generadores son importantes porque nos permiten "reducir" espacios vectoriales y expresarlos en términos de sólo unos pocos vectores. **Podemos llegar a ciertas conclusiones sobre nuestro conjunto de bases que podemos generalizar a todo el espacio vectorial, simplemente porque sabemos que cada vector en el espacio es solo una combinación lineal de los vectores base.**

En la computación cuántica, una de las bases que encontramos a menudo es $\mathbf{|0\rangle, |1\rangle}$. Podemos escribir cualquier otro estado de un qubit como una combinación lineal de estos vectores base. Por ejemplo, la combinación lineal:

\begin{align*}
\frac{|0\rangle + |1\rangle}{\sqrt{2}},
\end{align*}

representa una superposición entre el estado base $\mathbf{|0\rangle}$ y el $\mathbf{|1\rangle}$, con igual probabilidad de medir que el estado esté en cualquiera de los estados del vector base (esto es intuitivo, ya que el "peso" o la "cantidad de cada vector base" en la combinación lineal es igual, ambos escalados por $\frac{1}{\sqrt{2}}$).

---

### 1.4 Espacios de Hilbert, notacion de Dirac, ortonormalidad y producto interno

#### 1.4.1 Espacios de Hilbert

Los espacios de Hilbert son una de las construcciones matemáticas más importantes en la mecánica y computación cuántica. Podemos considerar un espacio de Hilbert como el espacio de estados en el que "viven" todos los vectores de estados cuánticos (de algún modo podemos decir que es una generalización del espacio euclidiano). La principal diferencia entre un espacio de Hilbert y cualquier espacio vectorial aleatorio es que un espacio de Hilbert está equipado con un **producto interno** , que es una operación que se puede realizar entre dos vectores, devolviendo un escalar.

En el contexto de la mecánica y computación cuántica, el producto interno entre dos vectores de estado devuelve una cantidad escalar que representa la cantidad en la que el primer vector se encuentra a lo largo del segundo vector. A partir de esto, se pueden calcular las probabilidades de medición en diferentes estados cuánticos (entre otras cosas). Hablaremos de esto más .

#### 1.4.2 Notación de Dirac

*“Mathematicians tend to despise Dirac notation, because it can prevent them from
making important distinctions, but physicists love it, because they are always forgetting
such distinctions exist and the notation liberates them from having to remember.”
—David Mermin*

La notación de Dirac es una manera de representar un vector $\mathbf{v}$. La notación de Dirac para los conceptos de álgebra lineal es muy conveniente para la mecánica cuántica y los vamos a usar siempre en general.

En la mecánica cuántica, los estados de los sistemas cuánticos se encuentran en espacios de Hilbert complejos. Un espacio de Hilbert es un espacio vectorial equipado con una norma producto interno. También es un espacio vectorial completo donde la convergencia de secuencias de estados cuánticos no será un problema. Aquellas personas que no estén familiarizadas con los espacios vectoriales completos pueden pensar en ellos como espacios donde están disponibles todos los posibles estados que un sistema cuántico puede adquirir.

Motivemos la idea de un espacio vectorial completo con un contraejemplo. Supongamos que tenemos un qubit cuyas amplitudes de probabilidad están restringidas a ser números racionales. En este caso, el estado del qubit $|\psi\rangle$  pertenece al espacio racional bidimensional $\mathbb{ℚ^2}$ en lugar de pertenecer al plano complejo bidimensional estándar $\mathbb{C^2}$. Ahora supongamos que el sistema cuántico cambia el estado del qubit en un tiempo finito $\mathit{Δt}$ desde el estado $\mathbf{|0\rangle}$ hasta un estado de superposición igual dado por $\frac{|0\rangle + |1\rangle}{\sqrt{2}}$. Podemos pensar en la trayectoria de actualización del estado como una secuencia, como se muestra aquí:

\begin{align*}
|\psi\rangle = |0\rangle, |\psi_1\rangle, |\psi_2\rangle, \dots, |\psi_m\rangle, \dots, |\psi_n\rangle
\end{align*}

teniendo que:


\begin{align*}
\lim_{{n \to \infty}}|\psi_n\rangle = \frac{|0\rangle + |1\rangle}{\sqrt{2}}
\end{align*}

Ahora, dado que el estado del qubit está restringido a estar dentro del espacio racional bidimensional $\mathbb{ℚ^2}$, no puede converger al estado límite en la ecuación anterior. No tendríamos este problema de convergencia en $\mathbb{C^2}$, ya que se puede pensar en cualquier estado posible del qubit y ese estado estaría disponible para que el qubit converja. Aunque la explicación no fue matemáticamente rigurosa, debería proporcionarte una idea intuitiva de un espacio vectorial completo.

##### 1.4.2.1 Vector Ket

Según la notación vectorial de Dirac, el vector columna correspondiente a un estado cuántico se representa como $|\psi\rangle$. Esta representación simbólica de un vector se llama representación Ket. Por ejemplo, un qubit con una amplitud de probabilidad compleja puede tener el estado $\frac{|0\rangle + |1\rangle}{\sqrt{2}}$. En la notación de Dirac, el estado $|\psi\rangle$ corresponde al siguiente vector columna:

\begin{align*}
|\psi\rangle = \begin{bmatrix} \frac{1}{\sqrt{2}} \\ \frac{i}{\sqrt{2}} \end{bmatrix}
\end{align*}

##### 1.4.2.2 Vector Bra

La operación traspuesta conjugada compleja de un vector Ket se llama un vector Bra y se representa como $\langle\psi|$. Por ejemplo, el vector Bra correspondiente al vector Ket en la ecuación anterior es el siguiente:

\begin{align*}
\langle\psi| = \begin{bmatrix} \frac{1}{\sqrt{2}} \space \frac{-i}{\sqrt{2}} \end{bmatrix}
\end{align*}

Observemos que el vector columna se ha transpuesto a un vector fila y las amplitudes se han transformado a sus conjugados complejos. Para un número complejo $\mathit{a + bi}$, su conjugado complejo se da por $\mathit{a - bi}$. Si un vector Ket tiene solo amplitudes de probabilidad reales, entonces el vector Bra correspondiente es simplemente su traspuesta.

#### 1.4.3 Producto Interno

Para dos vectores $\mathit{|a\rangle}$ y $\mathit{|b\rangle}$ en un espacio de Hilbert, denotamos el producto interno como $\mathit{\langle a|b\rangle}$, donde $\mathit{\langle a|}$ es igual a la transpuesta conjugada de $\mathit{|a\rangle}$, denotado $\mathit{|a^\dagger\rangle}$. Por tanto, el producto interno entre dos vectores del espacio de Hilbert se parece a:

$\langle a|b\rangle = \begin{bmatrix}a_1^*, a_2^*, \ldots, a_n^*\end{bmatrix} \begin{bmatrix}b_1 \\ b_2 \\ \vdots \\ b_n\end{bmatrix} = a_1^*b_1 + a_2^*b_2 + \ldots + a_n^*b_n = \sum_n a_n^* b_n ,$
<!-- = \sum_n \langle a|a_n\rangle \langle a_n|b\rangle$ -->

donde $\mathbf{*}$ denota el elemento complejo conjugado del vector.

**Una de las condiciones más importantes para que un espacio de Hilbert represente un sistema cuántico es que el producto interno de un vector consigo mismo sea igual a uno:** $\langle \psi|\psi\rangle = 1$. (IMPORTANTE!)

Esta es la llamada condición de normalización, que establece que la longitud del vector al cuadrado (cada componente del vector se eleva al cuadrado y se suma, por definición del producto interno) debe ser igual a uno. El significado físico de esto es que la longitud de un vector en una dirección particular es representativa de la "amplitud de probabilidad" del sistema cuántico con respecto a la medición en ese estado particular. 

Obviamente, la probabilidad de que el sistema cuántico se mida en el estado en que se encuentra debe ser $\mathbf{1}$ (después de todo, la suma de las probabilidades de encontrar el sistema cuántico en cualquier estado particular debe ser igual a $\mathbf{1}$).

Consideremos la esfera de Bloch:

In [None]:
plot_bloch_vector([0, 0, 0])

La superficie de esta esfera, junto con el producto interno entre los vectores de estado que representan a los qubits, es un espacio de Hilbert válido. Además, la condición de normalización es cierta, ya que el radio de la esfera de Bloch es $\mathbf{1}$, y por lo tanto la longitud al cuadrado de cada vector también debe ser igual a $\mathbf{1}$.

Una nota final sobre los espacios de Hilbert y el producto interno es su relación con **las matrices unitarias**. 

**Las matrices unitarias son importantes en la computación cuántica porque preservan el producto interno** (IMPORTANTE!), lo que significa que no importa cómo transformemos un vector bajo una secuencia de matrices unitarias, la condición de normalización sigue siendo válida. 

Esto se puede demostrar en la siguiente breve prueba:

\begin{align*}
\langle\psi|\psi\rangle = 1
\Rightarrow
|\psi\rangle \to U|\psi\rangle
=
|\psi^`\rangle
\Rightarrow
\langle\psi^`|\psi^`\rangle
=
(U|\psi\rangle)^\dagger U|\psi\rangle
=
\langle\psi|U^\dagger U \psi\rangle = \langle\psi|\psi\rangle = 1
\end{align*}

Esto significa que la evolución unitaria envía estados cuánticos a otros estados cuánticos válidos. Para un espacio de Hilbert de un solo qubit, representado por la esfera de Bloch, las transformaciones unitarias corresponden a rotaciones de vectores de estado a diferentes puntos de la esfera, sin cambiar la longitud del vector de estado de ninguna manera.

Veamos lo siguiente:

In [None]:
plot_bloch_vector([0, 0, 1])

In [None]:
plot_bloch_vector([0, 0, -1])

#### 1.4 Ortonormalidad

Se dice que un espacio vectorial tiene una **base ortonormal** cuando los elementos vectoriales del conjunto de bases son ortonormales entre sí.

Un conjunto de vectores base $\mathbf{|\psi_1\rangle, |\psi_2\rangle, \dots,∣\psi_n\rangle}$ se dice que forman una base ortonormal si se cumple lo siguiente:

\begin{align*}
\langle\psi_i|\psi_j\rangle = \delta_y
\end{align*}

El término $\mathit{\delta_y}$ se denomina delta de Kronecker, y sus propiedades son las siguientes:

\begin{align*}
\delta_y =
\begin{cases}
            \begin{aligned}
              0 & \text{ if } i \neq j \\
              1 & \text{ if } i = j
           \end{aligned}
\end{cases}
\end{align*}

No necesitamos citar explícitamente la propiedad de independencia lineal como condición de base ortonormal ya que la ortonormalidad de los vectores garantizará siempre la independencia lineal de los vectores.

En mecánica y computacion cuántica, siempre representamos los estados cuánticos en espacios de Hilbert con base ortonormal.

---

### 1.5 Productos externos y productos tensoriales

Los productos internos no son la única forma de multiplicar vectores. Ocasionalmente, cambiaremos el orden del bra y el ket para tomar el **producto externo**, cuyo resultado es una matriz, en lugar de un solo número. Para dos vectores $\mathit{|a\rangle}$ y $\mathit{|b\rangle}$ en un espacio de Hilbert, denotamos el producto exterior como $\mathit{|a\rangle \langle b|}$, donde $\mathit{\langle b|}$ es igual a la transpuesta conjugada de $\mathit{|b\rangle}$, como antes. 

Esto nos lleva a:

$|a\rangle \langle b| = \begin{bmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{bmatrix} \begin{bmatrix} b_1^* & b_2^* & \ldots & b_n^* \end{bmatrix} = \begin{bmatrix} a_1b_1^* & a_1b_2^* & \ldots & a_1b_n^* \\ a_2b_1^* & a_2b_2^* & \ldots & a_2b_n^* \\ \vdots & \vdots & \ddots & \vdots \\ a_nb_1^* & a_nb_2^* & \ldots & a_nb_n^* \end{bmatrix}$


Los productos externos nos brindan una manera de representar compuertas cuánticas con bra y kets, en lugar de matrices. Por ejemplo, tomemos la puerta **Pauli-X**:

\begin{align*}
\sigma_x = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}
\end{align*}

Podemos representar esto como la suma $\mathbf{|0\rangle \langle 1| + |1\rangle \langle 0|}$, desde:

\begin{align*}
\mathbf{|0\rangle} & = \begin{bmatrix} 1 \\ 0 \end{bmatrix} \\
\mathbf{|1\rangle} & = \begin{bmatrix} 0 \\ 1 \end{bmatrix} \\
\mathbf{|0\rangle \langle 1|} & = \begin{bmatrix} 1 \\ 0 \end{bmatrix} \begin{bmatrix} 0 & 1 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} \\
\mathbf{|1\rangle \langle 0|} & = \begin{bmatrix} 0 \\ 1 \end{bmatrix} \begin{bmatrix} 1 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} \\
\mathbf{|0\rangle \langle 1| + |1\rangle \langle 0|} & = \begin{bmatrix} 0 & 1 \\ 0 & 0 \end{bmatrix} + \begin{bmatrix} 0 & 0 \\ 1 & 0 \end{bmatrix} = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix} = \sigma_x
\end{align*}

El producto exterior es, de hecho, un ejemplo específico del **producto tensorial** más general utilizado para multiplicar espacios vectoriales.

En la mayoría de los casos, vamos a ver el producto tensorial utilizado para describir el estado compartido de dos o más qubits. 

Observemos aquí que el producto tensorial no requiere tomar una de las transposiciones conjugadas del vector como lo hace el producto externo: estamos multiplicando dos kets en lugar de un ket y un bra. 

El producto tensorial de vectores $\mathit{|a\rangle}$ y $\mathit{|b\rangle}$, escrito $\mathit{|a\rangle} \otimes \mathit{|b\rangle}$ o $\mathit{|ab\rangle}$, es igual a:

\begin{align*}
\mathbf{|a\rangle} \otimes \mathbf{|b\rangle} = \begin{bmatrix} a_1 \\ a_2 \\ \vdots \\ a_n \end{bmatrix} \otimes \begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{bmatrix} 
= 
\begin{bmatrix}
a_1\begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{bmatrix} \\
a_2\begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{bmatrix} \\
\vdots \\
a_n\begin{bmatrix} b_1 \\ b_2 \\ \vdots \\ b_n \end{bmatrix}
\end{bmatrix} 
= 
\begin{bmatrix}
a_1b_1 \\
a_1b_2 \\
\vdots \\
a_1b_n \\
a_2b_1 \\
a_2b_2 \\
\vdots \\
a_2b_n \\
\vdots \\
a_nb_1 \\
a_nb_2 \\
\vdots \\
a_nb_n
\end{bmatrix}
\end{align*}


Si queremos actuar sobre el nuevo vector producido por el producto tensorial de $\mathit{|a\rangle}$ y $\mathit{|b\rangle}$, también tendremos que tomar el producto tensorial de los operadores con los que esperamos actuar sobre ellos. El producto tensorial de las matrices $\mathbf{A}$ y $\mathbf{B}$ es igual a:

\begin{align*}
A \otimes B = \begin{bmatrix}
A_{11}B & A_{12}B & \ldots & A_{1n}B \\
A_{21}B & A_{22}B & \ldots & A_{2n}B \\
\vdots & \vdots & \ddots & \vdots \\
A_{m1}B & A_{m2}B & \ldots & A_{mn}B \\
\end{bmatrix}
\end{align*}

---

### 1.6 Autovectores y autovalores (eigenvectores y eigenvalores)

Consideremos la relación de la forma:

\begin{align*}
A|v\rangle = \lambda|v\rangle ,
\end{align*}

donde es $\mathbf{A}$ una matriz y $\mathbf{\lambda}$ es algún número. Si nos dan alguna matriz $\mathbf{A}$, y necesitamos encontrar los vectores $\mathit{|v\rangle}$ y números $\mathit{\lambda}$ que satisfacen esta relación, llamamos a estos vectores **autovectores** y a sus correspondientes multiplicadores numéricos **autovalores**. 

Los autovectores y los autovalores tienen un significado físico muy importante en el contexto de la mecánica cuántica y, por tanto, de la computación cuántica. 

Dada la matriz $\mathbf{A}$, explotamos un truco interesante para encontrar el conjunto de autovectores y autovalores correspondientes. Reorganicemos nuestra ecuación como:



\begin{align*}
A|v\rangle - \lambda|v\rangle = 0 \Rightarrow (A - \lambda\mathbb{I})|v\rangle = 0
\end{align*}

Si multiplicamos ambos lados de esta ecuación por la matriz inversa $\mathit{(A - \lambda\mathbb{I})^{-1}}$, obtenemos $\mathit{|v\rangle = } $  $\mathbb{0}$. Esta es una solución extraña y trivial (no vamos a permitir que los autovectores sean el vector nulo, de lo contrario, cualquier combinación de autovalor/matriz satisfaceria la relación autovector-autovalor).

Por lo tanto, para encontrar los autovectores y autovalores permitidos, debemos suponer que la matriz $\mathbf{(A - \lambda\mathbb{I})}$ **NO es invertible**. Recordemos que la inversa de una matriz tiene la forma:

\begin{align*}
M^{-1} = \frac{1}{\det(M)} F(M) ,
\end{align*}

donde $\mathit{F(M)}$ es una nueva matriz (cuyos detalles no importan en este contexto) que depende de  $\mathbf{M}$. La parte de esta ecuación que nos interesa es la inversa del determinante. Si el determinante de la matriz  $\mathbf{M}$ es  $\mathbf{0}$, se deduce que la inversa no está definida y, por lo tanto, también lo es, lo que hace que la matriz  $\mathbf{M}$ no reversible. Por lo tanto requerimos que:

\begin{align*}
\det(A - \lambda\mathbb{I}) = 0
\end{align*}

A partir de esto, podemos determinar $\mathbf{\lambda}$, luego reemplazamos cada valor de $\mathbf{\lambda}$ para volver a la ecuación original y obtener los autovectores.

Hagamos un ejemplo y encontremos los vectores propios/valores propios de la matriz de Pauli-Z, $\mathbf{\sigma_z}$. Empezamos con:

\begin{align*}
\det(\sigma_z - \lambda\mathbb{I}) = \det(\begin{bmatrix}
1-\lambda & 0 \\
0 & -1- \lambda
\end{bmatrix}) = (-1-\lambda)(1 - \lambda) - (0)(0) = \lambda^2 - 1 = 0
\Rightarrow
\lambda = \pm 1
\end{align*}

La ecuación, en términos de $\mathbf{\lambda}$, que resulta al resolver el determinante se llama **polinomio característico**.

Luego podemos reemplazar cada uno de estos valores nuevamente en la ecuación original. Empezaremos con $\mathbf{\lambda = 1}$:



\begin{align*}
\begin{bmatrix}
1 & 0 \\
0 & -1
\end{bmatrix}
|v\rangle = |v\rangle
\Rightarrow
\begin{bmatrix}
1 & 0 \\
0 & -1
\end{bmatrix}
\begin{bmatrix}
a \\
b
\end{bmatrix} =
\begin{bmatrix}
a \\ 
b
\end{bmatrix}
\Rightarrow
\begin{bmatrix}
a \\ 
-b
\end{bmatrix}
=
\begin{bmatrix}
a \\ 
b
\end{bmatrix}
\end{align*}

$\mathit{a}$ puede ser cualquier número y $\mathit{b}$ es 0; así, el vector $\mathbf{(1,0)}$ forma una base para todos los vectores que satisfacen nuestra relación y, por lo tanto, es el autovector que corresponde al autovalor de $\mathbf{1}$. Hacemos lo mismo  $\mathbf{\lambda = -1}$:

\begin{align*}
\begin{bmatrix}
1 & 0 \\
0 & -1
\end{bmatrix}
|v\rangle = -|v\rangle
\Rightarrow
\begin{bmatrix}
1 & 0 \\
0 & -1
\end{bmatrix}
\begin{bmatrix}
a \\
b
\end{bmatrix} =
\begin{bmatrix}
-a \\ 
-b
\end{bmatrix}
\Rightarrow
\begin{bmatrix}
a \\ 
-b
\end{bmatrix}
=
\begin{bmatrix}
-a \\ 
-b
\end{bmatrix}
\end{align*}

Esta vez, $\mathit{b}$ puede ser cualquier número y $\mathit{a}$ es $\mathbf{0}$; por lo tanto, nuestro vector base (y nuestro autovector correspondiente a $\mathbf{-1}$) es $\mathbf{(0,1)}$. 

Entonces, observemos cómo los autovalores de la matriz de **Pauli-Z** son los estados bases computacionales cuánticos $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$. Esto **NO** es una coincidencia. (IMPORANTE!)

Por ejemplo, cuando medimos un qubit en la base $\mathbf{Z}$, básicamente, nos referimos a una medición que colapsa el estado del qubit en uno de los autovectores de la **matriz Z**, ya sea $\mathbf{|0\rangle}$ o $\mathbf{|1\rangle}$.

De hecho, las siguientes propiedades son muy importantes en el modelo de compuertas de computación cuántica, donde tratamos con espacios vectoriales de dimensión finita:

* Una matriz hermitiana tiene autovectores linealmente independientes. El número de estos autovectores es igual a la dimensión del espacio vectorial. Además, cuando los autovalores correspondientes son distintos, los autovectores son ortogonales. Cuando los autovalores son iguales, los autovectores no son ortogonales, pero siguen siendo linealmente independientes y pueden ortogonalizarse. Por tanto, los autovectores de una matriz hermitiana forman una base para el espacio vectorial.

* Dado que una matriz unitaria es una matriz normal, los autovectores de una matriz unitaria forman una base ortonormal para el espacio vectorial.

Como caso especial importante, estos pueden verificarse para cada una de las **matrices de Pauli**.

---

### 1.7 Matrices Exponenciales

La noción de matriz exponencial es un concepto muy específico pero extremadamente importante. A menudo vemos transformaciones unitarias en la forma:

\begin{align*}
U = \mathrm{e}^{i\gamma H},
\end{align*}

donde $\mathbf{H}$ es alguna matriz hermitiana y $\mathbf{\gamma}$ es algún número real. Es bastante sencillo demostrar que todas las matrices de esta forma son unitarias. Tomando la transpuesta conjugada de $\mathbf{U}$, obtenemos:

\begin{align*}
U^\dagger = (\mathrm{e}^{i\gamma H})^\dagger = \mathrm{e}^{-i\gamma H^\dagger},
\end{align*}

Pero como $\mathbf{H}$ es hermitiana, sabemos $\mathbf{H^\dagger = H}$, de este modo:

\begin{align*}
\mathrm{e}^{-i\gamma H^\dagger} = \mathrm{e}^{-i\gamma H}
\Rightarrow
U^\dagger U = \mathrm{e}^{-i\gamma H} \mathrm{e}^{i\gamma H} = \mathbb{I}
\end{align*}

**Quizás se pregunten por qué una matriz dentro de una exponencial todavía puede considerarse una matriz**. 

La respuesta se vuelve más clara cuando expandimos nuestra función exponencial como una serie de Taylor. Recordemos del cálculo y análisis matemático que una serie de Taylor es esencialmente una forma de escribir cualquier función como un polinomio de grado infinito, y la idea principal es elegir los términos del polinomio y centrarlo en algún punto $\mathit{x}_0$ de la función que estamos tratando de transformar en el polinomio, de modo que la derivada cero, primera, segunda, tercera, etc., sea la misma tanto para la función original como para el polinomio. 

Así, escribimos nuestra serie de Taylor en la forma:

\begin{align*}
g(x) = \sum_{n=0}^{\infty} \frac{f^{(n)}(\mathit{x}_0)}{n!}(x - \mathit{x}_0)^n ,
\end{align*}

donde $\mathit{g(x)}$ es el polinomio, $\mathit{f(x)}$ es la función original, $\mathit{f^{(n)}}$ es la $\mathit{n}$-ésima derivada de $\mathit{f}$, y $\mathit{x}_0$ es el punto en el que centramos la función. Como no nos estamos aproximando, $\mathit{x}_0$ no importa, así que por simplicidad, elegimos $\mathit{x}_0 = 0$, y la serie de Taylor se convierte en una serie de Maclaurin:

\begin{align*}
g(x) = \sum_{n=0}^{\infty} f^{(n)}(0)\frac{(x)^n}{n!} ,
\end{align*}

Si elegimos $\mathit{f(x)=\mathrm{e}^x}$, podemos crear un polinomio equivalente usando la serie de Maclaurin. Dado que la derivada de $\mathbf{\mathrm{e}^\mathit{x}}$ es simplemente $\mathbf{\mathrm{e}^\mathit{x}}$, y evidentemente, $\mathbf{\mathrm{e}^0 = 1}$, obtenemos:

\begin{align*}
g(x) = \sum_{n=0}^{\infty} \frac{x^n}{n!} = \mathrm{e}^x,
\end{align*}

Así, para alguna matriz, $\mathit{i\gamma H}$, obtenemos:

\begin{align*}
\mathrm{e}^{i\gamma H} = \sum_{n=0}^{\infty} \frac{(i\gamma H)^n}{n!}
\end{align*}

Por tanto, **la exponencial de una matriz es una matriz**. Es una suma infinita de matrices en potencia, que ciertamente parece demasiado compleja... pero el punto aquí es que la matriz exponencial es de hecho una matriz.

Ahora estamos en condiciones de demostrar un hecho **MUY IMPORANTE**: si tenemos alguna matriz $\mathbf{B}$ tal que $\mathbf{B^2} = \mathbb{I}$ (esto se llama **matriz involutiva**), entonces:


\begin{align*}
\mathrm{e}^{i\gamma B} = \cos(\gamma) \mathbb{I} + i\sin(\gamma) B
\end{align*}

Empezamos con la serie Maclaurin:

\begin{align*}
\mathrm{e}^{i\gamma B} = \sum_{n=0}^{\infty} \frac{(i\gamma B)^n}{n!}
\end{align*}

Observe que podemos dividir la suma en una parte imaginaria y una parte real, según si $\mathit{n}$ es par o impar en cada término de la suma:

\begin{align*}
\sum_{n=0}^{\infty} \frac{(i\gamma B)^n}{n!} = \sum_{n=0}^{\infty} \frac{(-1)^n \gamma^{2n} B^{2n}}{(2n)!} + i \sum_{n=0}^{\infty} \frac{(-1)^n \gamma^{2n+1} B^{2n+1}}{(2n+1)!}
\end{align*}

Ahora busquemos la serie de Maclaurin para ambos $\mathit{sin \space x}$ y $\mathit{cos \space x}$. Empezaremos con $\mathit{f(x) = sin \space x}$ :

\begin{align*}
\sin x = \sum_{n=0}^{\infty} f^{(n)}(0) \frac{(x)^n}{n!} ,
\end{align*}

La derivada de $\mathit{sin \space x}$ es cíclica en cierto sentido (cada flecha representa tomar la derivada de la función anterior):

\begin{align*}
\mathit{sin \space x} \rightarrow \mathit{cos \space x} \rightarrow -\mathit{sin \space x} \rightarrow -\mathit{cos \space x} \rightarrow \mathit{sin \space x}
\end{align*}

Desde que $\mathbf{sin(0)=0}$ y $\mathbf{cos(0)=1}$, todos los términos con $\mathit{n}$ par se convierten en $\mathbf{0}$ , y obtenemos:



\begin{align*}
\sum_{n=0}^{\infty} f^{(n)}(0) \frac{(x)^n}{n!} =  \sum_{n=0}^{\infty} \frac{(-1)^n \gamma^{2n+1}}{(2n+1)!}
\end{align*}

Esto se parece al término impar de nuestra ecuación original. De hecho, si dejamos que $\mathit{x= \gamma B}$, son exactamente lo mismo. Seguimos un proceso que es casi idéntico para demostrar que los términos pares son los mismos que la serie de Maclaurin para $\mathit{f(x) = cos \space x}$:

\begin{align*}
\cos x = \sum_{n=0}^{\infty} f^{(n)}(0) \frac{(x)^n}{n!} ,
\end{align*}

\begin{align*}
\Rightarrow
\mathit{cos \space x} \rightarrow -\mathit{sin \space x} \rightarrow -\mathit{cos \space x} \rightarrow \mathit{sin \space x} \rightarrow \mathit{cos \space x}
\end{align*}

\begin{align*}
\sum_{n=0}^{\infty} f^{(n)}(0) \frac{(x)^n}{n!} =  \sum_{n=0}^{\infty} \frac{(-1)^n x^{2n}}{(2n)!}
\end{align*}

Ahora, volvamos a la ecuación original. Recordar que $\mathbf{B^2} = \mathbb{I}$. Entonces, para cualquier $\mathit{n}$, tenemos:

\begin{align*}
B^{2n} = (B^2)^n = \mathbb{I}^n = \mathbb{I}
\end{align*}

\begin{align*}
B^{2n+1} = B(B^2)^n = B \mathbb{I}^n = B \mathbb{I} = B
\end{align*}

Sustituyendo esta nueva información, obtenemos:

\begin{align*}
\sum_{n=0}^{\infty} \frac{(-1)^n \gamma^{2n} B^{2n}}{(2n)!} + i \sum_{n=0}^{\infty} \frac{(-1)^n \gamma^{2n+1} B^{2n+1}}{(2n+1)!} =
\mathbb{I} \sum_{n=0}^{\infty} \frac{(-1)^n x^{2n}}{(2n)!} + i B \sum_{n=0}^{\infty} \frac{(-1)^n \gamma^{2n+1}}{(2n+1)!} = 
\mathit{cos(\gamma) \mathbb{I}} + i \mathit{sin(\gamma) B}
\end{align*}

**Este hecho es extremadamente útil en la computación cuántica** (IMPORTANTE!). 

Consideremos las matrices de Pauli:

\begin{align*}
\sigma_x = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}
\end{align*}

\begin{align*}
\sigma_y = \begin{bmatrix} 0 & -i \\ i & 0 \end{bmatrix}
\end{align*}

\begin{align*}
\sigma_z = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}
\end{align*}

Estas matrices se encuentran entre las **"compuertas cuánticas"** fundamentales que se utilizan para manipular qubits. Estas operaciones no sólo son unitarias, también son **hermitianas** e **involutivas** . Esto significa que una matriz de la forma $\mathrm{e^{i \gamma \sigma_k}}$ $\text{k}$ $\in$ {$\text{x, y, z}$}
no sólo es una matriz unitaria válida que puede actuar sobre un vector de estado cuántico (un qubit), sino que también puede expresarse utilizando la relación seno-coseno que acabamos de demostrar. 

**Esto es muy poderoso y se ve en toda la teoría computacional cuántica, ya que compuertas de este tipo se utilizan todo el tiempo.**

Un último dato importante sobre las exponenciales matriciales: si tenemos alguna matriz $\mathbf{M}$, con autovalores $\mathit{|v\rangle}$ y autovalores correspondientes $\mathit{\lambda}$, entonces:

\begin{align*}
\mathrm{e}^M |v\rangle = \mathrm{e}^\lambda |v\rangle
\end{align*}

Esto es mucho más sencillo de demostrar:

\begin{align*}
\mathrm{e}^M |v\rangle = \sum_{n=0}^{\infty} \frac{M^{n}|v\rangle}{n!} =  \sum_{n=0}^{\infty} \frac{\lambda^n |v\rangle}{n!} =\mathrm{e}^\lambda |v\rangle
\end{align*}

**Este hecho también es muy útil.** Al crear circuitos cuánticos que simulan un cierto operador hamiltoniano (especialmente para circuitos variacionales), frecuentemente usamos compuertas de la forma $\mathrm{e^{i \gamma \sigma_z}}$. Desde que $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$ son autovectores de $\mathit{\sigma_z}$, podemos determinar fácilmente matemáticamente que $\mathrm{e^{i \gamma \sigma_z}}$ agregará una fase de $\mathrm{e^{i \gamma}}$ a $\mathbf{|0\rangle}$, y agregará una fase  $\mathrm{e^{-i \gamma}}$ a $\mathbf{|1\rangle}$. 

Entonces podemos construir esta compuerta en términos de la compuerta $\mathbf{CNOT}$ y compuertas de fase/rotación con bastante facilidad, ya que conocemos el resultado matemático de la compuerta en cada uno de las bases computacionales.

Este hecho no sólo se aplica a los exponenciales de la compuerta $\mathit{\sigma_z}$. Por ejemplo, podemos determinar el resultado de una puerta de la forma $\mathrm{e^{i \gamma \sigma_x}}$ sobre los autovalores de $\mathit{\sigma_x}$, $\mathbf{(|0\rangle + |1\rangle) / \sqrt 2}$ y $\mathbf{(|0\rangle - |1\rangle) / \sqrt 2}$. Lo mismo se aplica a las exponenciales de la matriz $\mathit{\sigma_y}$.

Resumiendo puntos importantes:
* La idea básica es que la evolución de un estado cuántico mediante la aplicación de una matriz unitaria "preserva" la norma (magnitud) del estado cuántico.
* Una de las condiciones más importantes para que un espacio de Hilbert represente un sistema cuántico es que el producto interno de un vector consigo mismo sea igual a 1.
* Las matrices unitarias son importantes en la computación cuántica porque preservan el producto interno, lo que significa que no importa cómo transformemos un vector bajo una secuencia de matrices unitarias, la condición de normalización sigue siendo válida.
* Una matriz de la forma $\mathrm{e^{i \gamma \sigma_k}}$ $\text{k}$ $\in$ {$\text{x, y, z}$}
no sólo es una matriz unitaria válida que puede actuar sobre un vector de estado cuántico (un qubit), sino que también puede expresarse utilizando la relación seno-coseno que demostramos.
* Al crear circuitos cuánticos que simulan un cierto operador hamiltoniano (especialmente para circuitos variacionales), frecuentemente usamos compuertas de la forma $\mathrm{e^{i \gamma \sigma_z}}$. Desde que $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$ son autovectores de $\mathit{\sigma_z}$, podemos determinar fácilmente matemáticamente que $\mathrm{e^{i \gamma \sigma_z}}$ agregará una fase de $\mathrm{e^{i \gamma}}$ a $\mathbf{|0\rangle}$, y agregará una fase  $\mathrm{e^{-i \gamma}}$ a $\mathbf{|1\rangle}$. 

---

## 2. Introducción a la computación cuántica

<div style="display: flex; justify-content: center; align-items: center">
    <img src="Images/qbits.jpg" alt="bits" width="700" height="600"/>
</div>

### 2.1 Bits Cuánticos

Las computadoras actuales funcionan según los principios de la mecánica clásica. Imagina una moneda en el ámbito clásico. Cuando lanzamos la moneda, puede estar en uno de estos dos estados: "cara" (H) o "cruz" (T). Sin embargo, en un mundo cuántico, una moneda, o mejor dicho, una moneda cuántica, puede existir simultáneamente en ambos estados, "cara" y "cruz". Esta propiedad de los objetos de la mecánica cuántica, de existir en múltiples estados simultáneamente, se conoce como superposición. De manera similar, los objetos de la mecánica cuántica pueden mostrar una correlación mucho más fuerte que sus contrapartes clásicas a través del fenómeno de entrelazamiento. Utilizando el entrelazamiento, dos o más partículas cuánticas pueden estar vinculadas en perfecta armonía, incluso cuando se encuentran en extremos opuestos del universo. La computación cuántica aprovecha y explota las leyes de la mecánica cuántica, en particular la superposición, el entrelazamiento y la interferencia, para procesar información. Una idea importante en la computación cuántica es colapsar una distribución de probabilidad hacia estados de medición específicos. La interferencia cuántica es un subproducto de la superposición cuántica y ayuda a sesgar la medición cuántica hacia estados cuánticos específicos.

Volviendo a nuestra moneda cuántica, cuando observamos el estado de la moneda cuántica en superposición, misteriosamente revelará solo la información clásica de "cara" o "cruz". El proceso de observar el estado de un objeto mecánico cuántico se llama medición cuántica. La medición cuántica interactúa con el estado del objeto cuántico y colapsa el estado de superposición.

Si una moneda clásica representa un bit en el paradigma de la computación clásica, entonces la moneda cuántica representa un qubit en la computación cuántica. Qubit significa "quantum bit" (bit cuántico) y es la unidad más pequeña de cómputo en la computación cuántica.

En la computación clásica, $\mathit{n}$ bits pueden representar solo una de las $\mathit{2^n}$ posibilidades.
Por otro lado, un sistema cuántico de $\mathit{n}$ qubits puede estar en superposición de todas las $\mathit{2^n}$ posibilidades. Este comportamiento cuántico abre la posibilidad de aceleraciones exponenciales en muchas tareas de cómputo que llevarían una eternidad para que los algoritmos clásicos las calcularan.

Todas las partículas fundamentales, como electrones y fotones, en este universo son objetos cuánticos. Los estados y propiedades de estas partículas cuánticas se aprovechan para construir sistemas mecánicos cuánticos. Estos sistemas mecánicos cuánticos, en teoría, son mucho más potentes que sus contrapartes clásicas para varias tareas complejas y de alto consumo de recursos, como veremos en un momento.

La computación cuántica se ocupa de las tareas de procesamiento de información que pueden llevarse a cabo mediante sistemas mecánicos cuánticos. La mecánica cuántica es un marco matemático que ayuda a explicar los procesos físicos a nivel microscópico. Cuando intentamos observar las propiedades macroscópicas de un sistema, la mecánica clásica es suficiente. Sin embargo, estos sistemas macroscópicos, cuando se ven a nivel microscópico, todavía se comportan de acuerdo con las reglas de la mecánica cuántica.

Un bit es la unidad fundamental de información en la computación clásica. Un bit, en un instante dado, puede estar en uno de estos dos estados: "encendido" $\mathbb{(1)}$ o "apagado" $\mathbb{(0)}$.

El equivalente cuántico de un bit se llama un bit cuántico (o qubit), como discutimos brevemente anteriormente. Un qubit también puede asumir dos estados fundamentales: $\mathbb{0}$ y $\mathbb{1}$. Sin embargo, un qubit puede existir en la superposición de estos dos estados fundamentales, mientras que un bit clásico no puede. En el ámbito de la mecánica cuántica, los estados correspondientes a $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$ se representan mediante vectores bidimensionales (o de dimension 2):

\begin{align*}
\mathbf{|0\rangle} & = \begin{bmatrix} 1 \\ 0 \end{bmatrix} \\
\mathbf{|1\rangle} & = \begin{bmatrix} 0 \\ 1 \end{bmatrix} \\
\end{align*}

 Entonces, si tenemos un vector $\mathit{|\psi\rangle}$ dado como:

\begin{align*}
\mathit{|\psi\rangle = \alpha |0\rangle + \beta |1\rangle}
\end{align*}

es un estado cuántico expresado como una combinación lineal de los estados base $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$. Los coeficientes $\mathit{\alpha}$ y $\mathit{\beta}$ son números complejos ($\mathit{\alpha , \beta \in}$ $\mathbb{C}$). Por lo tanto, el $\mathit{|\psi\rangle}$ pertenece a un plano bidimensional complejo donde los estados $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$ forman una base ortonormal, comunmente llamada **base computacional**. Por lo tanto, podemos expresar $\mathit{|\psi\rangle}$ como:

\begin{align*}
\mathit{|\psi\rangle = \begin{bmatrix} \alpha \\ \beta \end{bmatrix}}
\end{align*}

¿Qué representan los coeficientes $\mathit{\alpha}$ y $\mathit{\beta}$? Cuando "medimos" un bit clásico, obtenemos $\mathbb{0}$ o $\mathbb{1}$ basado en el estado en que ese mismo bit se encuentra. Sin embargo, si tratamos de obtener el estado de un qubit, no vamos a poder los valores de $\mathit{\alpha}$ y/o $\mathit{\beta}$. Medir un qubit implicará obtener alguno de los vectores de estado base $\mathbf{|0\rangle}$ o $\mathbf{|1\rangle}$. La mecánica cuántica no puede predecir qué estado va a aparecer cuando se realice la medición del estado del qubit. Lo que la mecánica cuántica puede decirnos que el estado $\mathit{|\psi\rangle = \alpha |0\rangle + \beta |1\rangle}$ tiene una probabilidad de $\mathit{|\alpha|^2}$ de aparecer en el estado $\mathbf{|0\rangle}$ o una probabilidad de $\mathit{|\beta|^2}$ de aparecer en el estado $\mathbf{|1\rangle}$. Por lo tanto, para un qubit:

\begin{align*}
\mathit{|\alpha|^2 + |\beta|^2} = 1
\end{align*}

La suma de las probabilidades de aparecer en un estado base computacional u otro debe sumar 1, ya que los estados son mutualmente exclusivo y exhuastivos. Los coeficientes $\mathit{\alpha}$ y $\mathit{\beta}$ se llaman **amplitudes de probabilidades**. Estas mismas son números complejos y pueden tomar incluso valores negativos, cosa que el valor de una probabilidad no puede hacer. Entonces, un qubit en estado de igual superposición de los estados base computacionacionales puede ser representado como:

\begin{align*}
|+\rangle = \frac{|0\rangle + |1\rangle}{\sqrt{2}}
\end{align*}

Este estado, $|+\rangle$, también conocido como estado de Hadamard, juega un papel muy imporante en computación cuántica.

El contraste entre el estado no observable del qubit y las observaciones que realizamos mediante la medición se encuentra en el corazón de la computación e información cuántica. Dado que estamos tan sintonizados con el mundo clásico en el que un modelo abstracto se correlaciona directamente con el mundo físico, encontramos contraintuitiva la idea de que un estado no observable colapse durante la medición. Sin embargo, los estados de qubit pueden manipularse de tal manera, utilizando la superposición, entrelazamiento e interferencia, que los resultados de la medición se correlacionan de manera única con el estado no observable. **Esta propiedad de los estados cuánticos otorga poder a la computación cuántica, como veremos en varios algoritmos cuánticos.**

---

### 2.2 Representación de un Qubit

Ya hemos establecido el hecho de que, a diferencia de un bit clásico, un bit cuántico o qubit puede existir en un continuo infinito de estados, desde $\mathbf{|0\rangle}$ hasta $\mathbf{|1\rangle}$. Es útil observar una representación geométrica de un qubit en términos de lo que se llama una representación del qubit en una **esfera de Bloch** (o de Poincaré, o de Riemann).

Para el estado $\mathbf{|0\rangle}$, tenemos:

In [None]:
plot_bloch_vector([0, 0, 1])

Para el estado $\mathbf{|1\rangle}$:

In [None]:
plot_bloch_vector([0, 0, -1])

Cualquier punto en la superficie de la esfera de Bloch es un vector de estado cuántico que representa a un qubit. Para cualquier punto en la superficie de la esfera definido por el estado $\mathit{\psi}$ puede ser representado por los tres siguientes parámetros: $\mathit{\gamma}$, $\mathit{\theta}$ y $\mathit{\varphi}$. Entonces:

\begin{align*}
\mathit{|\psi\rangle} = \mathrm{e}^{i \gamma} (\cos \frac{\theta}{2}|0\rangle + \sin \frac{\theta}{2} \mathrm{e}^{i \varphi}|1\rangle)
\end{align*}

Ya que los coeficientes $\mathit{\alpha}$ y $\mathit{\beta}$ son números complejos, ambos tienen dos grados de libertad. Sin embargo, la condicion de normalización ($\mathit{|\alpha|^2 + |\beta|^2} = 1$) quita un grado de libertad, por lo tanto necesitamos $\mathbb{2 \space x \space 2 - 1 = 3}$ grados de libertad (o parámetros).

Vamos a intentar llegar a la representación de la esfera de Bloch del estado de un qubit de manera matemática. El estado del qubit, como hemos visto, se puede expresar como $\mathit{|\psi\rangle = \alpha |0\rangle + \beta |1\rangle}$, donde $\mathit{\alpha}$ y $\mathit{\beta}$ son números complejos. Por lo tanto, sabemos que podemos expresar cualquier número complejo en coordendas polares como:

\begin{align*}
\mathit{\alpha} = r\mathrm{e}^{i \phi} \space \text {donde } r=\sqrt{a^2+b^2}
\end{align*}

Si tomamos:

\begin{align*}
\mathit{\alpha} = r_{\alpha}\mathrm{e}^{i \phi_\alpha} \space \text {y} \space \beta=r_{\beta}\mathrm{e}^{i \phi_\beta}
\end{align*}

Tenemos:

\begin{align*}
\mathit{|\psi\rangle} =  r_{\alpha}\mathrm{e}^{i \phi_\alpha}|0|\rangle+r_{\beta}\mathrm{e}^{i \phi_\beta}|1\rangle = \mathrm{e}^{i\phi_\alpha} (r_\alpha|0\rangle + r_\beta \mathrm{e}^{i (\phi_\beta - \phi_\alpha)}|1\rangle)
\end{align*}

Dado que $r_{\alpha}$ y $r_{\beta}$ son la magnitud de los números complejos  ${\alpha}$ y ${\beta}$, tenemos $r\alpha = |\alpha|$ y $r_\beta = |\beta|$, y, por lo tanto, $r_\alpha^2 + r_\beta^2 = 1$. 

Podemos expresar $r_\alpha=\cos \frac{\theta}{2}$ y $r_\beta=\sin \frac{\theta}{2}$, y la expresión para $|\psi\rangle$ se simplificaría de la siguiente manera:

\begin{align*}
\mathit{|\psi\rangle} = \mathrm{e}^{i \phi_\alpha} (\cos \frac{\theta}{2}|0\rangle + \sin \frac{\theta}{2} \mathrm{e}^{i (\phi_\beta - \phi_\alpha)}|1\rangle)
\end{align*}

Reemplazando $\phi_\alpha$ con $\gamma$ y $(\phi_\beta - \phi_\alpha)$ con $\varphi$, tenemos que el vector que aparece en la esfera de Bloch que representa un estado cuántico:

\begin{align*}
\mathit{|\psi\rangle} = \mathrm{e}^{i \gamma} (\cos \frac{\theta}{2}|0\rangle + \sin \frac{\theta}{2} \mathrm{e}^{i \varphi}|1\rangle)
\end{align*}

El componente $\mathrm{e}^{i \gamma}$ es un factor de fase global que no se detecta en ningún experimento. Por esta razón, podemos tratar todos los vectores de estado de la forma $|\psi_k\rangle = \mathrm{e}^{i \gamma_k}|\psi\rangle$ como el vector de estado $|\psi\rangle$ . Discutiremos con más detalle por qué el factor de fase global no tiene un efecto observable cuando lleguemos a la medición y las expectativas de los estados observables. Si ignoramos el factor de fase global, la representación de la esfera de Bloch del estado se puede expresar de la siguiente manera:

\begin{align*}
\mathit{|\psi\rangle} =\cos \frac{\theta}{2}|0\rangle + \sin \frac{\theta}{2} \mathrm{e}^{i \varphi}|1\rangle
\end{align*}

Esta expresión nos permite expresar el vector de estado del qubit en término de dos parámetros, $\theta$ y $\varphi$.

Si lo pensamos, la esfera de Bloch nos permite proyectar el estado de un qubit en el plano complejo bidimensional sobre la superficie de una esfera tridimensional de radio unitario. Todo lo que necesitamos hacer es sustituir los valores relevantes de $\theta$ y $\varphi$ en la representación del estado del qubit en la ecuación anterior.

\begin{align*}
\text{Eje} & \quad \text{Valores de } \theta \text{ y } \varphi & \text{Estado del Qubit (Autovectores) } & \quad \text{Autovalores} \\
|z⟩ & \quad \theta = 0; \varphi = 0 & {|0⟩} \quad\quad\quad\quad\quad & \hspace{1cm} 1 \\
|−z⟩ & \quad \theta = π; \varphi = 0 & |1⟩ \quad\quad\quad\quad\quad & \hspace{1cm} -1 \\
|x⟩ & \quad \theta =\frac{\pi}{2}; \varphi=0 & \frac{1}{\sqrt{2}}|0⟩ + \frac{1}{\sqrt{2}}|1⟩ = |+\rangle & \hspace{1cm} 1 \\
|−x⟩ & \quad \theta =\frac{\pi}{2}; \varphi=\pi & \frac{1}{\sqrt{2}}|0⟩ - \frac{1}{\sqrt{2}}|1⟩ = |-\rangle & \hspace{1cm}-1 \\ 
|y⟩ & \quad \theta =\frac{\pi}{2}; \varphi=\frac{\pi}{2} & \frac{1}{\sqrt{2}}|0⟩ + \frac{i}{\sqrt{2}}|1⟩ = |y_+\rangle & \hspace{1cm} i \\
|−y⟩ & \quad \theta =\frac{\pi}{2}; \varphi=-\frac{\pi}{2} & \frac{1}{\sqrt{2}}|0⟩ - \frac{i}{\sqrt{2}}|1⟩ = |y_-\rangle & \hspace{1cm} -i \\
\end{align*}

In [None]:
plot_bloch_vector([0,0,0], coord_type='spherical')

En la esfera de Bloch, existen un número infinito de puntos, cada uno de los cuales corresponde a un estado de qubit. Sin embargo, al medir el qubit, observamos solo uno de los dos estados posibles, $\mathbf{|0\rangle}$ o $\mathbf{|1\rangle}$, si la medición se realiza en la base computacional (base Z). Las mediciones posteriores en el qubit continúan revelando el estado medido. Por lo tanto, si medimos el estado del qubit y obtenemos  $\mathbf{|0\rangle}$, las mediciones posteriores seguirán revelando el estado  $\mathbf{|0\rangle}$. En resumen, la medición cambia el estado del qubit.

#### Discusión

*Como discutimos anteriormente, el colapso del estado del qubit en uno de los estados de la base computacional es uno de los misterios de la mecánica cuántica para los cuales nadie tiene una respuesta definitiva. Hay varias interpretaciones de este fenómeno cuántico; la más popular es la interpretación de Copenhague. Según la interpretación de Copenhague, desarrollada principalmente por los eminentes físicos Niels Bohr y Werner Heisenberg, los sistemas físicos no tienen propiedades definidas antes de ser medidos, y la mecánica cuántica solo puede predecir la distribución de probabilidad de los posibles estados antes de la medición. El acto de la medición colapsa el conjunto de probabilidades en uno de los posibles estados después de la medición. Si pensáramos en la luna, según la interpretación de Copenhague, sería como si la luna no existiera hasta que la observáramos.*

*Una pregunta que podría surgir en este punto es si es posible conocer el estado del sistema cuántico antes de que el estado del qubit colapse en la medición. La respuesta a esto sería "sí", siempre que conozcamos el estado inicial del sistema cuántico y las transformaciones a las que se ha sometido el sistema cuántico desde entonces. De hecho, los algoritmos de computación cuántica se tratan de diseñar transformaciones cuánticas adecuadas en estados iniciales adecuados para sesgar la distribución de probabilidad del estado transformado hacia resultados favorables. La segunda pregunta importante es cómo estimar la probabilidad de diferentes estados en superposición, ya que la medición colapsa el estado en uno de los estados constituyentes. Si tomamos un qubit, por ejemplo, una forma de obtener una estimación de las magnitudes de α y β es midiendo múltiples qubits preparados de manera idéntica y registrando la frecuencia de los estados observados. Por ejemplo, si tenemos 1,000 qubits preparados de manera idéntica y los medimos para obtener 501 0's y 499 1's, sabríamos que las probabilidades de |α|² y |β|² son aproximadamente 1/2 cada una. Uno de los puntos clave a entender es que la naturaleza hace evolucionar el sistema cuántico y lleva un registro de la información en sus estados. Además, cuando tratamos con un sistema cuántico con múltiples qubits, la información oculta en el estado crece de manera exponencial.*

*La clave para aprovechar el poder extremo de la computación cuántica radica en nuestra capacidad para descifrar la información oculta en el estado de los sistemas cuánticos.*

*Profundizar estudiando el experimento de Stern-Gerlach*

---

### 2.3 Postulados de la mécanica cuántica aplicados a la computación cuántica

<div style="display: flex; justify-content: space-around;">
  <img src="Images/founders.jpg" alt="QMfounders" width="600" height="900" style="margin-right: 20px;"/>
  <img src="Images/historyQC.jpeg" alt="historyQC" width="350" height="900" />
</div>

$\hspace{5cm}$*Source: Understanding Quantum Technologies - Olivier Ezrraty* $\hspace{10cm}$*Source: Pablo Conte (Womanium)*

Estos postulados actúan como un puente entre el mundo físico-cuántico y el formalismo matemático usado.


#### 2.3.1 Postulado 1: Estado cuántico

El estado de un sistema cuántico se representa mediante un vector $|\psi\rangle$ en el espacio de Hilbert complejo. Un espacio de Hilbert es un espacio vectorial completo equipado con la norma inducida por el producto interno.

• El vector de estado  $|\psi\rangle$ contiene toda la información sobre el sistema cuántico en un momento dado.

• El vector de estado es un vector unitario, por lo que la norma del vector de estado es 1; es decir,  $||\psi\rangle| = {\langle\psi|\psi\rangle}^{\frac{1}{2}} = 1$.

• Según la base que elijamos, los estados pueden representar diferentes observables físicos. Por ejemplo, podemos analizar el estado del qubit con respecto a los estados de base computacionales $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$ y representar el qubit como $\psi\rangle = \alpha|0\rangle + \beta|1\rangle$. Aquí, $\alpha$ y $\beta$ son las amplitudes de probabilidad correspondientes a los estados $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$, y el qubit se encuentra en superposición de los estados ∣0⟩ y ∣1⟩. Entonces, $|\alpha|^2$ denota la probabilidad del qubit en el estado $\mathbf{|0\rangle}$, mientras que $|\beta|^2$ denota su probabilidad en el estado $\mathbf{|1\rangle}$. De manera similar, podemos expresar el estado del qubit $|\psi\rangle$ en la base $|+\rangle$ y $|-\rangle$ como  $|\psi\rangle = \gamma|+⟩ + \eta|-\rangle$, donde $|\gamma|^2$ y $|\eta|^2$ denotan la probabilidad del qubit en los estados $|+\rangle$ y $|-\rangle$, respectivamente.

#### 2.3.2 Postulado 2: Evolución cuántica

El estado de un sistema cuántico cerrado evoluciona bajo la influencia de operadores unitarios. La evolución del estado de un sistema cuántico desde el tiempo ${t_0}$ hasta ${t_1}$ se puede escribir de la siguiente manera:

$|\psi(t_1)\rangle = U(t_1, t_0) |\psi(t_0)\rangle$ donde $U(t_1, t_0)$ es el operador unitario que lleva al sistema cuántico desde el estado $|\psi(t_0)\rangle$ al estado $|\psi(t_1)\rangle$.

#### 2.3.3 Postulado 3: Medición Cuántica

Hemos establecido anteriormente que podemos expresar el estado en términos de una base ortogonal adecuada que representa ciertas cantidades físicas medibles. El estado $|\psi\rangle$ en general se puede expresar como una superposición de estos estados de base ortogonal. Si intentamos medir el estado del qubit en la base $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$, dado que el qubit es $|\psi\rangle = \alpha|0\rangle + \beta|1\rangle$, la medición daría como resultado uno de los estados $\mathbf{|0\rangle}$ y $\mathbf{|1\rangle}$:

* La probabilidad de que la medición dé como resultado el estado $\mathbf{|0\rangle}$ es $|\alpha|^2$, mientras que la del estado $\mathbf{|1\rangle}$ es $|\beta|^2$.

* El estado post-medición del qubit es el estado de base que se midió. Por ejemplo, si medimos el estado del qubit nuevamente como $\mathbf{|0\rangle}$, obtendremos el mismo estado $\mathbf{|0\rangle}$.

Cuando realizamos una medición, el sistema cuántico ya no está cerrado, ya que interactúa con el proceso de medición. Por lo tanto, después de la medición, el estado cuántico ya no evoluciona bajo la ecuación de Schrödinger.

---

## 2.4 Mediciones y Generalidades

<div style="display: flex; justify-content: center; align-items: center">
    <img src="Images/measure.png" alt="measures" width="600" height="250"/>
</div>

$\hspace{6cm}$*Source: Understanding the basics of measurements in Quantum Computation - Nimish Mishra (Medium)*

Las medidas de un estado cuántico $|\psi\rangle$ se definen en términos de una colección de operadores de medición ${M_k}$ = {$M_0, M_1, \dots, M_{m−1}$}. Estos operadores de medición actúan sobre el estado $|\psi\rangle$ del sistema que se está midiendo. Los operadores de medición para el resultado $k$ se definen mediante el operador $M_k$, y la probabilidad de medir el resultado como $k$ se da mediante la siguiente expresión:

\begin{align*}
P(k) = \langle\psi|M^\dagger_k M_k| \psi\rangle
\end{align*}

El estado del sistema cuántico después de la medición del resultado $k$ se da mediante la siguiente expresión:

\begin{align*}
\frac{M_k|\psi\rangle}{\sqrt{{\langle\psi|M^\dagger_k M_k|\psi\rangle}}}
\end{align*}

Los operadores de medición ${M_k}$ deben satisfacer la ecuación de completitud, como podemos ver:

\begin{align*}
\sum_{k} M^\dagger_k M_k = I
\end{align*}

Esta ecuación de completitud se deriva del hecho de que la suma de las probabilidades relacionadas con los diferentes operadores de medición en el conjunto {$M_k$} debe sumar 1. Entonces:

\begin{align*}
\sum_{k} P(k)=1
\rightarrow
\sum_{k} \frac{M_k|\psi\rangle}{\sqrt{{\langle\psi|M^\dagger_k M_k|\psi\rangle}}}
\rightarrow
\langle\psi|\sum_{k} M^\dagger_k M_k|\psi\rangle = 1
\end{align*}

La única manera de que esto se satisfaga es que $\sum_{k} M^\dagger_k M_k$ sea igual a $1$.

Hasta ahora, no hemos hecho ninguna suposición sobre la estructura de estos operadores de medición $M_k$. Siempre y cuando satisfagan la ecuación de completitud y produzcan valores de probabilidad positivos válidos, serán operadores de medición válidos. Ahora veamos cómo puedes definir estos operadores de medición cuando planeamos realizar mediciones de los diferentes estados de la base computacional. Si trabajamos con los estados ortogonales de la base computacional {$|\phi_k\rangle$}, entonces podemos definir los operadores de medición como $M_k = |\phi_k\rangle|\langle\phi_k|$. Es fácil verificar que para un estado $|\psi\rangle$}expresado en la base computacional {$|\phi_k\rangle$} como $|\psi\rangle = \sum_k \alpha_k|\phi_k\rangle$, los operadores de medición $M_k = |\phi_k\rangle|\langle\phi_k|$ producen probabilidades válidas y satisfacen la ecuación de completitud, como podemos ver en lo siguiente:


\begin{align*}
\langle\psi|M^\dagger_k M_k|\psi\rangle = \sum_{j} \alpha^*_j \langle\phi_j|\phi_k\rangle \langle\phi_k|\phi_k\rangle \langle\phi_k|\sum_{i} \alpha_i|\phi_i\rangle =
\alpha^*_k \alpha_k \langle\phi_k|\phi_k\rangle \langle\phi_k|\phi_k\rangle = |\alpha_k|^2
\end{align*}

Los operadores de medición relacionados con una base ortogonal dada siguen la ecuación de completitud, como podemos ver:

\begin{align*}
\sum_{k} M^\dagger_k M_k = \sum_{k} |\phi_k\rangle \langle\phi_k|\phi_k\rangle \langle\phi_k| = \sum_{k} |\phi_k\rangle \langle\phi_k| = I
\end{align*}

Algunas propiedades importantes de los operadores de medición son las siguientes:

* Los operadores de medición son hermitianos.

* Los operadores de medición $M_k$ son idempotentes, es decir, $M_k^2 = M_k$. De hecho, para una matriz idempotente, $M_k^N = M_k$, donde $N$ es un entero mayor que $1$. La propiedad idempotente es deseada para un operador de medición $M_k$. Esto se debe a que una vez que se ha realizado la medición $k$, el estado colapsa al estado $|\phi_k\rangle$ correspondiente al resultado $k$, y, por lo tanto, no importa cuántas veces midamos el sistema, siempre mediremos el estado $|\phi_k\rangle$.

* A través de los operadores de medición, podemos distinguir de manera confiable los estados ortonormales. Si tenemos una base ortonormal $|\phi_0\rangle, |\phi_1\rangle, \dots, |\phi_{n−1}\rangle$, podemos definir operadores de medición de la forma $M_k = |\phi_k\rangle\langle\phi_k|$ para cada uno de los vectores de la base ortonormal. Para cualquier estado dado $|\phi_k\rangle$, solo el operador de medición  $M_k = |\phi_k\rangle\langle\phi_k|$ sería capaz de detectarlo con probabilidad $1$, como vemos:

\begin{align*}
\langle\phi_k|M^\dagger_k M_k|\phi_k\rangle = \langle\phi_k|\phi_k\rangle \langle\phi_k|\phi_k\rangle \langle\phi_k|\phi_k\rangle = 1
\end{align*}

Ahora, supongamos que el conjunto de base $|\phi_0\rangle, |\phi_1\rangle, \dots, |\phi_{n−1}\rangle$ no es ortogonal, y, como antes, definimos el operador de medición $M_k = |\phi_k\rangle\langle\phi_k|$ para detectar el resultado $k$. Dado que los estados son no ortogonales, incluso un estado de base diferente de $|\phi_k\rangle$, denotado como $|\phi_{-k}\rangle$, puede tener una superposición no nula con $|\phi_k\rangle$ (es decir, $\langle \phi_{−k}|\phi_k\rangle \neq 1$), por lo que la probabilidad de detectar un estado diferente a $k$ mediante el operador de medición $M_k$ es diferente de $0$, como podemos ver:

\begin{align*}
\langle\phi_{-k}|M^\dagger_k M_k|\phi_{-k}\rangle = \langle\phi_{-k}|\phi_k\rangle \langle\phi_k|\phi_k\rangle \langle\phi_k|\phi_{-k}\rangle \neq 1
\end{align*}

#### 2.4.1 Mediciones proyectivas

Las mediciones proyectivas son una forma de combinar los operadores de medición individuales $P_0, P_1, \dots, P_{N-1}$ correspondientes a los vectores de base ortogonal $|\phi_0\rangle, |\phi_1\rangle, \dots, |\phi_{N-1}\rangle$. Un operador de medición proyectiva $M$ es un operador Hermitiano que tiene la representación dada por lo siguiente:

\begin{align*}
M = \sum_{k} k P_k
\end{align*}

Tengamos en cuenta que aunque los operadores $P_0, P_1, \dots, P_{N-1}$ relacionados con los estados de base individuales son unitarios, el operador de medición proyectiva M no es un operador unitario. Dado que $P_k = |\phi_k\rangle\langle\phi_k|$, tenemos que $M=\sum_{k} k|\phi_k\rangle \langle\phi_k|$. Los operadores ${P_k}$ se pueden considerar como operadores de proyección en los autosubespacio del operador $M$ con autovalores $k$. La probabilidad de medir el resultado $k$ al medir el estado $∣\psi\rangle$ se da mediante lo siguiente:

\begin{align*}
P(k) = \langle\psi|P_k|\psi\rangle
\end{align*}

El estado post-medición dado que ocurre el resultado $m$ se da mediante lo siguiente:

\begin{align*}
\frac{P_k|\psi\rangle}{\sqrt{P(k)}}
\end{align*}

Los operadores proyectores individuales ${P_m}$ son idempotentes, es decir, $P_k^2 = P_k$ . La propiedad idempotente asegura que si ocurre el resultado $k$ en la medición del estado $|\psi\rangle$, entonces en mediciones repetidas sobre el estado post-medición, se observaría el mismo resultado $k$. Además, los operadores proyectores siguen la ecuación de completitud, ya que las probabilidades deben sumar $1$, como se muestra aquí:

\begin{align*}
\sum_{k} P(k) = \sum_{k} \langle\psi|P_k|\psi\rangle = 1
\rightarrow
\langle\psi|\sum_{k} P_k |\psi\rangle = 1
\end{align*}

Ahora, para que la ecuación anterior sea verdadera, $\sum_{k} P_k$ tiene que ser igual a la matrix identidad $I$,  lo que da la ecuación de completitud para los operadores proyectores de la siguiente manera:

\begin{align*}
\sum_{k} P_k = I
\end{align*}

Los operadores proyectores ${P_k}$, además de obedecer la ecuación de completitud y producir probabilidades válidas, deben seguir esta relación:

\begin{align*}
P_n P_m = \delta_{nm} P_m \quad \text{donde \space} \delta_{nm} \space \text{es el delta de kronecker}
\end{align*}

En esencia, lo anterior significa que las operaciones de proyección dividen el vector de estado general $|\psi\rangle$ en subespacios ortogonales. Esto se puede validar fácilmente, ya que para $m \neq n$ tenemos lo siguiente:

\begin{align*}
P_n P_m = |\phi_n\rangle \langle\phi_n|\phi_m\rangle \langle\phi_m| = |\phi_n\rangle 0 \langle\phi_m| = 0_{NxN}
\end{align*}

El resultado $0_{N×N}$ en la ecuación anterior es  una matriz cuadrada de dimensión ${N×N}$ con entradas todas $0$. De manera similar, cuando ${P_n = P_m}$, tenemos lo siguiente:

\begin{align*}
P_m P_m = |\phi_m\rangle \langle\phi_m|\phi_m\rangle \langle\phi_m| = |\phi_m\rangle \langle\phi_m| = P_m
\end{align*}

Los operadores de medición proyectiva son útiles para calcular propiedades estadísticas de los resultados que pueden ser representados por una base ortogonal. Por ejemplo, podemos calcular el resultado medio de un sistema cuántico en función de su estado $|\phi\rangle$ de la siguiente manera:

\begin{align*}
E[M] = \sum_{k} kp(k) 
\end{align*}

Expresemos el estado cuántico en la base de medición como $|\psi\rangle = \sum_i c_i |\phi_i\rangle$. La probabilidad del resultado $k$ se puede expresar como $p(k) = \langle\psi|P_k|\psi\rangle$ ya que $\langle\psi|P_k|\psi\rangle = \langle\psi|\phi_k\rangle \langle\phi_k|\psi\rangle = c_k^* c_k = |c_k|^2 $. Usando esta información, podemos expresar la expectativa del operador de medición $M$ de la siguiente manera:

\begin{align*}
E[M] = \sum_{k} kp(k) = \sum_{k} \langle\psi|P_k|\psi\rangle = \langle\psi|\sum_k k P_k|\psi\rangle = \langle\psi|M|\psi\rangle
\end{align*}

Generalmente denotamos la expectativa del resultado correspondiente a un operador de medición $M$ como $⟨M⟩$.

La desviación estándar $ΔM$ se puede expresar en términos del operador de medición $M$ de la siguiente manera:

\begin{align*}
(ΔM)^2 = E[M^2] - E[M]^2 = \langle M^2\rangle - \langle M \rangle^2
\end{align*}

La desviación estándar del operador de medición $M$ es una medida de la dispersión de los resultados si se hicieran varias copias idénticas del estado cuántico $|\psi\rangle$ y se hiciera una medición con respecto a los vectores de la base de medición del operador $M$. La desviación estándar de los operadores de medición proyectiva conduce al famoso **principio de incertidumbre de Heisenberg**.

#### 2.4.2 Projecciones Valoradas por Operadores Positivos (POVM)

Los operadores de medición generales, así como los operadores de medición proyectiva, no solo proporcionan una regla para medir la probabilidad de varios resultados, sino que también ofrecen una formulación clara del estado post-medición. Sin embargo, en diversas aplicaciones, el estado post-medición no es tan importante para un experimento; la capacidad para medir las probabilidades de los distintos resultados es lo único que importa. En tales casos, El esquema de **medición POVM** resulta ser una formulación conveniente. Podemos definir operadores positivos $E_k$ de manera que la probabilidad del resultado $k$ cuando se mide el estado $∣\psi\rangle$ sea la siguiente:

\begin{align*}
P(k) = \langle\psi|E_k|\psi\rangle
\end{align*}

Un operador positivo $A$ en un espacio de Hilbert $V$ es aquel que satisface $\langle\psi|A|\psi\rangle≥0$ para cada $∣\psi\rangle \in V$. Por lo tanto, asegurarse de que los operadores $E_k$ sean positivos garantizaría que las probabilidades estén representadas por $P(k)≥0$. Si tenemos $N$ resultados de interés, tendríamos que construir los operadores positivos $E_k$ de manera que se cumpla la ecuación de completitud, es decir, $\sum_k E_k = I$. Los operadores $E_k$ se conocen como los **elementos POVM**, mientras que el conjunto completo {$E_k$} se conoce como el **POVM**. A diferencia de los operadores de medición proyectiva {$P_k$}, los operadores POVM {$E_k$} no necesitan cumplir la relación $E_n E_m = \delta_{nm} E_m$. Por lo tanto, los operadores de medición positivos {$E_k$} no están limitados a medir solo resultados relacionados con un conjunto de estados de base ortonormal. En ese sentido, el POVM es más general que los operadores de medición proyectiva, y estos últimos son, de hecho, un caso especial de los primeros. En lugar de ilustrar que la medición proyectiva es un caso especial de POVM, veamos el caso más interesante en el que POVM difiere de la medición proyectiva. Supongamos que queremos detectar dos estados que no son necesariamente ortogonales. Podemos tomar los dos estados como $∣\psi_1\rangle=∣0\rangle$ y $∣\psi_2\rangle=\frac{1}{\sqrt{2}}(∣0\rangle+|1\rangle)$. Como es de esperar, no sería posible medir estos dos estados con total certeza debido a la superposición entre los estados $∣\psi_1\rangle$ y $∣\psi_2\rangle$. Definamos tres elementos POVM de la siguiente manera y veamos cómo podemos detectar mejor los dos eventos:

\begin{align*}
E_1 = \frac{\sqrt{2}}{1+\sqrt{2}}|1\rangle \langle1| \\
E_2 = \frac{\sqrt{2}}{1+\sqrt{2}}(|0\rangle - |1\rangle)(\langle 0|- \langle 1|) \\
E_3 = I - E_1 - E_2
\end{align*}

Si el estado medido es $∣\psi_1\rangle=∣0\rangle$, entonces $E_1$ nunca se observaría, ya que corresponde al estado ortogonal $∣1\rangle$. Sin embargo, si se detecta $E_1$, podemos inferir con seguridad que el estado que se está midiendo debe ser el estado $|\psi_2\rangle=\frac{1}{\sqrt{2}}(∣0\rangle+|1\rangle)$. Siguiendo líneas de razonamiento similares, si se detecta $E_2$, entonces debe ser el estado $∣\psi_1\rangle=∣0\rangle$ (no puede ser el estado $|\psi_2\rangle=\frac{1}{\sqrt{2}}(∣0\rangle+|1\rangle)$ ya que es ortogonal a $(|0\rangle - |1\rangle)$). Cuando se detecta $E_3$, no podemos decir nada con certeza sobre el estado que se está midiendo. El punto central aquí es que con el POVM nunca cometemos el error de identificar incorrectamente el estado que se nos presenta para medir. Simplemente, en ocasiones no podemos determinar el estado real que se nos presenta.

#### 2.4.3 Mediciones y fase global

Recordemos la siguiente expresión:

\begin{align*}
\mathit{|\psi\rangle} = \mathrm{e}^{i \gamma} (\cos \frac{\theta}{2}|0\rangle + \sin \frac{\theta}{2} \mathrm{e}^{i \varphi}|1\rangle) =
 \mathrm{e}^{i \gamma} (\alpha|0\rangle + \beta \mathrm{e}^{i \varphi}|1\rangle)
\end{align*}

El componente $\mathrm{e}^{i \gamma}$ se llama fase global y no interfiere con el estado cuántico. Veamos por qué.

Si medimos el estado en la base $Z$ o computacional, tenemos:

\begin{align*}
P(\ket{0}) = |\mathrm{e}^{i \gamma}\alpha|^2 \\
P(\ket{1}) = |\mathrm{e}^{i \gamma}\mathrm{e}^{i \varphi}\beta|^2
\end{align*}

Entonces:

\begin{align*}
P(\ket{0}) = |\mathrm{e}^{i \gamma}\alpha|^2 = |\mathrm{e}^{i \gamma}|^2|\alpha|^2 = |\cos\gamma +i\sin\gamma|^2|\alpha|^2 = (\sqrt{\cos^2\gamma+\sin^2\gamma})^2|\alpha|^2 = (\sqrt{1})^2|\alpha|^2 = |\alpha|^2 
\end{align*}

Por transitividad vemos que:

\begin{align*}
P(\ket{1}) = |\mathrm{e}^{i \gamma}\mathrm{e}^{i \varphi}\beta|^2 = |\mathrm{e}^{i \gamma}|^2|\mathrm{e}^{i \varphi}|^2|\beta|^2 = |\beta|^2
\end{align*}

Podemos ver entonces que la fase global no puede ser detectada por la medición del estado cuántico.

### 2.5 Compuertas cuánticas simples

#### 2.5.1 Compuerta X (NOT cuántica)

Una compuerta clásica NOT cambia el estado del bit a 1 cuando el estado existente es 0, y viceversa. Una compuerta NOT cuántica hace algo similar pero en términos de las amplitudes de los estados de la base computacional del qubit. Asigna la amplitud de probabilidad del estado $|0\rangle$ al estado $|1\rangle$, y viceversa. La compuerta cuántica NOT funciona como un operador X, como se muestra aquí:

\begin{align*}
X:\alpha∣0\rangle+\beta∣1\rangle
\rightarrow
\beta∣1\rangle+\alpha∣0\rangle
\end{align*}

Si expresamos el estado del qubit como un vector en la base computacional, entonces tenemos esto:

\begin{align*}
X:\begin{bmatrix} \alpha \\
\beta \end{bmatrix}
=
\begin{bmatrix} \beta \\
\alpha\end{bmatrix}
\end{align*}

Ahora intentemos decodificar cómo se vería la representación de $X$ como una matriz. Como podemos ver, $X$ transforma un vector en otro vector de la misma dimensión, por lo que $X$ se puede representar como una matriz cuadrada. Una matriz cuadrada que simplemente invierte los componentes de un vector bidimensional es nada más que la matriz $X$, como se muestra a continuación:

\begin{align*}
\sigma_x = X = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix}
\end{align*}

La probabilidad total debe conservarse bajo la transformación de una compuerta cuántica. Para la compuerta NOT, podemos ver que la probabilidad se conserva.

#### 2.5.2 Compuerta Z

La compuerta cuántica Z deja el estado $∣0\rangle$ sin cambios, mientras que cambia el estado $∣1\rangle$ a $−∣1\rangle$. La transformación de la compuerta cuántica $Z$ se representa de la siguiente manera:

\begin{align*}
\sigma_z = Z = \begin{bmatrix} 1 & 0 \\ 0 & -1 \end{bmatrix}
\end{align*}

Entonces, dado cualquier estado arbitrario $|\psi\rangle = \alpha|0\rangle + \beta|1\rangle$, la compuerta $Z$ lo cambia y transforma en $\alpha|0\rangle + \beta|1\rangle$. La compuerta cuántica $Z$ se puede expresar en términos de los productos externos de los estados de la base computacional de la siguiente manera:

\begin{align*}
\ Z = |0\rangle \langle 0| - |1\rangle \langle 1|
\end{align*}

La compuerta Z también puede expresarse como:

\begin{align*}
Z = \begin{bmatrix} 1 & 0 \\ 0 & \mathrm{e}^{i\pi} \end{bmatrix}
\end{align*}

#### 2.5.3 Compuerta de Hadamard (H)

La compuerta Hadamard actúa sobre un qubit en el estado $|0\rangle$ y lo lleva al estado de igual superposición $\frac{1}{\sqrt{2}}(∣0\rangle+|1\rangle)$. También transforma el estado $|1\rangle$ en el estado $\frac{1}{\sqrt{2}}(∣0\rangle-|1\rangle)$.La matriz unitaria correspondiente a la compuerta Hadamard es la siguiente:

\begin{align*}
H = \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \\ 1 & -1 \end{bmatrix}
\end{align*}

Podemos expresar también:

\begin{align*}
H|0\rangle = |+\rangle \\
H|1\rangle = |-\rangle
\end{align*}

#### 2.5.4 Compuerta Y

La compuerta Pauli-Y transforma el estado $|0\rangle$ en $-i|1\rangle$ y el estado $|1\rangle$ en $i|0\rangle$. Su matriz unitaria correspondiente se expresa de la siguiente manera:

\begin{align*}
\sigma_Y = Y = \begin{bmatrix} 0 & -i \\ i & 0 \end{bmatrix}
\end{align*}

Esto representa una rotación de 180 grados alrededor del eje Y en la esfera de Bloch.

#### 2.5.5 Compuerta P

La compuerta P hace una rotación de $\phi$ alrededor del eje $Z$. Su matriz es:

\begin{align*}
P = \begin{bmatrix} 1 & 0 \\ 0 & \mathrm{e}^{i\phi} \end{bmatrix}
\end{align*}

Podemos inferir entonces que cuando $\phi=\pi$, la compuerta $P$ es la compuerta $Z$.

#### 2.5.6 Compuerta S

La compuerta $S$ hace una rotación de $\phi=\pi/2$ alrededor del eje $Z$. También se la conoce como la matriz $\sqrt{Z}$. Su matriz es:

\begin{align*}
S = \begin{bmatrix} 1 & 0 \\ 0 & \mathrm{e}^{i\pi/2} \end{bmatrix}
\end{align*}

Tengamos en cuenta que la matriz $S$ **NO** es su propia inversa.

#### 2.5.7 Compuerta T

La compuerta $T$ hace una rotación de $\phi=\pi/4$ alrededor del eje $Z$. También se la conoce como la matriz $\sqrt[4]{Z}$. Su matriz es:

\begin{align*}
T = \begin{bmatrix} 1 & 0 \\ 0 & \mathrm{e}^{i\pi/4} \end{bmatrix}
\end{align*}

Tengamos en cuenta que la matriz $T$ **TAMPOCO** es su propia inversa.

#### 2.5.8 Compuerta I

La compuerta $I$ es trivial y es el elemento neutro de las compuertas. También se la conoce como la matriz identidad. Su matriz es:

\begin{align*}
I = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix}
\end{align*}

#### 2.5.9 Compuerta U (compuerta general unitaria)

Todas las compuertas $I, Z, S, T$ son casos especiales de la compuerta $P$. De la misma manera,la compuerta $U$ es la compuerta más general de todas las compuertas simples. Está completamente parametrizada por $ \theta, \varphi, \omega$:

\begin{align*}
U(\theta, \phi, \omega) =
\begin{bmatrix}
    \cos(\frac{\theta}{2})e^{i(\varphi + \omega)/2} & -\sin(\frac{\theta}{2})e^{i(\varphi - \omega)/2} \\
    \sin(\frac{\theta}{2})e^{-i(\varphi - \omega)/2} & \cos(\frac{\theta}{2})e^{-i(\varphi + \omega)/2}
\end{bmatrix}
\end{align*}

Por ejemplo:

\begin{align*}
U(\pi/2, 0, \pi) =
\begin{bmatrix}
    \cos(\frac{\pi/2}{2})e^{i(0 + \pi)/2} & -\sin(\frac{\pi/2}{2})e^{i(0 - \pi)/2} \\
    \sin(\frac{\pi/2}{2})e^{-i(0 - \pi)/2} & \cos(\frac{\pi/2}{2})e^{-i(0 + \pi)/2}
\end{bmatrix}
= \frac{1}{\sqrt{2}} \begin{bmatrix} 1 & 1 \\ 1 & -1
\end{bmatrix}
= H
\\
\\
U(0, 0, \omega) =
\begin{bmatrix}
    \cos(\frac{0}{2})e^{i(0 + \omega)/2} & -\sin(\frac{0}{2})e^{i(0 - \omega)/2} \\
    \sin(\frac{0}{2})e^{-i(0 - \omega)/2} & \cos(\frac{0}{2})e^{-i(0 + \omega)/2}
\end{bmatrix}
= \begin{bmatrix} 1 & 0 \\ 0 & \mathrm{e}^{i\omega}
\end{bmatrix}
= P
\end{align*}

Es evidente a partir de esto que existen un número infinito de compuertas posibles, lo que incluye las compuertas de rotación $R_x$ y $R_y$, aunque no se mencionan aquí. También debe tenerse en cuenta que no hay nada especial en la base $Z$, excepto que se ha seleccionado como la base computacional estándar.

### 2.6 Compuerta Cuánticas Compuestas

Hemos repasado algunos de los importantes compuertas cuánticas de un solo qubit. Ahora cambiaremos nuestra atención a algunas de las importantes compuertas multiqubit.
Cuando pensamos en compuertas clásicas de $2$ bits, pensamos en las compuertas $AND$, $XOR$, $NAND$ y $NOR$. De hecho, la compuerta $NAND$ en el paradigma de la computación clásica se llama la compuerta universal, ya que cualquier otra compuerta en bits se puede construir combinando puertas $NAND$.
Una de las compuertas de dos qubits que nos ha ayudado a construir compuertas cuánticas universales es la compuerta **NOT condicional**, o compuerta **CNOT**, que ilustraremos en lo siguiente.

#### 2.6.1 Compuerta NOT controlada (CNOT)

La puerta $CNOT$ trabaja en dos qubits: el qubit $A$, que se denomina qubit de control, y el qubit $B$, que es el qubit objetivo. Al aplicar una puerta $CNOT$, el estado del qubit de control permanece sin cambios. El estado del qubit objetivo se invierte en caso de que el qubit de control esté en el estado $|1\rangle$.

El estado de la base computacional de dos qubits es el producto tensorial de sus estados de base correspondientes. Por ejemplo, el estado de dos qubits cuando ambos qubits están en el estado $|0\rangle$ se expresa como $|0\rangle_A \otimes |0\rangle_B$. Simplificamos la notación y escribimos el estado $|0\rangle_A \otimes |0\rangle_B$ como $∣00\rangle$. La siguiente tabla muestra cómo cambia el estado de la base computacional de los qubits al aplicar una puerta CNOT:

\begin{align*}
\text{Estado Anterior} & \quad\quad\quad \text{Estado Posterior} \\
|00\rangle & \hspace{3cm}|00\rangle \\
|01\rangle & \hspace{3cm}|01\rangle \\
|10\rangle & \hspace{3cm}|11\rangle \\
|11\rangle & \hspace{3cm}|10\rangle \\ 
\end{align*}

La idea de aprender cómo una compuerta cuántica transforma el estado de la base computacional es útil ya que las compuertas cuánticas son operadores lineales. Esto nos permite sumar linealmente los estados transformados correspondientes a los estados de la base computacional para comprender la transformación de una compuerta cuántica en un estado de superposición. Por lo tanto, para un operador unitario U (funciona para cualquier operador lineal) que opera en un estado de qubit $\alpha|0\rangle + \beta|1\rangle$, podemos escribir:

\begin{align*}
\ U(\alpha|0\rangle+\beta|1\rangle) = \alpha U|0\rangle + \beta U|1\rangle
\end{align*}

Ahora, si observamos detenidamente la tabla anterior, vemos que el estado del qubit objetivo después de aplicar la puerta CNOT no es más que la adición módulo 2 de los estados de los dos qubits antes de que se aplique la puerta $CNOT$. Por lo tanto, la operación $CNOT$ en los dos qubits se puede representar de la siguiente manera:

\begin{align*}
CNOT:|A,B\rangle = |A,B \oplus A\rangle
\end{align*}

La matrix que representa a la compuerta $CNOT$ es una matriz de dimensión $4x4$ (recordemos que tenemos 2 qubits):

\begin{align*}
CNOT = 
\begin{bmatrix}
1 & 0 & 0 & 0 \\
0 & 1 & 0 & 0 \\
0 & 0 & 0 & 1 \\
0 & 0 & 1 & 0 \\
\end{bmatrix}
\end{align*}

Los invitamos a validar si la compuerta CNOT es unitaria o no chequeando $CNOT \space CNOT^\dagger = I$

El estado cuántico $∣\psi\rangle = \alpha_{00}|00\rangle + \alpha_{01}|01\rangle + \alpha_{10}|10\rangle + \alpha_{11}|11\rangle$, donde el primer qubit es el qubit de control y el segundo qubit es el qubit objetivo para la puerta $CNOT$, se transforma en el estado $∣\psi_{nuevo}\rangle =  \alpha_{00}|00\rangle + \alpha_{01}|01\rangle + \alpha_{11}|10\rangle + \alpha_{10}|11\rangle$:

\begin{align*}
∣\psi_{nuevo}\rangle = CNOT |\psi\rangle =
\begin{bmatrix}
1 & 0 & 0 & 0 \\
0 & 1 & 0 & 0 \\
0 & 0 & 0 & 1 \\
0 & 0 & 1 & 0 \\
\end{bmatrix}
\begin{bmatrix}
\alpha_{00}\\
\alpha_{01}\\
\alpha_{10}\\
\alpha_{11}\\
\end{bmatrix}
=
\begin{bmatrix}
\alpha_{00}\\
\alpha_{01}\\
\alpha_{11}\\
\alpha_{10}\\
\end{bmatrix}
\end{align*}

La compuerta $XOR$ puede considerarse en cierto sentido como el equivalente clásico de la compuerta $CNOT$ cuántica si solo consideramos la salida del qubit de destino. La salida de la compuerta $XOR$ no es más que la suma módulo 2 de sus dos bits de entrada $A$ y $B$. Sin embargo, a diferencia de la compuerta $CNOT$, la compuerta $XOR$ **no es reversible**. Cualquier operación de compuerta cuántica, al ser unitaria, es reversible. Por lo tanto, aplicando la transformación inversa de una compuerta unitaria, podemos recuperar el estado original del sistema cuántico. Cabe señalar que la inversa de una transformación unitaria también es unitaria. La compuerta $XOR$ clásica no es reversible, ya que dado el resultado de la compuerta $XOR$, no podemos determinar sus dos entradas con certeza. Sin embargo, podemos pasar uno de los bits, por ejemplo, el bit $A$, como una salida adicional para hacer que la compuerta $XOR$ sea reversible. De entre varias compuertas multiqubit, la compuerta $CNOT$ es especial, ya que cualquier compuerta cuántica se puede construir utilizando la compuerta $CNOT$ y una o varias compuertas de un solo qubit. En otras palabras, la compuerta $CNOT$ y las compuertas de un solo qubit forman un conjunto universal de compuertas cuánticas con las que podemos construir cualquier compuerta cuántica dada con un nivel de precisión arbitrario (Para mas información, investigar el **teorema de Solovay-Kitaev**).

#### 2.6.2 Compuerta U-Controlada

Otra compuerta multiqubit que merece mención especial es la compuerta controlada-U. Supongamos que tenemos un operador unitario U que actúa sobre un sistema cuántico de $n$ qubits. Podemos pensar en una compuerta controlada-U como una que aplica el operador unitario $U$ en el sistema de $n$ qubits de destino en función del estado de un qubit de control. Cuando el qubit de control está en el estado $∣1\rangle$, se aplica el operador unitario en el sistema de $n$ qubits de destino, mientras que cuando el qubit de control está en el estado $∣0\rangle$, no se aplica ninguna transformación en el sistema de $n$ qubits de destino. **La puerta controlada-U es un componente clave de las implementaciones cuánticas basadas en la transformada de Fourier**.

---

## 3. Simulación de un circuito

Simular un circuito cuántico de un qubit por cada compuerta cuántica X, Y, Z y H sin utilizar Qiskit

In [None]:
import numpy as np
from collections import Counter

In [None]:
def iniciar_estado() -> np.ndarray:
    """
    Prepara al qubit en el estado |0>.
    Returns:
        np.ndarray: vector de estado |0>.
    """
    return np.array([1.0, 0.0], dtype=complex)

In [None]:
def aplicar_u(U: np.ndarray, estado: np.ndarray) -> np.ndarray:
    """
    Aplica una matriz unitaria U a un vector de estado.

    Args:
        U (np.ndarray): arreglo (2,2) complejo que representa una matriz unitaria.
        estado (np.ndarray): arreglo (2,) complejo que representa el vector de estado actual.

    Returns:
        np.ndarray: el vector de estado después de aplicar U.
    """
    return U @ estado

In [None]:
def medicion_estado(estado: np.ndarray, num_med: int) -> Counter:
    """
    Mide un estado cuántico `num_med` veces en la base computacional {|0>, |1>}.

    Args:
        estado (np.ndarray): vector de estado (2,) complejo.
        num_med (int): número de mediciones.

    Returns:
        Counter: conteo de los resultados {0: ..., 1: ...}.
    """
    # probabilidades (normalizamos por seguridad)
    probs = np.abs(estado) ** 2
    probs = probs / probs.sum()

    mediciones = []
    for _ in range(num_med):
        salida = np.random.choice([0, 1], p=probs)
        mediciones.append(salida)

    return Counter(mediciones)

In [None]:
def algoritmo_cuantico(U: np.ndarray, shots: int = 1000) -> Counter:
    """
    Simula un algoritmo de 1 qubit:
    1. Prepara |0>
    2. Aplica U
    3. Mide en la base computacional `shots` veces.

    Args:
        U (np.ndarray): matriz unitaria (2,2) compleja.
        shots (int): número de mediciones.

    Returns:
        Counter: frecuencias de 0 y 1.
    """
    estado = iniciar_estado()
    estado = aplicar_u(U, estado)
    return medicion_estado(estado, shots)

In [None]:
# Definimos Compuerta Pauli-X (X)
X_gate = np.array([[0, 1],
                   [1, 0]], dtype=complex)

# Definimos Compuerta Pauli-Y (Y)
Y_gate = np.array([[0, -1j],
                   [1j, 0]], dtype=complex)

# Definimos Compuerta Pauli-Z (Z)
Z_gate = np.array([[1, 0],
                   [0, -1]], dtype=complex)

# Definimos Compuerta de Hadamard (H)
H_gate = (1/np.sqrt(2)) * np.array([[1, 1],
                                    [1, -1]], dtype=complex)

# Diccionario de compuertas
gates = {'Compuerta X':X_gate, 'Compuerta Y':Y_gate, 'Compuerta Z':Z_gate,  'Compuerta Hadamard':H_gate}

In [None]:
for key, gate in gates.items():
    print(f'Para la {key}, el resultado es:',algoritmo_cuantico(gate),'\n')

### Referencias

*Textos traducidos y apaptados de Qiskit Textbook y "Quantum Machine Learning with Python Using Cirq from Google Researcg and IBM Qiskit"* 