# Quantenschaltungen

![Zeichentrickfilm eines Quantenschaltkreises.](images/quantum-circuits/hero.gif)

Diese Lektion stellt das Berechnungsmodell von *Quantenschaltung* vor. Dies ist eine Standardbeschreibung von Quantencomputation, die wir im weiteren Verlauf verwenden werden.

Wir führen ebenfalls einige wichtige mathematische Konzepte ein, darunter *innere Produkte* zwischen Vektoren, die Begriffe *Orthogonalität* und *Orthonormalität* sowie *Projektionen* und *projektive Messungen* , die Standardbasismessungen verallgemeinern. Durch diese Konzepte werden wir grundlegende Limitation der Quanteninformation herleiten, einschließlich des *No-Cloning-Theorems* und der Unmöglichkeit, nicht-orthogonale Quantenzustände perfekt zu unterscheiden.

## 1. Schaltkreise

In der Informatik sind *Schaltkreise* Berechnungsmodelle, bei denen Informationen über Drähte durch ein Netzwerk von *Gattern* übertragen werden. Diese Gattern stellen Operationen dar, welche die von den Drähten übertragenen Informationen transformieren. Quantenschaltkreise sind nur ein Beispiel für ein Berechnungsmodell, das auf diesem allgemeineren Konzept basiert.

Obwohl sich das Wort "Schaltkreis" oft auf einen kreisförmigen Pfad bezieht, sind kreisförmige Pfade in den gängigsten Schaltungsmodellen eigentlich nicht erlaubt. Das heißt, wir untersuchen normalerweise *azyklische Schaltungen,* wenn wir von Schaltungen als Rechenmodelle sprechen. Quantenschaltkreise folgen diesem Muster; Obwohl wir einen Quantenschaltkreis beliebig oft ausführen könnten, stellt ein Quantenschaltkreis selbst eine endliche Folge von Operationen dar, die keine Rückkopplungsschleifen enthalten kann.

### 1.1 Boolesche Schaltkreise

Hier ist ein Beispiel für einen (klassischen) booleschen Schaltkreis, bei dem die Drähte binäre Werte tragen und die Gatter boolesche Logikoperationen darstellen:

![Beispiel eines Booleschen Schaltkreises](images/quantum-circuits/Boolean-circuit-XOR.png)

Der Informationsfluss entlang der Drähte verläuft von links nach rechts: Die mit $\mathsf{X}$ und $\mathsf{Y}$ bezeichneten Drähte auf der linken Seite der Abbildung sind die sogenannten Eingabebits. Sie können jeweils jeden binären Wert annehmen, den man wählt. Der Draht auf der rechten Seite ist die Ausgabe. Die Zwischendrähte nehmen beliebige Werte an, die von den Gattern bestimmt werden. Diese werden von links nach rechts ausgewertet.

Die Gatter sind AND-Gatter (bezeichnet mit $\wedge$), OR-Gatter (bezeichnet mit $\vee$) und NOT-Gatter (bezeichnet mit $\neg$). Die von diesen Gattern berechneten Funktionen werden wahrscheinlich Vielen bekannt sein, hier werden sie jedoch durch Wertetabellen dargestellt:

$$
\rule[-10mm]{0mm}{15mm}
\begin{array}[t]{c|c}
  a &amp; \neg a\\
  \hline
  0 &amp; 1\\
  1 &amp; 0
\end{array}
\hspace{1.5cm}
\begin{array}[t]{c|c}
  ab &amp; a \wedge b\\
  \hline
  00 &amp; 0\\
  01 &amp; 0\\
  10 &amp; 0\\
  11 &amp; 1
\end{array}
\hspace{1.5cm}
\begin{array}[t]{c|c}
  ab &amp; a \vee b\\
  \hline
  00 &amp; 0\\
  01 &amp; 1\\
  10 &amp; 1\\
  11 &amp; 1
\end{array}
$$

Die beiden kleinen Kreise auf den Drähten rechts neben den Namen $\mathsf{X}$ und $\mathsf{Y}$ stellen *Fanout-* Operationen dar. Diese erstellen einfach eine Kopie des Wertes, der auf dem Draht übertragen wird, auf dem sie erscheinen. Somit kann derselbe Wert in mehrere Gatter eingegeben werden. Fanout-Operationen werden in der klassischen Umgebung nicht immer als Gatter angesehen – manchmal werden sie so behandelt, als ob sie in gewissem Sinne „frei“ wären – aber wenn wir überlegen, wie gewöhnliche boolesche Schaltungen in äquivalente Quantenschaltungen umgewandelt werden können, müssen wir Fanout-Operationen explizit als Gates klassifizieren und sie korrekt einordnen.

Hier ist dieselbe Schaltung in einem in der Elektrotechnik gebräuchlicheren Stil dargestellt, der herkömmliche Symbole für die AND-, OR- und NOT-Gatter verwendet:

![Boolesche Schaltung im klassischen Stil](images/quantum-circuits/Boolean-circuit-classic.png)

Wir werden diesen Stil bzw. diese speziellen Gate-Symbole nicht weiter verwenden, jedoch verwenden wir verschiedene Symbole, um Gates in Quantenschaltkreisen darzustellen. Diese werden wir näher erklären, wenn wir ihnen begegnen.

Die spezielle Schaltung in diesem Beispiel berechnet das *Exklusiv-OR* (oder kurz XOR), welches durch das Symbol $\oplus$ gekennzeichnet ist:

$$
\rule[-10mm]{0mm}{15mm}
\begin{array}[t]{c|c}
  ab &amp; a \oplus b\\
  \hline
  00 &amp; 0\\
  01 &amp; 1\\
  10 &amp; 1\\
  11 &amp; 0
\end{array}
$$

Im folgenden Diagramm betrachten wir nur eine mögliche Auswahl der Eingaben: $\mathsf{X}=0$ und $\mathsf{Y}=1$. Jeder Draht ist mit dem Wert gekennzeichnet, den er trägt, damit die Operation verfolgt werden können. Der Ausgabewert ist in diesem Fall $1$, was der korrekte Wert für das XOR ist: $0 \oplus 1 = 1$.

![Auswertung einer Booleschen Schaltung](images/quantum-circuits/XOR-circuit-evaluate.png)

Auf ähnliche Weise können die anderen drei möglichen Eingabeeinstellungen überprüft werden.

### 1.2 Andere Schaltungsarten

Wie oben angedeutet, ist der Begriff einer Schaltung in der Informatik sehr allgemein. Zum Beispiel werden manchmal Schaltungen betrachtet, deren Drähte andere Werte als $0$ und $1$ tragen, ebenso wie Gatter, die verschiedene Auswahlmöglichkeiten von Operationen darstellen.

Beispielsweise in *arithmetischen Schaltungen*, können die Drähte ganzzahlige Werte tragen, während die Gatter arithmetische Operationen, wie zum Beispiel Addition oder auch Multiplikation, darstellen können. Die folgende Abbildung zeigt eine arithmetische Schaltung, die zwei variable Eingabewerte (bezeichnet mit $x$ und $y$) sowie eine dritte Eingabe, die auf den Wert $1$ gesetzt ist, akzeptiert. In der Figur werden die von den Drähten übertragenen Werte als Funktionen der Werte $x$ und $y$ gezeigt.

![Beispiel arithmetische Schaltung](images/quantum-circuits/arithmetic-circuit.png)

Wir könnten auch Schaltungen in Betracht ziehen, die Zufälligkeit beinhalten, wie etwa solche, bei denen Gatter probabilistische Operationen darstellen.

### 1.3 Quantenschaltungen

Im Quantenschaltungsmodell stellen Drähte Qubits dar und Gatter repräsentieren Operationen, die auf diese Qubits einwirken. Wir konzentrieren uns nun auf Operationen, denen wir bisher begegnet sind, nämlich *Einheitsoperationen* und *Standardbasismessungen* . Während wir mehr über andere Arten von Quantenoperationen und -messungen erfahren, werden wir unser Modell entsprechend stätig verbessern.

Hier ist ein einfaches Beispiel für eine Quantenschaltung:

![Einfache Quantenschaltung](images/quantum-circuits/simple-quantum-circuit.png)

In dieser Schaltung haben wir ein einzelnes Qubit namens $\mathsf{X}$, das durch die horizontale Linie dargestellt wird, und eine Folge von Gattern, die unitäre Operationen auf diesem Qubit darstellen. Genau wie in den obigen Beispielen verläuft der Informationsfluss von links nach rechts – die erste durchgeführte Operation ist somit eine Hadamard, die zweite eine $S$-Operation, die dritte eine weitere Hadamard und die letzte Operation ein $T$ Betrieb. Die gesamtenSchaltung wendet daher die Zusammensetzung dieser Operationen, $THSH$, auf das Qubit $\mathsf{X}$ an.

Manchmal möchten wir die Eingabe- oder Ausgabezustände einer Schaltung explizit anzeigen. Wenn wir beispielsweise die Operation $THSH$ auf den Zustand $\vert 0\rangle$ anwenden, erhalten wir den Zustand $\frac{1+i}{2}\vert 0\rangle + \frac{1}{\ sqrt{2}} \vert 1 \rangle$. Wir können dies wie folgt angeben:

![Einfache Quantenschaltung ausgewertet](images/quantum-circuits/simple-quantum-circuit-evaluated.png)

Bei Quantenschaltungen sind oft alle Qubits auf $\vert 0\rangle$ initialisiert, wie in diesem Fall, aber es gibt auch Fälle, in denen wir die Eingabe-Qubits auf unterschiedliche Zustände setzen möchten.

So können wir diese Schaltung in Qiskit spezifizieren:

In [None]:
from qiskit import QuantumCircuit
circuit = QuantumCircuit(1)
circuit.h(0)
circuit.s(0)
circuit.h(0)
circuit.t(0)
circuit.draw()

Die Standardnamen für Qubits in Qiskit sind $\mathsf{q_0}$, $\mathsf{q_1}$, $\mathsf{q_2}$ usw., und wenn es nur ein einzelnes Qubit gibt, wie in unserem Beispiel, der Standard name ist $\mathsf{q}$ und nicht $\mathsf{q_0}$. Wenn wir unseren eigenen Namen wählen möchten, können wir dies mit der `QuantumRegister` Klasse wie folgt tun:

In [None]:
from qiskit import QuantumCircuit, QuantumRegister
X = QuantumRegister(1, "x")
circuit = QuantumCircuit(X)
circuit.h(X)
circuit.s(X)
circuit.h(X)
circuit.t(X)
circuit.draw()

Hier erhält das Qubit den Namen $\mathsf{x}$ (Kleinbuchstaben) – gültige Namen in Qiskit für Qubits (oder allgemeiner *Register* , die Sammlungen von Qubits sind) müssen mit einem Kleinbuchstaben beginnen.

Hier ist ein weiteres Beispiel für eine Quantenschaltung, diesmal mit zwei Qubits:

![Quantenschaltung, die ein ebit schafft](images/quantum-circuits/ebit-circuit.png)

Wie immer bezieht sich das mit $H$ bezeichnete Gatter auf eine Hadamard-Operation, während das zweite Gatter ein Zwei-Qubit-Gatter ist: Es ist die *Controlled-NOT* -Operation, wobei der ausgefüllte Kreis das Kontroll-Qubit darstellt und der Kreis , welcher dem Symbol $\oplus$ ähnelt, bezeichnet das Ziel-Qubit.

Bevor wir diesen Schaltkreis genauer untersuchen und erklären, was er tut, müssen wir unbedingt klären, wie Qubits in Quantenschaltkreisen angeordnet sind.

<!-- ::: q-block.note.info -->

**Anordnung von Qubits in Quantenschaltungen:** In diesem Lehrbuch (und in Qiskit) hat das oberste Qubit in einer Schaltung den Index 0 und entspricht der Position ganz rechts in einem kartesischen oder Tensorprodukt. Das zweitoberste Qubit hat den Index 1 und entspricht der Position zwei von rechts in einem kartesischen oder Tensorprodukt usw. bis zum untersten Qubit, das den höchsten Index hat und der Position ganz links entspricht.

Wenn wir uns also beispielsweise auf das Qubit an der nullten Position beziehen, beziehen wir uns auf das oberste Qubit in einem Schaltplan oder das ganz rechte Qubit im Ausdruck eines Quantenzustandsvektors; das Qubit an der ersten Position ist das zweite von oben in einem Schaltplan oder das zweite von rechts in einem Quantenzustandsvektor; usw. Diese Indizierungskonvention ist als "Little-Endian" bekannt, da die Indizes am "kleinen Ende" beginnen, wenn wir die Bedeutung von Bits in binären Darstellungen von Zahlen im Betracht ziehen.

<!-- ::: -->

Daher betrachten wir in dem obigen Schaltkreis den Schaltkreis als eine Operation an zwei Qubits $(\mathsf{X},\mathsf{Y})$. Wenn die Eingabe $\vert \psi\rangle \vert \phi\rangle$ ist, dann beginnt das untere Qubit ($\mathsf{X}$) im Zustand $\vert \psi\rangle$ und das obere Qubit ( $\mathsf{Y}$) beginnt im Zustand $\vert \phi\rangle$.

Schauen wir uns nun den Schaltkreis selbst an, indem wir uns von links nach rechts durch die Operationen bewegen, um zu sehen, was genau passiert.

1. Die erste Operation ist eine Hadamard-Operation auf $\mathsf{Y}$:

    ![First operation e-bit creator](images/quantum-circuits/ebit-circuit-first.png)

    Wenn man ein Gate auf ein einzelnes Qubit wie dieses anwendet, passiert nichts mit den anderen Qubits; nichts passieren ist äquivalent zur Identitätsoperation. In unserer Schaltung gibt es nur ein weiteres Qubit, $\mathsf{X}$, also stellt das gepunktete Rechteck in der obigen Abbildung diese Operation dar:

    $$
         \mathbb{1}\otimes H
         = \begin{pmatrix}
         \frac{1}{\sqrt{2}} &amp; \frac{1}{\sqrt{2}} &amp; 0 &amp; 0\\
         \frac{1}{\sqrt{2}} &amp; -\frac{1}{\sqrt{2}} &amp; 0 &amp; 0\\
         0 &amp; 0 &amp; \frac{1}{\sqrt{2}} &amp; \frac{1}{\sqrt{2}}\\
         0 &amp; 0 &amp; \frac{1}{\sqrt{2}} &amp; -\frac{1}{\sqrt{2}}
         \end{pmatrix}.
       $$

    Hier beachten, dass sich die Identitätsmatrix und $H$ sich jeweils links bzw. recht vom Tensorprodukt befinden. Dies stimmt mit der Qubit-Reihenfolge von Qiskit überein.

2. Die zweite Operation ist die Kontrolliertes-Nicht-Operation (c-NOT), wobei $\mathsf{Y}$ die Steuerung und $\mathsf{X}$ das Ziel ist:

    ![Zweite Operation E-Bit-Creator](images/quantum-circuits/ebit-circuit-second.png)

    Die Aktion des kontrollierten NICHT-Gatters auf Standardbasiszuständen ist wie folgt:

    ![Kontrolliertes NICHT-Gatter](images/quantum-circuits/cNOT.png)

    Da wir die Qubits als $(\mathsf{X}, \mathsf{Y})$ anordnen, ist die Matrixdarstellung vom c-NOT-Gatter die folgende:

    $$
         \begin{pmatrix}
         1 &amp; 0 &amp; 0 &amp; 0\\[2mm]
         0 &amp; 0 &amp; 0 &amp; 1\\[2mm]
         0 &amp; 0 &amp; 1 &amp; 0\\[2mm]
         0 &amp; 1 &amp; 0 &amp; 0
         \end{pmatrix}.
       $$

Die unitäre Operation der gesamten Schaltung, die wir $U$ nennen, ist die Zusammensetzung der Operationen:

$$
U = \begin{pmatrix}
1 &amp; 0 &amp; 0 &amp; 0\\[2mm]
0 &amp; 0 &amp; 0 &amp; 1\\[2mm]
0 &amp; 0 &amp; 1 &amp; 0\\[2mm]
0 &amp; 1 &amp; 0 &amp; 0
\end{pmatrix}
\begin{pmatrix}
\frac{1}{\sqrt{2}} &amp; \frac{1}{\sqrt{2}} &amp; 0 &amp; 0\\
\frac{1}{\sqrt{2}} &amp; -\frac{1}{\sqrt{2}} &amp; 0 &amp; 0\\
0 &amp; 0 &amp; \frac{1}{\sqrt{2}} &amp; \frac{1}{\sqrt{2}}\\
0 &amp; 0 &amp; \frac{1}{\sqrt{2}} &amp; -\frac{1}{\sqrt{2}}
\end{pmatrix}
=
\begin{pmatrix}
\frac{1}{\sqrt{2}} &amp; \frac{1}{\sqrt{2}} &amp; 0 &amp; 0\\
0 &amp; 0 &amp; \frac{1}{\sqrt{2}} &amp; -\frac{1}{\sqrt{2}}\\
0 &amp; 0 &amp; \frac{1}{\sqrt{2}} &amp; \frac{1}{\sqrt{2}}\\
\frac{1}{\sqrt{2}} &amp; -\frac{1}{\sqrt{2}} &amp; 0 &amp; 0
\end{pmatrix}.
$$

Wenn wir uns insbesondere an unsere Notation für die Bell-Zustände erinnern,

$$
\begin{aligned}
  \vert \phi^+ \rangle &amp; = \frac{1}{\sqrt{2}} \vert 0 0 \rangle
                         + \frac{1}{\sqrt{2}} \vert 1 1 \rangle \\[1mm]
  \vert \phi^- \rangle &amp; = \frac{1}{\sqrt{2}} \vert 0 0 \rangle
                         - \frac{1}{\sqrt{2}} \vert 1 1 \rangle \\[1mm]
  \vert \psi^+ \rangle &amp; = \frac{1}{\sqrt{2}} \vert 0 1 \rangle
                         + \frac{1}{\sqrt{2}} \vert 1 0 \rangle \\[1mm]
  \vert \psi^- \rangle &amp; = \frac{1}{\sqrt{2}} \vert 0 1 \rangle
                         - \frac{1}{\sqrt{2}} \vert 1 0 \rangle,
\end{aligned}
$$

wir erhalten das

$$
\begin{aligned}
U \vert 00\rangle &amp; = \vert \phi^+\rangle\\
U \vert 01\rangle &amp; = \vert \phi^-\rangle\\
U \vert 10\rangle &amp; = \vert \psi^+\rangle\\
U \vert 11\rangle &amp; = -\vert \psi^-\rangle.
\end{aligned}
$$

Diese Schaltung gibt uns also eine Möglichkeit, den Zustand $\vert\phi^+\rangle$ zu erzeugen, wenn wir sie auf zwei Qubits ausführen, die auf $\vert 00\rangle$ initialisiert sind. Allgemeiner gesagt gibt es uns eine Möglichkeit, die Standardbasis in die Bell-Basis umzuwandeln. (Der $-1$-Phasenfaktor beim letzten Zustand, $-\vert \psi^-\rangle$, könnte auch eliminiert werden, indem wir beispielsweise ein kontrolliertes $Z$-Gate am Anfang bzw. ein Swap-Gate am Ende hinzufügen.)

Im Allgemeinen können Quantenschaltkreise eine beliebige Anzahl von Qubit-Drähten enthalten. Wir können auch klassische Bit-Drähte einbeziehen, die wie in diesem Beispiel durch doppelte Linien angezeigt werden:

![Beispielschaltung mit Messungen](images/quantum-circuits/ebit-circuit-measured.png)

In dieser Schaltung haben wir ein Hadamard-Gatter und ein kontrolliertes NICHT-Gatter auf zwei Qubits $\mathsf{X}$ und $\mathsf{Y},$, genau wie im vorherigen Beispiel. Wir haben auch zwei *klassische* Bits, $\mathsf{A}$ und $\mathsf{B}$, sowie zwei Mess-Gatter. Die Mess-Gatter stellen Standard-Basismessungen dar: Die Qubits werden in ihre Zustände nach der Messung versetzt, während die Messergebnisse auf die klassischen Bits *überschrieben* werden, auf die die Pfeile zeigen.

Hier ist eine Implementierung dieser Schaltung mit Qiskit:

In [None]:
from qiskit import QuantumCircuit, QuantumRegister, ClassicalRegister
X = QuantumRegister(1, "x")
Y = QuantumRegister(1, "y")
A = ClassicalRegister(1, "a")
B = ClassicalRegister(1, "b")
circuit = QuantumCircuit(Y, X, B, A)
circuit.h(Y)
circuit.cx(Y, X)

circuit.measure(Y, B)
circuit.measure(X, A)
circuit.draw()

In [None]:
from qiskit import transpile
from qiskit.visualization import plot_histogram
from qiskit_aer import AerSimulator

simulator = AerSimulator()
circuit_simulator = simulator.run(transpile(circuit,simulator), shots=1000)
statistics = circuit_simulator.result().get_counts()
plot_histogram(statistics)

Manchmal ist es praktisch, eine Messung als Gatter darzustellen, das ein Qubit als Eingabe annimmt und ein klassisches Bit ausgibt (im Gegensatz zur Ausgabe des Qubits in seinem Zustand nach der Messung und dem Schreiben des Ergebnisses in ein separates klassisches Bit). Das bedeutet, dass das gemessene Qubit verworfen wurde und danach getrost ignoriert werden kann.

Das folgende Schaltbild stellt beispielsweise den gleichen Prozess wie das vorherige Diagramm dar, wobei wir jedoch $\mathsf{X}$ und $\mathsf{Y}$ ignorieren, nachdem wir sie gemessen haben:

![Beispielschaltung mit Abmessungen kompakt](images/quantum-circuits/ebit-circuit-measured-compact.png)

Im weiteren Verlauf der Serie werden wir viele weitere Beispiele für Quantenschaltkreise sehen, die normalerweise viel komplizierter sind als die einfachen Beispiele oben. Hier sind einige Symbole für bekannte Gatter:

- Quantengatter mit einem Eingang werden im Allgemeinen als Quadrate mit einem Buchstaben angezeigt, der angibt, um welche Operation es sich handelt, wie folgt:

    ![Quantengatter mit einem Eingang](images/quantum-circuits/single-qubit-gates.png)

    NICHT-Gatter (auch als $X$-Gatter bekannt) werden manchmal auch durch einen Kreis um ein Pluszeichen gekennzeichnet:

    ![Nicht-Gatter](images/quantum-circuits/not-gate.png)

- Swap-Gatter werden wie folgt bezeichnet:

    ![Swap-Gatter](images/quantum-circuits/swap-gate.png)

    Kontrollierte Gatter dh. Gatter, die kontrollierte Einheitsoperationen beschreiben, werden durch einen ausgefüllten Kreis (der die Kontrolle anzeigt) gekennzeichnet. Dieser wird durch eine vertikale Linie mit der Operation verbunden, welche kontrolliert wird. Kontrolliertes-Nicht Gatter, kontrolliertes-kontrolliertes-Nicht (oder auch Toffoli) Gatter und Kontrollierte-Swap (Fredkin) Gatter werden beispielsweise so bezeichnet:

    ![Kontrolliertes Gatter](images/quantum-circuits/controlled-gates.png)

- Beliebige unitäre Operationen an mehreren Qubits können als Gatter angesehen werden. Sie werden durch Rechtecke dargestellt, die mit dem Namen der unitären Operation gekennzeichnet sind. Hier ist zum Beispiel eine Darstellung einer (nicht spezifizierten) unitären Operation $U$ als Gatter, zusammen mit einer kontrollierten Version dieses Gatters:

    ![Beliebiges unitäres Gatter zusammen mit kontrollierter Version](images/quantum-circuits/uncontrolled-and-controlled-unitary.png)

## 2. Innere Produkte, Orthonormalität und Projektionen

Um uns besser darauf vorzubereiten, die Möglichkeiten und Grenzen von Quantenschaltkreisen zu erforschen, führen wir nun einige zusätzliche mathematische Konzepte ein – nämlich das *Skalarprodukt* zwischen Vektoren (und seine Verbindung zur euklidischen Norm), die Begriffe *Orthogonalität* und *Orthonormalität* für Mengen von Vektoren und *Projektionsmatrizen* , die es uns ermöglichen, eine praktische Verallgemeinerung von Standardbasismessungen einzuführen.

### 2.1 Innere Produkte

Wir wissen von Lektion 1, dass, wenn wir die Dirac-Notation verwenden, um einen beliebigen Spaltenvektor als Ket zu bezeichnen, wie

$$
\vert \psi \rangle =
\begin{pmatrix}
\alpha_1\\
\alpha_2\\
\vdots\\
\alpha_n
\end{pmatrix},
$$

der entsprechende bra-Vektor ist die *transponiert-konjugierte* dieses Vektors:

$$
\langle \psi \vert = \bigl(\vert \psi \rangle \bigr)^{\dagger}
=
\begin{pmatrix}
\overline{\alpha_1} &amp; \overline{\alpha_2} &amp; \cdots &amp; \overline{\alpha_n}
\end{pmatrix}.
\tag{1}
$$

Wenn wir alternativ eine klassische Zustandsmenge $\Sigma$ im Sinn haben und einen Spaltenvektor als Ket ausdrücken, wie

$$
\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle,
$$

dann ist der entsprechende Zeile (oderBra) Vektor die transponiert-konjugierte

$$
\langle \psi \vert = \sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert.
\tag{2}
$$

Wir haben auch beobachtet, dass das Produkt eines Bra-Vektors und eines Ket-Vektors, betrachtet als Matrizen mit entweder einer einzelnen Zeile oder einer einzelnen Spalte, einen Skalar ergibt. Insbesondere, wenn wir zwei (Spalten-) Vektoren haben

$$
\vert \psi \rangle =
\begin{pmatrix}
\alpha_1\\
\alpha_2\\
\vdots\\
\alpha_n
\end{pmatrix}
\quad\text{and}\quad
\vert \phi \rangle =
\begin{pmatrix}
\beta_1\\
\beta_2\\
\vdots\\
\beta_n
\end{pmatrix},
$$

so dass der Zeilenvektor $\langle \psi \vert$ wie in Gleichung $(1)$ ist, dann

$$
\langle \psi \vert \phi \rangle = \langle \psi \vert \vert \phi \rangle
=
\begin{pmatrix}
\overline{\alpha_1} &amp; \overline{\alpha_2} &amp; \cdots &amp; \overline{\alpha_n}
\end{pmatrix}
\begin{pmatrix}
\beta_1\\
\beta_2\\
\vdots\\
\beta_n
\end{pmatrix}
=
\overline{\alpha_1} \beta_1 + \cdots + \overline{\alpha_n}\beta_n.
$$

Alternativ, wenn wir zwei Spaltenvektoren haben, die wir geschrieben haben als

$$
\vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle
\quad\text{and}\quad
\vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,
$$

so dass $\langle \psi \vert$ der Zeilenvektor $(2)$ ist, finden wir das

$$
\begin{aligned}
  \langle \psi \vert \phi \rangle &amp; = \langle \psi \vert \vert \phi \rangle\\
  &amp; =
  \Biggl(\sum_{a\in\Sigma} \overline{\alpha_a} \langle a \vert\Biggr)
  \Biggl(\sum_{b\in\Sigma} \beta_b \vert b\rangle\Biggr)\\
  &amp; =
  \sum_{a\in\Sigma}\sum_{b\in\Sigma} \overline{\alpha_a} \beta_b \langle a \vert b \rangle\\
  &amp; = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a,
\end{aligned}
$$

wobei die letzte Gleichheit aus der Beobachtung folgt, dass $\langle a \vert a \rangle = 1$ und $\langle a \vert b \rangle = 0$ für klassische Zustände $a$ und $b$, die $a\not= erfüllen b$.

Der Wert $\langle \psi \vert \phi \rangle$ wird als *inneres Produkt* zwischen den Vektoren $\vert \psi\rangle$ und $\vert \phi \rangle$ bezeichnet. Innere Produkte sind in der Quanteninformation und Computation von entscheidender Bedeutung. Ohne diesen grundlegenden Begriff würden wir beim Verständnis von Quanteninformationen auf mathematischer Ebene nicht weit kommen.

Lass uns nun einige grundlegende Fakten über innere Produkte von Vektoren zusammentragen.

1. **Beziehung zur euklidischen Norm.** Das innere Produkt eines beliebigen Vektors

    $$
       \vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle
       $$

    mit sich selbst ist

    $$
       \langle \psi \vert \psi \rangle
       = \sum_{a\in\Sigma} \overline{\alpha_a} \alpha_a
       = \sum_{a\in\Sigma} \vert\alpha_a\vert^2
       = \bigl\| \vert \psi \rangle \bigr\|^2.
       $$

    Somit kann die euklidische Norm eines Vektors alternativ ausgedrückt werden als

    $$
       \bigl\| \vert \psi \rangle \bigr\| = \sqrt{ \langle \psi \vert \psi \rangle }.
       $$

    Beachten wir, dass die euklidische Norm eines Vektors immer eine nicht-negative reelle Zahl sein muss. Darüber hinaus kann die euklidische Norm eines Vektors nur dann gleich Null sein, wenn jeder der Einträge gleich Null ist, was bedeutet, dass der Vektor der Nullvektor ist.

    Wir können diese Beobachtungen so zusammenfassen: Für jeden Vektor $\vert \psi \rangle$ haben wir

    $$
       \langle \psi \vert \psi \rangle \geq 0,
       $$

    mit $\langle \psi \vert \psi \rangle = 0$ genau dann, wenn $\vert \psi \rangle = 0$. Diese Eigenschaft des inneren Produkts wird manchmal als *Positive Bestimmtheit* bezeichnet.

2. **{nbsp}konjugierete Symmetrie.** Für zwei beliebige Vektoren

    $$
       \vert \psi \rangle = \sum_{a\in\Sigma} \alpha_a \vert a \rangle
       \quad\text{and}\quad
       \vert \phi \rangle = \sum_{b\in\Sigma} \beta_b \vert b \rangle,
       $$

    wir haben

    $$
       \langle \psi \vert \phi \rangle = \sum_{a\in\Sigma} \overline{\alpha_a} \beta_a
       \quad\text{and}\quad
       \langle \phi \vert \psi \rangle = \sum_{a\in\Sigma} \overline{\beta_a} \alpha_a,
       $$

    und deshalb

    $$
       \overline{\langle \psi \vert \phi \rangle} = \langle \phi \vert \psi \rangle.
       $$

3. **Linearität im zweiten Argument (und konjugierte Linearität im ersten).** Nehmen wir an, dass $\vert \psi \rangle$, $\vert \phi_1 \rangle$ und $\vert \phi_2 \rangle$ Vektoren und $\alpha_1$ und $\alpha_2$ komplexe Zahlen sind. Wenn wir einen neuen Vektor definieren

    $$
       \vert \phi\rangle = \alpha_1 \vert \phi_1\rangle + \alpha_2 \vert \phi_2\rangle,
       $$

    Dann

    $$
       \langle \psi \vert \phi \rangle
       = \langle \psi \vert \bigl( \alpha_1\vert \phi_1 \rangle + \alpha_2\vert \phi_2 \rangle\bigr)
       = \alpha_1 \langle \psi \vert \phi_1 \rangle + \alpha_2 \langle \psi \vert \phi_2 \rangle.
       $$

    Das innere Produkt ist also im zweiten Argument *linear* . Dies kann entweder durch die obigen Formeln oder einfach dadurch überprüft werden, dass die Matrixmultiplikation in jedem Argument (und insbesondere im zweiten Argument) linear ist.

    Die Kombination dieser Tatsache mit der konjugierten Symmetrie zeigt, dass das Skalarprodukt im ersten Argument *konjugiert linear* ist. Das heißt, wenn $\vert \psi_1 \rangle$, $\vert \psi_2 \rangle$ und $\vert \phi \rangle$ Vektoren sind und $\alpha_1$ und $\alpha_2$ komplexe Zahlen sind, und wir definieren

    $$
       \vert \psi \rangle = \alpha_1 \vert \psi_1\rangle + \alpha_2 \vert \psi_2 \rangle,
       $$

    Dann

    $$
       \langle \psi \vert \phi \rangle
       =
       \bigl( \overline{\alpha_1} \langle \psi_1 \vert + \overline{\alpha_2} \langle \psi_2 \vert \bigr)
       \vert\phi\rangle
       = \overline{\alpha_1} \langle \psi_1 \vert \phi \rangle + \overline{\alpha_2} \langle \psi_2 \vert \phi \rangle.
       $$

4. **Die Cauchy-Schwarz-Ungleichung.** Für jede Auswahl von Vektoren $\vert \phi \rangle$ und $\vert \psi \rangle$ mit gleicher Anzahl von Einträgen haben wir

    $$
       \bigl\vert \langle \psi \vert \phi \rangle\bigr| \leq \bigl\| \vert\psi \rangle \bigr\| \bigl\| \vert \phi \rangle
       \bigr\|.
       $$

    Dies ist eine unglaublich praktische Ungleichung, die in der Quanteninformation (und in vielen anderen Studienbereichen) ziemlich häufig verwendet wird.

### 2.2 Orthogonale und orthonormale Mengen

Zwei Vektoren $\vert \phi \rangle$ und $\vert \psi \rangle$ heißen *orthogonal* , wenn ihr inneres Produkt Null ist:

$$
\langle \psi \vert \phi \rangle = 0.
$$

Geometrisch können wir uns orthogonale Vektoren als rechtwinklig zueinander stehende Vektoren vorstellen.

Eine Menge von Vektoren ${ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle}$ heißt *orthogonale Menge* , wenn jeder Vektor in der Menge orthogonal zu jedem anderen Vektor in der Menge ist. Das heißt, diese Menge ist orthogonal, wenn

$$
\langle \psi_j \vert \psi_k\rangle = 0
$$

für alle Auswahlmöglichkeiten von $j,k\in{1,\ldots,m}$, für die $j\not=k$.

Eine Menge von Vektoren ${ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle}$ heißt *orthonormale* Menge, wenn sie eine orthogonale Menge ist und außerdem jeder Vektor in der Menge ein Einheitsvektor ist. Alternativ ist diese Menge eine orthonormale Menge, falls dies der Fall ist

$$
\langle \psi_j \vert \psi_k\rangle =
\begin{cases}
1 &amp; j = k\\
0 &amp; j\not=k
\end{cases}
\tag{3}
$$

für alle Auswahlmöglichkeiten von $j,k\in{1,\ldots,m}$.

Schließlich ist eine Menge ${ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle}$ eine *orthonormale Basis* , wenn sie nicht nur eine orthonormale Menge ist, sondern auch eine Basis bildet. Dies ist äquivalent dazu, dass ${ \vert \psi_1\rangle,\ldots,\vert\psi_m\rangle}$ eine orthonormale Menge ist und $m$ gleich der Dimension des Raums ist, aus dem $\vert \psi_1\rangle, \ldots,\vert\psi_m\rangle$ gezeichnet  werden.

Zum Beispiel für jede klassische Zustandsmenge $\Sigma$ die Menge aller Standardbasisvektoren

$$
\big\{ \vert a \rangle \,:\, a\in\Sigma\bigr\}
$$

ist eine Orthonormalbasis. Die Menge ${\vert+\rangle,\vert-\rangle}$ ist eine orthonormale Basis für den $2$-dimensionalen Raum, der einem einzelnen Qubit entspricht, und die Bell-Basis ${\vert\phi^+\rangle, \vert \phi^-\rangle, \vert\psi^+\rangle, \vert\psi^-\rangle}$ ist eine orthonormale Basis für den $4$-dimensionalen Raum, der zwei Qubits entspricht.

#### Erweiterung von orthonormalen Mengen auf orthonormalen Basen

Nehmen wir an, dass $\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle$ Vektoren sind, die in einem $n$-dimensionalen Raum leben, und nehmen wir zusätzlich an, dass ${\vert\psi_1\rangle,\ldots,\ vert\psi_m\rangle}$ ist eine orthonormale Menge. Orthonormale Mengen sind immer linear unabhängige Mengen, daher spannen diese Vektoren notwendigerweise einen Unterraum der Dimension $m$ auf. Daraus schließen wir sofort, dass $m\leq n$, weil die Dimension des von diesen Vektoren aufgespannten Unterraums nicht größer sein kann als die Dimension des gesamten Raums, aus dem sie gespannt werden.

Wenn $m&lt;n$ ist, dann ist es immer möglich, einen zusätzlichen $nm$ Vektor $\vert \psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle$ zu wählen, so dass ${\vert\psi_1\rangle,\ldots,\vert\psi_n\rangle}$ bildet eine orthonormale Basis. Ein als *Gram* - *Schmidt-Orthogonalisierungsprozess* bekanntes Verfahren kann verwendet werden, um diese Vektoren zu konstruieren.

##### Orthonormalmengen und unitäre Matrizen

Orthonormale Mengen von Vektoren sind eng mit unitären Matrizen verbunden. Eine Möglichkeit, diesen Zusammenhang auszudrücken, besteht darin, zu sagen, dass die folgenden drei Aussagen für jede Wahl einer quadratischen Matrix $U$ logisch äquivalent sind (was bedeutet, dass sie alle wahr oder alle falsch sind):

1. Die Matrix $U$ ist unitär (dh $U^{\dagger} U = \mathbb{1} = UU^{\dagger}$).
2. Die Zeilen von $U$ bilden eine orthonormale Menge.
3. Die Spalten von $U$ bilden eine orthonormale Menge.

Diese Äquivalenz ist eigentlich ziemlich einfach, wenn wir darüber nachdenken, wie die Matrixmultiplikation und die transponieren und konjugieren funktionieren. Angenommen, wir haben zum Beispiel eine $3\times 3$-Matrix wie diese:

$$
U = \begin{pmatrix}
\alpha_{1,1} &amp; \alpha_{1,2} &amp; \alpha_{1,3} \\
\alpha_{2,1} &amp; \alpha_{2,2} &amp; \alpha_{2,3} \\
\alpha_{3,1} &amp; \alpha_{3,2} &amp; \alpha_{3,3}
\end{pmatrix}
$$

Die transponiert-konjugierte Matrize von $U$ sieht so aus:

$$
U^{\dagger} = \begin{pmatrix}
\overline{\alpha_{1,1}} &amp; \overline{\alpha_{2,1}} &amp; \overline{\alpha_{3,1}} \\
\overline{\alpha_{1,2}} &amp; \overline{\alpha_{2,2}} &amp; \overline{\alpha_{3,2}} \\
\overline{\alpha_{1,3}} &amp; \overline{\alpha_{2,3}} &amp; \overline{\alpha_{3,3}}
\end{pmatrix}
$$

Die Multiplikation der beiden Matrizen mit der transponiert-konjugierte auf der linken Seite ergibt diese Matrix:

$$
\begin{aligned}
&amp;\begin{pmatrix}
\overline{\alpha_{1,1}} &amp; \overline{\alpha_{2,1}} &amp; \overline{\alpha_{3,1}} \\
\overline{\alpha_{1,2}} &amp; \overline{\alpha_{2,2}} &amp; \overline{\alpha_{3,2}} \\
\overline{\alpha_{1,3}} &amp; \overline{\alpha_{2,3}} &amp; \overline{\alpha_{3,3}}
\end{pmatrix}
\begin{pmatrix}
\alpha_{1,1} &amp; \alpha_{1,2} &amp; \alpha_{1,3} \\
\alpha_{2,1} &amp; \alpha_{2,2} &amp; \alpha_{2,3} \\
\alpha_{3,1} &amp; \alpha_{3,2} &amp; \alpha_{3,3}
\end{pmatrix}\\[2mm]
\qquad &amp;=
{\scriptsize
\begin{pmatrix}
\overline{\alpha_{1,1}}\alpha_{1,1} + \overline{\alpha_{2,1}}\alpha_{2,1} + \overline{\alpha_{3,1}}\alpha_{3,1} &amp;
\overline{\alpha_{1,1}}\alpha_{1,2} + \overline{\alpha_{2,1}}\alpha_{2,2} + \overline{\alpha_{3,1}}\alpha_{3,2} &amp;
\overline{\alpha_{1,1}}\alpha_{1,3} + \overline{\alpha_{2,1}}\alpha_{2,3} + \overline{\alpha_{3,1}}\alpha_{3,3} \\[1mm]
\overline{\alpha_{1,2}}\alpha_{1,1} + \overline{\alpha_{2,2}}\alpha_{2,1} + \overline{\alpha_{3,2}}\alpha_{3,1} &amp;
\overline{\alpha_{1,2}}\alpha_{1,2} + \overline{\alpha_{2,2}}\alpha_{2,2} + \overline{\alpha_{3,2}}\alpha_{3,2} &amp;
\overline{\alpha_{1,2}}\alpha_{1,3} + \overline{\alpha_{2,2}}\alpha_{2,3} + \overline{\alpha_{3,2}}\alpha_{3,3} \\[1mm]
\overline{\alpha_{1,3}}\alpha_{1,1} + \overline{\alpha_{2,3}}\alpha_{2,1} + \overline{\alpha_{3,3}}\alpha_{3,1} &amp;
\overline{\alpha_{1,3}}\alpha_{1,2} + \overline{\alpha_{2,3}}\alpha_{2,2} + \overline{\alpha_{3,3}}\alpha_{3,2} &amp;
\overline{\alpha_{1,3}}\alpha_{1,3} + \overline{\alpha_{2,3}}\alpha_{2,3} + \overline{\alpha_{3,3}}\alpha_{3,3}
\end{pmatrix}}
\end{aligned}
$$

Wenn wir drei Vektoren aus den Spalten von $U$ bilden,

$$
\vert \psi_1\rangle = \begin{pmatrix}
\alpha_{1,1}\\
\alpha_{2,1}\\
\alpha_{3,1}
\end{pmatrix},
\quad
\vert \psi_2\rangle = \begin{pmatrix}
\alpha_{1,2}\\
\alpha_{2,2}\\
\alpha_{3,2}
\end{pmatrix},
\quad
\vert \psi_3\rangle =
\begin{pmatrix}
\alpha_{1,3}\\
\alpha_{2,3}\\
\alpha_{3,3}
\end{pmatrix},
$$

dann können wir das obige Produkt alternativ wie folgt ausdrücken:

$$
U^{\dagger} U =
\begin{pmatrix}
\langle \psi_1\vert \psi_1 \rangle &amp; \langle \psi_1\vert \psi_2 \rangle &amp; \langle \psi_1\vert \psi_3 \rangle \\
\langle \psi_2\vert \psi_1 \rangle &amp; \langle \psi_2\vert \psi_2 \rangle &amp; \langle \psi_2\vert \psi_3 \rangle \\
\langle \psi_3\vert \psi_1 \rangle &amp; \langle \psi_3\vert \psi_2 \rangle &amp; \langle \psi_3\vert \psi_3 \rangle
\end{pmatrix}
$$

Unter Bezugnahme auf Gleichung (3) sehen wir nun, dass die Bedingung, dass diese Matrix gleich der Einheitsmatrix ist, äquivalent ist zur Orthonormalität der Menge ${\vert\psi_1\rangle,\vert\psi_2\rangle,\vert\ psi_3\rangle}$.

Dieses Argument lässt sich auf unitäre Matrizen jeder Größe verallgemeinern. Die Tatsache, dass die Zeilen einer Matrix genau dann eine orthonormale Basis bilden, wenn die Matrix unitär ist, folgt aus der Tatsache, dass eine Matrix genau dann unitär ist, wenn ihre Transponierte unitär ist.

Aus der oben beschriebenen Äquivalenz und der Tatsache, dass jede orthonormale Menge zu einer orthonormalen Basis erweitert werden kann, schließen wir die folgende nützliche Tatsache: Gegeben jede orthonormale Menge von Vektoren ${\vert\psi_1\rangle,\ldots,\vert \psi_m\rangle}$ aus einem $n$-dimensionalen Raum gezogen, existiert eine unitäre Matrix $U$, deren erste $m$ Spalten die Vektoren $\vert\psi_1\rangle,\ldots,\vert\psi_m\rangle sind $. Bildhaft können wir immer eine unitäre Matrix finden, die diese Form hat:

$$
U =
\left(
  \begin{array}{ccccccc}
    \rule{0.4pt}{10pt} &amp; \rule{0.4pt}{10pt} &amp; &amp; \rule{0.4pt}{10pt} &amp; \rule{0.4pt}{10pt} &amp; &amp; \rule{0.4pt}{10pt}\\
    \vert\psi_1\rangle &amp; \vert\psi_2\rangle &amp; \cdots &amp; \vert\psi_m\rangle &amp; \vert\psi_{m+1}\rangle &amp;
    \cdots &amp; \vert\psi_n\rangle\\
    \rule{0.4pt}{10pt} &amp; \rule{0.4pt}{10pt} &amp; &amp; \rule{0.4pt}{10pt} &amp; \rule{0.4pt}{10pt} &amp; &amp; \rule{0.4pt}{10pt}
  \end{array}
\right).
$$

Hier werden die letzten $nm$-Spalten mit beliebigen Vektoren $\vert\psi_{m+1}\rangle,\ldots,\vert\psi_n\rangle$ ausgefüllt, die ${\vert\psi_1\rangle ergeben, \ldots,\vert\psi_n\rangle}$ eine orthonormale Basis.

### 2.3 Projektionen und Projektionsmessungen

![Illustration eines Atoms, das einen Schatten auf einen Bildschirm wirft.](images/quantum-circuits/projection-illustration.png)

#### Projektionsmatrizen

Eine quadratische Matrix $\Pi$ heißt *Projektion* , wenn sie zwei Eigenschaften erfüllt:

1. $\Pi = \Pi^{\dagger}$.
2. $\Pi^2 = \Pi$.

Matrizen, die die erste Bedingung erfüllen – dass sie gleich ihrer eigenen konjugierten Transponierten sind – werden *Hermitesche Matrizen* genannt, und Matrizen, die die zweite Bedingung erfüllen – dass ihre Quadrierung sie unverändert lässt – werden *idempotente* Matrizen genannt.

Vorsicht: das Wort *Projektion* wird manchmal verwendet, um sich auf jede Matrix zu beziehen, die nur die zweite Bedingung erfüllt, aber nicht unbedingt die erste, und wenn dies getan wird, wird der Begriff *orthogonale Projektion* typischerweise verwendet, um sich auf Matrizen zu beziehen, die beide Eigenschaften erfüllen. Hier werden wir jedoch die Begriffe *Projektion* und *Projektionsmatrix* verwenden, um Matrizen zu bezeichnen, die beide Bedingungen erfüllen.

Ein Beispiel für eine Projektion ist die Matrix

$$
\Pi = \vert \psi \rangle \langle \psi \vert
\tag{4}
$$

für jeden Einheitsvektor $\vert \psi\rangle$. Wir können sehen, dass diese Matrix wie folgt hermitesch ist:

$$
\Pi^{\dagger} = \bigl( \vert \psi \rangle \langle \psi \vert \bigr)^{\dagger}
= \bigl( \langle \psi \vert \bigr)^{\dagger}\bigl( \vert \psi \rangle \bigr)^{\dagger}
= \vert \psi \rangle \langle \psi \vert = \Pi.
$$

Um die zweite Gleichheit zu erhalten, haben wir hier die Formel verwendet

$$
(A B)^{\dagger} = B^{\dagger} A^{\dagger},
$$

was immer gilt (für zwei beliebige Matrizen $A$ und $B$, für die das Produkt $AB$ sinnvoll ist).

Um zu sehen, dass die Matrix $\Pi$ in $(4)$ idempotent ist, können wir die Annahme verwenden, dass $\vert\psi\rangle$ ein Einheitsvektor ist, sodass er $\langle \psi \vert \psi erfüllt \rangle = 1.$ Also haben wir

$$
\Pi^2
= \bigl( \vert\psi\rangle\langle \psi\vert \bigr)^2
= \vert\psi\rangle\langle \psi\vert\psi\rangle\langle\psi\vert
= \vert\psi\rangle\langle\psi\vert = \Pi.
$$

Allgemeiner gesagt, wenn ${\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle}$ ein beliebiger orthonormaler Satz von Vektoren ist, dann die Matrix

$$
\Pi = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert
\tag{5}
$$

ist eine Projektion. Konkret haben wir

$$
\begin{aligned}
\Pi^{\dagger}
&amp;= \biggl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr)^{\dagger} \\
&amp;= \sum_{k = 1}^m \bigl(\vert\psi_k\rangle\langle\psi_k\vert\bigr)^{\dagger} \\
&amp;= \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\
&amp;= \Pi,
\end{aligned}
$$

und

$$
\begin{aligned}
\Pi^2
&amp; = \biggl( \sum_{j = 1}^m \vert \psi_j\rangle \langle \psi_j \vert\Bigr)\Bigl(\sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\biggr) \\
&amp; = \sum_{j = 1}^m\sum_{k = 1}^m \vert \psi_j\rangle \langle \psi_j \vert  \psi_k\rangle \langle \psi_k \vert \\
&amp; = \sum_{k = 1}^m \vert \psi_k\rangle \langle \psi_k \vert\\
&amp; = \Pi,
\end{aligned}
$$

wobei die Orthonormalität von ${\vert \psi_1\rangle,\ldots,\vert \psi_m\rangle}$ nur für die vorletzte Gleichheit verwendet wird.

Tatsächlich sind damit alle Möglichkeiten erschöpft: *Jede* Projektion $\Pi$ kann in der Form $(5)$ für eine beliebige Auswahl einer orthonormalen Menge ${\vert \psi_1\rangle,\ldots,\vert \psi_m geschrieben werden \rangle}$. (Die Nullmatrix $\Pi=0$, die eine Projektion ist, ist ein Sonderfall: Um sie in die allgemeine Form (5) einzupassen, müssen wir die Möglichkeit zulassen, dass die Summe leer ist, was zur Nullmatrix führt.)

#### Projektive Messungen

Wie bereits erwähnt, ist der Begriff der Messung eines Quantensystems allgemeiner als nur Standard-Basismessungen. *Projektive Messungen* sind Messungen, die durch eine Sammlung von Projektionen beschrieben werden, deren Summe gleich der Identitätsmatrix ist. In Symbolen beschreibt eine Sammlung ${\Pi_1,\ldots,\Pi_m}$ von Projektionsmatrizen eine projektive Messung, wenn

$$
\Pi_1 + \cdots + \Pi_m = \mathbb{1}.
$$

Wenn eine solche Messung an einem System $\mathsf{X}$ durchgeführt wird, während es sich in einem Zustand $\vert\psi\rangle$ befindet, passieren zwei Dinge:

1. Für jeweils $k\in{1,\ldots,m}$ ist das Ergebnis der Messung $k$ mit Wahrscheinlichkeit gleich

$$
\operatorname{Pr}\bigl(\text{outcome is $k$}\bigr) = \bigl\| \Pi_k \vert \psi \rangle \bigr\|^2.
$$

1. Für welches Ergebnis $k$ die Messung auch immer liefert, der Zustand von $\mathsf{X}$ wird

$$
\frac{\Pi_k \vert\psi\rangle}{\bigl\|\Pi_k \vert\psi\rangle\bigr\|}.
$$

Wir können auch andere Ergebnisse als ${1,\ldots,m}$ für projektive Messungen wählen, wenn wir wollten. Allgemeiner gesagt, für jede endliche und nicht leere Menge $\Sigma$, wenn wir eine Sammlung von Projektionsmatrizen ${\Pi_a:a\in\Sigma}$ haben, die die Bedingung erfüllen

$$
\sum_{a\in\Sigma} \Pi_a = \mathbb{1},
$$

dann beschreibt diese Sammlung eine projektive Messung, deren mögliche Ergebnisse mit der Menge $\Sigma$ übereinstimmen, wobei die Regeln dieselben sind wie zuvor:

1. Für jedes $a\in\Sigma$ ist das Ergebnis der Messung $a$ mit einer Wahrscheinlichkeit von gleich

$$
\operatorname{Pr}\bigl(\text{outcome is $a$}\bigr) = \bigl\| \Pi_a \vert \psi \rangle \bigr\|^2.
$$

1. Für welches Ergebnis $a$ die Messung auch immer liefert, der Zustand von $\mathsf{X}$ wird

$$
\frac{\Pi_a \vert\psi\rangle}{\bigl\|\Pi_a \vert\psi\rangle\bigr\|}.
$$

Beispielsweise sind Standardbasismessungen äquivalent zu projektiven Messungen, wobei $\Sigma$ die Menge der klassischen Zustände des Systems $\mathsf{X}$ ist, über das wir sprechen, und unsere Menge der Projektionsmatrizen ist ${\vert a \rangle\langle a\vert:a\in\Sigma}$.

Ein weiteres Beispiel für eine projektive Messung, diesmal an zwei Qubits $(\mathsf{X},\mathsf{Y})$, ist durch die Menge ${\Pi_0,\Pi_1}$ gegeben, wobei

$$
\Pi_0 = \vert \phi^+\rangle\langle \phi^+ \vert + \vert \phi^-\rangle\langle \phi^- \vert + \vert \psi^+\rangle\langle \psi^+ \vert
\quad\text{and}\quad
\Pi_1 = \vert\psi^-\rangle\langle\psi^-\vert.
$$

Wenn wir mehrere Systeme haben, die sich gemeinsam in einem bestimmten Quantenzustand befinden, und eine projektive Messung nur an einem der Systeme durchgeführt wird, ist die Aktion ähnlich wie bei Standardbasismessungen – und tatsächlich können wir diese Aktion jetzt viel einfacher beschreiben. Um genau zu sein, nehmen wir an, wir haben zwei Systeme $(\mathsf{X},\mathsf{Y})$ in einem Quantenzustand $\vert\psi\rangle$ und eine projektive Messung, die durch eine Sammlung ${ Auf dem System $\mathsf{X}$ wird \Pi_a:a\in\Sigma}$ ausgeführt, während auf $\mathsf{Y}$ nichts geschieht. Dies ist dann gleichbedeutend mit der Durchführung der durch die Erfassung beschriebenen projektiven Messung

$$
\bigl\{ \Pi_a \otimes \mathbb{1} \,:\, a\in\Sigma\bigr\}
$$

auf dem gemeinsamen System $(\mathsf{X},\mathsf{Y})$. Jedes Messergebnis $a$ ergibt sich mit Wahrscheinlichkeit

$$
\bigl\| (\Pi_a \otimes \mathbb{1})\vert \psi\rangle \bigr\|^2,
$$

und bedingt durch das Auftreten des Ergebnisses $a$ wird der Zustand des gemeinsamen Systems $(\mathsf{X},\mathsf{Y})$

$$
\frac{(\Pi_a \otimes \mathbb{1})\vert \psi\rangle}{\bigl\| (\Pi_a \otimes \mathbb{1})\vert \psi\rangle \bigr\|}.
$$

#### Implementieren von projektiven Messungen unter Verwendung von Standardbasismessungen

Beliebige projektive Messungen können unter Verwendung von unitäre Operationen, Standardbasismessungen und einem Extra-Workspace-System implementiert werden, wie es nun erklärt wird.

Nehmen wir an, dass $\mathsf{X}$ ein System und ${\Pi_1,\ldots,\Pi_m}$ ein projektives Maß auf $\mathsf{X}$ ist. Wir können diese Diskussion leicht auf projektive Messungen verallgemeinern, die unterschiedliche Sätze von Ergebnissen haben, aber im Interesse der Bequemlichkeit und Einfachheit nehmen wir an, dass der Satz möglicher Ergebnisse für unsere Messung ${1,\ldots,m}$ ist. Beachten wir ausdrücklich, dass $m$ nicht unbedingt gleich der Anzahl der klassischen Zustände von $\mathsf{X}$ ist — wir lassen $n$ die Anzahl der klassischen Zustände von $\mathsf{X}$ sein, was bedeutet dass jede Matrix $\Pi_k$ eine $n\times n$ Projektionsmatrix ist. Da wir davon ausgehen, dass ${\Pi_1,\ldots,\Pi_m}$ ein projektives Maß darstellt, ist dies zwangsläufig der Fall

$$
\sum_{k = 1}^m \Pi_k = \mathbb{1}_n.
$$

Unser Ziel ist es, einen Prozess durchzuführen, der denselben Effekt hat wie die Durchführung dieser projektiven Messung an $\mathsf{X}$, aber dies nur unter Verwendung von unitären Operationen und Standardbasismessungen zu tun.

Wir werden dazu ein zusätzliches Workspace-System $\mathsf{Y}$ verwenden, und insbesondere nehmen wir die klassische Zustandsmenge von $\mathsf{Y}$ als ${1,\ldots,m}$ an, was ist die gleiche wie die Menge der Ergebnisse der projektiven Messung. Die Idee ist, dass wir eine Standardbasismessung an $\mathsf{Y}$ durchführen und das Ergebnis dieser Messung als äquivalent zum Ergebnis der projektiven Messung an $\mathsf{X}$ interpretieren. Wir müssen davon ausgehen, dass $\mathsf{Y}$ auf einen festen Zustand initialisiert wird, den wir mehr oder weniger willkürlich als $\vert 1\rangle$ wählen. (Jede andere Wahl eines festen Quantenzustandsvektors könnte funktionieren, aber die Wahl von $\vert 1\rangle$ macht die folgende Erklärung viel einfacher.)

Damit eine Standardbasismessung von $\mathsf{Y}$ uns etwas über $\mathsf{X}$ sagen kann, müssen wir natürlich $\mathsf{X}$ und $\mathsf{Y} $ irgendwie interagieren, bevor sie $\mathsf{Y}$ messen, indem sie eine unitäre Operation auf dem System $(\mathsf{Y},\mathsf{X})$ durchführen. Betrachten wir zunächst diese Matrix:

$$
M = \sum_{k = 1}^m \vert k \rangle \langle 1 \vert \otimes \Pi_k.
$$

Explizit als Blockmatrix ausgedrückt sieht diese Matrix so aus:

$$
M =
\begin{pmatrix}
\Pi_1 &amp; 0 &amp; \cdots &amp; 0\\
\Pi_2 &amp; 0 &amp; \cdots &amp; 0\\
\vdots &amp; \vdots &amp; \ddots &amp; \vdots\\
\Pi_m &amp; 0 &amp; \cdots &amp; 0
\end{pmatrix}.
$$

(Jedes $0$ in dieser Matrix stellt eine $n\times n$-Matrix dar, die vollständig mit Nullen gefüllt ist.)

Nun, $M$ ist sicherlich keine unitäre Matrix (es sei denn, $m=1$, in diesem Fall $\Pi_1 = \mathbb{1}$, was in diesem trivialen Fall $M = \mathbb{1}$ ergibt), weil unitäre Matrizen dürfen keine Spalten (oder Zeilen) haben, die vollständig $0$ sind; Einheitsmatrizen haben Spalten, die orthonormale Basen bilden, und der All-Null-Vektor ist kein Einheitsvektor. Es ist jedoch so, dass die ersten $n$-Spalten von $M$ orthonormal sind, und wir erhalten dies aus der Annahme, dass ${\Pi_1,\ldots,\Pi_m}$ ein Maß ist. Um diese Behauptung zu überprüfen, beachten wir, dass für jedes $j\in{1,\ldots,n}$ die Spaltennummer $j$ von $M$ dieser Vektor ist:

$$
\vert \psi_j\rangle = M \vert 1, j\rangle = \sum_{k = 1}^m \vert k \rangle \otimes \Pi_k \vert j\rangle.
$$

Nimmt man das innere Produkt der Spalte $i$ mit der Spalte $j$ (immer noch unter der Annahme, dass wir über die ersten $n$-Spalten sprechen, also $i,j\in{1,\ldots,n}$), ergibt sich

$$
\begin{aligned}
\langle \psi_i \vert \psi_j \rangle
&amp; =
\biggl(\sum_{k = 1}^m \vert k \rangle \otimes \Pi_k \vert i\rangle\biggr)^{\dagger}
\biggl(\sum_{l = 1}^m \vert l \rangle \otimes \Pi_l \vert j\rangle\biggr) \\
&amp; =
\sum_{k = 1}^m \sum_{l = 1}^m
\langle k \vert l \rangle \langle i \vert \Pi_k \Pi_l \vert j\rangle\\
&amp; =
\sum_{k = 1}^m
\langle i \vert \Pi_k \Pi_k \vert j\rangle\\
&amp; =
\sum_{k = 1}^m
\langle i \vert \Pi_k \vert j\rangle\\
&amp; = \langle i \vert \mathbb{1} \vert j \rangle\\
&amp; = \begin{cases}
1 &amp; i = j\\
0 &amp; i\not=j,
\end{cases}
\end{aligned}
$$

was wir zeigen mussten.

Da die ersten $n$-Spalten der Matrix $M$ orthonormal sind, können wir also alle verbleibenden Nulleinträge durch eine andere Auswahl von Einträgen für komplexe Zahlen ersetzen, sodass die gesamte Matrix unitär ist:

$$
U = \begin{pmatrix}
\Pi_1 &amp; \fbox{?} &amp; \cdots &amp; \fbox{?}\\
\Pi_2 &amp; \fbox{?} &amp; \cdots &amp; \fbox{?}\\
\vdots &amp; \vdots &amp; \ddots &amp; \vdots\\
\Pi_m &amp; \fbox{?} &amp; \cdots &amp; \fbox{?}
\end{pmatrix}
$$

(Wenn die Matrizen $\Pi_1,\ldots,\Pi_m$ gegeben sind, können wir geeignete Matrizen zum Auffüllen der mit $\fbox{?}$ markierten Blöcke in der Gleichung berechnen – unter Verwendung des Gram-Schmidt-Prozesses – aber für unsere Diskussion wird es nicht darauf ankommen, was diese Matrizen genau sind.)

Abschließend können wir den Messvorgang beschreiben: Wir führen zunächst $U$ am Gesamtsystem $(\mathsf{Y},\mathsf{X})$ durch und messen dann $\mathsf{Y}$ bezüglich einer Standardbasismessung . Für einen beliebigen Zustand $\vert \phi \rangle$ von $\mathsf{X}$ erhalten wir den Zustand

$$
U \bigl( \vert 1\rangle \vert \phi\rangle\bigr)
= M \bigl( \vert 1\rangle \vert \phi\rangle\bigr)
= \sum_{k = 1}^m \vert k\rangle \otimes \Pi_k \vert\phi\rangle,
$$

wobei die erste Gleichheit aus der Tatsache folgt, dass $U$ und $M$ in ihren ersten $n$-Spalten übereinstimmen. Wenn wir eine projektive Messung an $\mathsf{Y}$ durchführen, erhalten wir jedes Ergebnis $k$ mit Wahrscheinlichkeit

$$
\bigl\| \Pi_k \vert \phi\rangle \bigr\|^2,
$$

in diesem Fall wird der Zustand von $(\mathsf{Y},\mathsf{X})$

$$
\vert k\rangle \otimes \frac{\Pi_k \vert \phi\rangle}{\bigl\| \Pi_k \vert \phi\rangle \bigr\|}.
$$

Somit speichert $\mathsf{Y}$ eine Kopie des Messergebnisses und $\mathsf{X}$ ändert sich genau so, als wäre die durch ${\Pi_1,\ldots,\Pi_m}$ beschriebene projektive Messung direkt durchgeführt worden auf $\mathsf{X}$.

## 3. Einschränkungen der Quanteninformation

Trotz einer gemeinsamen zugrunden liegenden mathematischen Struktur, weisen Quanten- und klassische Informationen einige wesentliche Unterschiede auf. Im weiteren Verlauf werden wir viele Beispiele für Aufgaben sehen, die Quanteninformationen ermöglichen, klassische Informationen jedoch nicht.

Bevor wir dies tun, sollten wir jedoch einige wichtige Einschränkungen der Quanteninformation beachten. Zu verstehen, was Quanteninformation *nicht kann,* hilft uns, die Dinge zu identifizieren, die sie tun *kann* .

### 3.1 Irrelevanz der globalen Phasen

Die erste Einschränkung, die wir behandeln werden – die eigentlich eher eine leichte Entartung in der Art und Weise ist, wie Quantenzustände durch Quantenzustandsvektoren dargestellt werden, im Gegensatz zu einer tatsächlichen Einschränkung – betrifft den Begriff einer *globalen Phase* .

Was wir mit einer globalen Phase meinen, ist Folgendes. Nehmen wir an, dass $\vert \psi \rangle$ und $\vert \phi \rangle$ Einheitsvektoren sind, die Quantenzustände eines Systems darstellen, und nehmen wir außerdem an, dass es eine komplexe Zahl $\alpha$ auf dem Einheitskreis gibt (was bedeutet, dass $ \vert \alpha \vert = 1$, oder alternativ $\alpha = e^{i\theta}$ für eine reelle Zahl $\theta$), so dass

$$
\vert \phi \rangle = \alpha \vert \psi \rangle.
$$

Die Vektoren $\vert \psi \rangle$ und $\vert \phi \rangle$ sollen sich dann *um eine globale Phase unterscheiden* . Wir beziehen uns manchmal auch auf $\alpha$ als *globale Phase* , obwohl dies kontextabhängig ist: Jede Zahl auf dem Einheitskreis kann als globale Phase betrachtet werden, wenn sie mit einem Einheitsvektor multipliziert wird.

Betrachten wir nun, was passiert, wenn sich ein System in einem von zwei Quantenzuständen befindet, die sich durch eine globale Phase unterscheiden, $\vert\psi\rangle$ und $\vert\phi\rangle$, und das System einer Standardbasismessung unterzogen wird. Im ersten Fall, in dem sich das System im Zustand $\vert\psi\rangle$ befindet, ist die Wahrscheinlichkeit, irgendeinen klassischen Zustand zu messen, $a$

$$
\bigl\vert \langle a \vert \psi \rangle \bigr\vert^2.
$$

Im zweiten Fall, in dem sich das System im Zustand $\vert\phi\rangle$ befindet, ist die Wahrscheinlichkeit, irgendeinen klassischen Zustand zu messen, $a$

$$
\bigl\vert \langle a \vert \phi \rangle \bigr\vert^2
= \bigl\vert \alpha \langle a \vert \psi \rangle \bigr\vert^2
= \vert \alpha \vert^2 \bigl\vert \langle a \vert \psi \rangle \bigr\vert^2
= \bigl\vert \langle a \vert \psi \rangle \bigr\vert^2,
$$

weil $\vert\alpha\vert = 1$. Das heißt, die Wahrscheinlichkeit, dass ein Ergebnis eintritt, ist für beide Zustände gleich.

Betrachten wir nun, was passiert, wenn wir eine beliebige unitäre Operation $U$ auf beide Zustände ausführen. Im ersten Fall, in dem der Anfangszustand $\vert \psi \rangle$ ist, wird der Zustand

$$
U \vert \psi \rangle,
$$

und im zweiten Fall, in dem der Anfangszustand $\vert \phi\rangle$ ist, wird es

$$
U \vert \phi \rangle = \alpha U \vert \psi \rangle.
$$

Das heißt, die beiden resultierenden Zustände unterscheiden sich immer noch durch dieselbe globale Phase $\alpha$.

Folglich sind die beiden Quantenzustände $\vert\psi\rangle$ und $\vert\phi\rangle$, die sich durch eine globale Phase unterscheiden, völlig ununterscheidbar: Egal welche Operation oder Operationsfolge wir auf die beiden Zustände anwenden, Sie werden sich immer um eine globale Phase unterscheiden, und die Durchführung einer Standardbasismessung wird zu Ergebnissen mit genau denselben Wahrscheinlichkeiten wie die anderen führen. Aus diesem Grund werden zwei Quantenzustandsvektoren, die sich um eine globale Phase unterscheiden, als äquivalent angesehen und effektiv als derselbe Zustand angesehen.

Zum Beispiel die Quantenzustände

$$
\vert - \rangle = \frac{1}{\sqrt{2}} \vert 0 \rangle - \frac{1}{\sqrt{2}} \vert 1 \rangle
\quad\text{and}\quad
-\vert - \rangle = -\frac{1}{\sqrt{2}} \vert 0 \rangle + \frac{1}{\sqrt{2}} \vert 1 \rangle
$$

unterscheiden sich durch eine globale Phase (die in diesem Beispiel $-1$ ist) und werden daher als derselbe Zustand betrachtet.

Andererseits die Quantenzustände

$$
\vert + \rangle = \frac{1}{\sqrt{2}} \vert 0 \rangle + \frac{1}{\sqrt{2}} \vert 1 \rangle
\quad\text{and}\quad
\vert - \rangle = \frac{1}{\sqrt{2}} \vert 0 \rangle - \frac{1}{\sqrt{2}} \vert 1 \rangle
$$

unterscheiden sich nicht durch eine globale Phase. Obwohl der einzige Unterschied zwischen den beiden Zuständen darin besteht, dass ein Pluszeichen in ein Minuszeichen umgewandelt wird, handelt es sich nicht um eine *globale* Phasendifferenz, sondern um eine *relative* Phasendifferenz, da sie nicht jeden Vektoreintrag betrifft, sondern nur eine geeignete Teilmenge der Einträge . Dies stimmt mit dem überein, was wir bereits in Lektion 1 gesehen haben, nämlich dass die Zustände $\vert + \rangle$ und $\vert - \rangle$ perfekt unterschieden werden können – indem man eine Hadamard-Operation durchführt und dann wie folgt die Ergebniswahrscheinlichkeiten misst :

$$
\begin{aligned}
\bigl\vert \langle 0 \vert H \vert + \rangle \bigr\vert^2 = 1 &amp; \hspace{1cm}
\bigl\vert \langle 0 \vert H \vert - \rangle \bigr\vert^2 = 0 \\[1mm]
\bigl\vert \langle 1 \vert H \vert + \rangle \bigr\vert^2 = 0 &amp; \hspace{1cm}
\bigl\vert \langle 1 \vert H \vert - \rangle \bigr\vert^2 = 1.
\end{aligned}
$$

Nebenbei finden wir hier noch einen weiteren Vorteil der allgemeinen Beschreibung von Quanteninformationen auf Basis von Dichtematrizen gegenüber der vereinfachten Beschreibung auf Basis von Quantenzustandsvektoren. In der allgemeinen Beschreibung der Quanteninformation verschwindet die Entartung, bei der sich zwei Quantenzustandsvektoren um eine globale Phase unterscheiden können und somit effektiv denselben Quantenzustand darstellen. Das heißt, zwei unterschiedliche Dichtematrizen stellen zwangsläufig zwei unterschiedliche Quantenzustände dar, die im statistischen Sinne unterschieden werden können.

### 3.2 No-Cloning-Theorem

Das *No-Cloning-Theorem* zeigt, dass es unmöglich ist, eine perfekte Kopie eines unbekannten Quantenzustands zu erstellen.

<!-- ::: q-block.note -->

**Theorem (No-Cloning-Theorem)** :

Seien $\mathsf{X}$ und $\mathsf{Y}$ Systeme, die dieselbe klassische Zustandsmenge $\Sigma$ mit mindestens zwei Elementen teilen. Es gibt keinen Quantenzustand $\vert \phi\rangle$ von $\mathsf{Y}$ und keine unitäre Operation $U$ auf dem Paar $(\mathsf{X},\mathsf{Y})$, so dass

$$
  U \bigl( \vert \psi \rangle \otimes \vert\phi\rangle\bigr)
  = \vert \psi \rangle \otimes \vert\psi\rangle
  \tag{6}
$$

für jeden Zustand $\vert \psi \rangle$ von $\mathsf{X}$.

<!-- ::: -->

Das heißt, es gibt keine Möglichkeit, das System $\mathsf{Y}$ (in irgendeinen beliebigen Zustand $\vert\phi\rangle$) zu initialisieren und eine unitäre Operation $U$ auf dem gemeinsamen System $(\mathsf{X },\mathsf{Y})$, sodass der Effekt darin besteht, dass der Zustand $\vert\psi\rangle$ von $\mathsf{X}$ *geklont* wird – was zu $(\mathsf{X},\mathsf{ Y})$ im Zustand $\vert \psi \rangle \otimes \vert\psi\rangle$.

Der Beweis dieses Satzes ist eigentlich ganz einfach: Er läuft auf die Beobachtung hinaus, dass die Abbildung

$$
\vert\psi\rangle \otimes \vert \phi\rangle\mapsto\vert\psi\rangle \otimes \vert \psi\rangle
$$

ist in $\vert\psi\rangle$ nicht linear.

Da $\Sigma$ mindestens zwei Elemente hat, können wir insbesondere $a,b\in\Sigma$ mit $a\not=b$ wählen. Wenn es einen Quantenzustand $\vert \phi\rangle$ von $\mathsf{Y}$ und eine unitäre Operation $U$ auf dem Paar $(\mathsf{X},\mathsf{Y})$ gäbe, für die $(6)$ gilt für jeden Quantenzustand $\vert\psi\rangle$ von $\mathsf{X}$, dann wäre es so

$$
U \bigl( \vert a \rangle \otimes \vert\phi\rangle\bigr)
= \vert a \rangle \otimes \vert a\rangle
\quad\text{and}\quad
U \bigl( \vert b \rangle \otimes \vert\phi\rangle\bigr)
= \vert b \rangle \otimes \vert b\rangle.
$$

Unter Linearität, also speziell der Linearität des Tensorprodukts im ersten Argument und der Linearität der Matrix-Vektor-Multiplikation im zweiten (Vektor-)Argument, müssen wir also haben

$$
U \biggl(\biggl( \frac{1}{\sqrt{2}}\vert a \rangle + \frac{1}{\sqrt{2}} \vert b\rangle \biggr) \otimes \vert\phi\rangle\biggr)
= \frac{1}{\sqrt{2}} \vert a \rangle \otimes \vert a\rangle
+ \frac{1}{\sqrt{2}} \vert b \rangle \otimes \vert b\rangle.
$$

Das verlangt aber die Forderung, dass $(6)$ für jeden Quantenzustand $\vert\psi\rangle$ gilt

$$
\begin{aligned}
  &amp; U \biggl(\biggl( \frac{1}{\sqrt{2}}\vert a \rangle + \frac{1}{\sqrt{2}} \vert b\rangle \biggr)
  \otimes \vert\phi\rangle\biggr)\\
  &amp; \qquad = \biggl(\frac{1}{\sqrt{2}} \vert a \rangle + \frac{1}{\sqrt{2}} \vert b \rangle\biggr)
  \otimes \biggl(\frac{1}{\sqrt{2}} \vert a \rangle + \frac{1}{\sqrt{2}} \vert b \rangle\biggr)\\
  &amp; \qquad = \frac{1}{2} \vert a \rangle \otimes \vert a\rangle
  + \frac{1}{2} \vert a \rangle \otimes \vert b\rangle
  + \frac{1}{2} \vert b \rangle \otimes \vert a\rangle
  + \frac{1}{2} \vert b \rangle \otimes \vert b\rangle\\
  &amp; \qquad \not= \frac{1}{\sqrt{2}} \vert a \rangle \otimes \vert a\rangle
  + \frac{1}{\sqrt{2}} \vert b \rangle \otimes \vert b\rangle
\end{aligned}
$$

Daher kann es keinen Zustand $\vert \phi\rangle$ und keine unitäre Operation $U$ geben, für die die Gleichung $(6)$ für jeden Quantenzustandsvektor $\vert \psi\rangle$ gilt.

Einige Bemerkungen zum No-Cloning-Theorem sind jedoch angebracht. Die erste ist, dass die Aussage des obigen No-Cloning-Theorems absolut ist, in dem Sinne, dass es besagt, dass *perfektes* Klonen unmöglich ist – aber es sagt nichts über ein mögliches Klonen mit begrenzter Genauigkeit aus, bei dem es uns gelingen könnte, eine Annäherung zu erstellen Klon (in Bezug auf eine Art zu messen, wie ähnlich zwei verschiedene Quantenzustände sein könnten). Tatsächlich gibt es Aussagen des No-Cloning-Theorems, die dem ungefähren Klonen Grenzen setzen, sowie Methoden, um ungefähres Klonen (mit begrenzter Genauigkeit) zu erreichen, aber wir werden diese Diskussion auf eine spätere Lektion verschieben, wenn die Teile erklärt werden müssen ungefähres Klonen vorhanden sind.

Die zweite Bemerkung ist, dass das No-Cloning-Theorem eine Aussage über die Unmöglichkeit ist, einen *beliebigen* Zustand $\vert\psi\rangle$ zu klonen. Wir können zum Beispiel leicht einen Klon von jedem Standard-Basiszustand erstellen. Zum Beispiel können wir einen Qubit-Standard-Basiszustand mit einer kontrollierte-NICHT-Operation klonen:

![Klassische Kopie](images/quantum-circuits/cNOT-copy.png)

Während es keine Schwierigkeit gibt, einen Klon eines Standard-Basiszustands zu erstellen, widerspricht dies nicht dem No-Cloning-Theorem – dieser Ansatz, ein kontrolliertes NICHT-Gatter zu verwenden, würde keinen Erfolg darin haben, einen Klon des Zustands $\vert + \rangle zu erstellen $ zum Beispiel.

Eine letzte Bemerkung zum No-Cloning-Theorem ist, dass es wirklich nicht nur für Quanteninformationen gilt, es ist auch unmöglich, einen beliebigen probabilistischen Zustand mit einem klassischen (deterministischen oder probabilistischen) Prozess zu klonen. Das ist ziemlich intuitiv. Man stellt sich vor, jemand gibt uns ein System in einem probabilistischen Zustand, aber wir sind uns nicht sicher, was dieser probabilistische Zustand ist. Vielleicht hat man zum Beispiel zufällig eine Zahl zwischen 1$ und 10$ generiert, aber man hat uns nicht gesagt, wie man diese Zahl generiert hat. Es gibt sicherlich keinen physikalischen Prozess, durch den wir zwei *unabhängige* Kopien desselben probabilistischen Zustands erhalten können: Alles, was wir in unseren Händen halten, ist eine Zahl zwischen 1 $ und 10 $, und es sind einfach nicht genügend Informationen vorhanden, um die Wahrscheinlichkeiten für alle anderen Ergebnisse irgendwie zu rekonstruieren. Mathematisch gesehen kann eine Version des No-Cloning-Theorems für probabilistische Zustände genauso bewiesen werden wie das reguläre No-Cloning-Theorem (für Quantenzustände). Das heißt, das Klonen eines beliebigen probabilistischen Zustands ist ein nichtlinearer Prozess, sodass er unmöglich durch eine stochastische Matrix dargestellt werden kann.

### 3.3 Nicht-orthogonale Zustände können nicht perfekt unterschieden werden

Als letzte Einschränkung, die in dieser Lektion behandelt wird, zeigen wir, dass, wenn wir zwei Quantenzustände $\vert\psi\rangle$ und $\vert\phi\rangle$ haben, die nicht orthogonal sind, was bedeutet, dass $\langle \phi \vert\psi\rangle \not=0$, dann ist es unmöglich, sie perfekt zu unterscheiden (oder mit anderen Worten sei auseinanderzuhalten).

Tatsächlich zeigen wir etwas logisch Äquivalentes: Wenn wir eine Möglichkeit haben, zwei Zustände perfekt und fehlerfrei zu unterscheiden, dann müssen sie orthogonal sein.

Wir werden unsere Aufmerksamkeit auf Quantenschaltkreise beschränken, die aus einer beliebigen Anzahl unitäre Gatter bestehen, gefolgt von einer einzigen Standardbasismessung des obersten Qubits. Was wir von einem Quantenschaltkreis verlangen, um zu sagen, dass er die Zustände $\vert\psi\rangle$ und $\vert\phi\rangle$ perfekt diskriminiert, ist, dass die Messung immer den Wert $0$ für einen der beiden Zustände liefert und bringt immer $1$ für den anderen Zustand. Um genau zu sein, nehmen wir an, dass wir einen Quantenschaltkreis haben, der so funktioniert, wie es die folgenden Diagramme nahelegen:

![Psi diskriminieren](images/quantum-circuits/discriminate.png)

Das mit $U$ bezeichnete Kästchen bezeichnet die unitären Operation, die die kombinierte Wirkung aller unitären Gatter in unserer Schaltung darstellt, aber nicht die endgültige Messung enthält. Es ist kein Verlust an Allgemeingültigkeit, anzunehmen, dass die Messung $0$ für $\vert\psi\rangle$ und $1$ für $\vert\phi\rangle$ ausgibt; die Analyse würde sich nicht grundlegend unterscheiden, wenn diese Ausgangswerte umgekehrt würden.

Beachten wir jedoch, dass die Schaltung zusätzlich zu den Qubits, die anfänglich entweder $\vert\psi\rangle$ oder $\vert\phi\rangle$ speichern, beliebig viele zusätzliche *Workspace-* Qubits verwenden kann. Diese Qubits werden anfänglich jeweils auf den Zustand $\vert 0\rangle$ gesetzt – daher wird ihr kombinierter Zustand in den Abbildungen als $\vert 0\cdots 0\rangle$ bezeichnet – und diese Qubits können von der Schaltung auf beliebige Weise verwendet werden könnte von Vorteil sein. Es ist sehr üblich, Workspace-Qubits in solchen Quantenschaltkreisen zu verwenden, wie wir in der nächsten Einheit sehen werden.

Überlegen wir nun, was passiert, wenn wir unsere Schaltung im Zustand $\vert\psi\rangle$ ausführen (zusammen mit den initialisierten Workspace-Qubits). Der resultierende Zustand unmittelbar vor der Durchführung der Messung kann geschrieben werden als

$$
U \bigl(  \vert 0\cdots 0 \rangle \vert \psi \rangle\bigr)
= \vert \gamma_0\rangle\vert 0 \rangle + \vert \gamma_1 \rangle\vert 1 \rangle
$$

für zwei Vektoren $\vert \gamma_0\rangle$ und $\vert \gamma_1\rangle$, die allen Qubits außer dem obersten Qubit entsprechen. Im Allgemeinen sind für einen solchen Zustand die Wahrscheinlichkeiten, dass eine Messung des obersten Qubits die Ergebnisse $0$ und $1$ liefert, wie folgt:

$$
\operatorname{Pr}(\text{outcome is $0$}) = \bigl\| \vert\gamma_0\rangle \bigr\|^2
\qquad\text{and}\qquad
\operatorname{Pr}(\text{outcome is $1$}) = \bigl\| \vert\gamma_1\rangle \bigr\|^2.
$$

Da wir davon ausgehen, dass unsere Schaltung für den Zustand $\vert\psi\rangle$ immer $0$ ausgibt, muss $\vert\gamma_1\rangle = 0,$ sein und so

$$
U \bigl( \vert 0\cdots 0\rangle\vert \psi \rangle  \bigr)
= \vert\gamma_0\rangle\vert 0 \rangle.
$$

Die Multiplikation beider Seiten dieser Gleichung mit $U^{\dagger}$ ergibt folgende Gleichung:

$$
\vert 0\cdots 0\rangle\vert \psi \rangle
= U^{\dagger} \bigl( \vert \gamma_0\rangle\vert 0 \rangle \bigr).
\tag{7}
$$

Wenn wir ähnlich für $\vert\phi\rangle$ anstelle von $\vert\psi\rangle$ argumentieren, schließen wir daraus

$$
U \bigl( \vert 0\cdots 0\rangle\vert \phi \rangle  \bigr)
=  \vert \delta_1\rangle\vert 1 \rangle
$$

für einen Vektor $\vert\delta_1\rangle$, und daher

$$
\vert 0\cdots 0\rangle\vert \phi \rangle
= U^{\dagger} \bigl(  \vert \delta_1\rangle\vert 1 \rangle\bigr).
\tag{8}
$$

Nehmen wir nun das innere Produkt der durch die Gleichungen $(7)$ und $(8)$ dargestellten Vektoren, beginnend mit den Darstellungen auf der rechten Seite jeder Gleichung. Wir haben

$$
\bigl(U^{\dagger} \bigl( \vert \gamma_0\rangle\vert 0 \rangle \bigr)\bigr)^{\dagger}
=
\bigl( \langle\gamma_0\vert\langle 0\vert \bigr)U,
$$

also das innere Produkt des Vektors $(7)$ mit dem Vektor $(8)$ ist

$$
\bigl( \langle\gamma_0\vert\langle 0\vert \bigr)U U^{\dagger} \bigl(  \vert \delta\rangle\vert 1 \rangle\bigr)
= \bigl( \langle\gamma_0\vert\langle 0\vert \bigr) \bigl(  \vert \delta_1\rangle\vert 1 \rangle\bigr)
=  \langle \gamma_0 \vert \delta_1\rangle \langle 0 \vert 1 \rangle = 0.
$$

Hier haben wir die Tatsache ausgenutzt, dass $UU^{\dagger} = \mathbb{1}$, sowie die Tatsache, dass das innere Produkt von Tensorprodukten, das Produkt der inneren Produkte ist:

$$
\langle u \otimes v \vert w \otimes x\rangle = \langle u \vert w\rangle \langle v \vert x\rangle
$$

für jede Auswahl dieser Vektoren (vorausgesetzt, $\vert u\rangle$ und $\vert w\rangle$ haben die gleiche Anzahl von Einträgen und $\vert v\rangle$ und $\vert x\rangle$ haben die gleiche Anzahl von Einträgen Einträge, so dass es sinnvoll ist, die inneren Produkte $\langle u\vert w\rangle$ und $\langle v\vert x \rangle$ zu bilden). Beachten wir jedoch, dass der Wert des Skalarprodukts $\langle \gamma_0 \vert \delta_1\rangle$ irrelevant ist, da er mit $\langle 0 \vert 1 \rangle = 0$ multipliziert wird. Das ist ein Glück, denn wir wissen wirklich nicht viel über diese beiden Vektoren.

Schließlich muss das innere Produkt der Vektoren $(7)$ und $(8)$ auf der linken Seite der Gleichungen denselben Nullwert ergeben, und somit

$$
0 = \bigl(  \langle 0\cdots 0\vert\langle \psi\vert \bigr) \vert 0\cdots 0\rangle\vert \phi\rangle\bigr)
=  \langle 0\cdots 0 \vert 0\cdots 0 \rangle \langle \psi \vert \phi \rangle = \langle \psi \vert \phi \rangle.
$$

Wir haben festgestellt, was wir wollten, nämlich dass $\vert \psi\rangle$ und $\vert\phi\rangle$ orthogonal sind: $\langle \psi \vert \phi \rangle = 0.$

Es ist übrigens möglich, zwei beliebige Zustände, die orthogonal sind, perfekt zu unterscheiden. Angenommen, die beiden zu unterscheidenden Zustände sind $\vert \phi\rangle$ und $\vert \psi\rangle$, wobei $\langle \phi\vert\psi\rangle = 0$ ist. Wir können diese Zustände dann perfekt unterscheiden, indem wir die durch diese Matrizen beschriebene projektive Messung durchführen, zum Beispiel:

$$
\bigl\{
\vert\phi\rangle\langle\phi\vert,\,\mathbb{1} - \vert\phi\rangle\langle\phi\vert
\bigr\}.
$$

Für den Zustand $\vert\phi\rangle$ erhält man immer das erste Ergebnis:

$$
\begin{aligned}
&amp; \bigl\| \vert\phi\rangle\langle\phi\vert \vert\phi\rangle \bigr\|^2 =
\bigl\| \vert\phi\rangle\langle\phi\vert\phi\rangle \bigr\|^2 =
\bigl\| \vert\phi\rangle \bigr\|^2 = 1,\\[1mm]
&amp; \bigl\| (\mathbb{1} - \vert\phi\rangle\langle\phi\vert) \vert\phi\rangle \bigr\|^2 =
\bigl\| \vert\phi\rangle - \vert\phi\rangle\langle\phi\vert\phi\rangle \bigr\|^2 =
\bigl\| \vert\phi\rangle - \vert\phi\rangle \bigr\|^2 = 0.
\end{aligned}
$$

Und für den Zustand $\vert\psi\rangle$ erhält man immer das zweite Ergebnis:

$$
\begin{aligned}
&amp; \bigl\| \vert\phi\rangle\langle\phi\vert \vert\psi\rangle \bigr\|^2 =
\bigl\| \vert\phi\rangle\langle\phi\vert\psi\rangle \bigr\|^2 =
\bigl\| 0 \bigr\|^2 = 0,\\[1mm]
&amp; \bigl\| (\mathbb{1} - \vert\phi\rangle\langle\phi\vert) \vert\psi\rangle \bigr\|^2 =
\bigl\| \vert\psi\rangle - \vert\phi\rangle\langle\phi\vert\psi\rangle \bigr\|^2 =
\bigl\| \vert\psi\rangle \bigr\|^2 = 1.
\end{aligned}
$$
