In [None]:
# Setup: install Qiskit (runs automatically in Colab, no-op in Binder)
!pip install -q qiskit qiskit-aer qiskit-ibm-runtime pylatexenc

# Transpiler-Einstellungen vergleichen

*Nutzungsschätzung: unter einer Minute auf einem Eagle r3-Prozessor (HINWEIS: Dies ist nur eine Schätzung. Ihre Laufzeit kann variieren.)*

## Hintergrund
Um schnellere und effizientere Ergebnisse zu gewährleisten, müssen Schaltkreise und Observables ab dem 1. März 2024 so transformiert werden, dass sie nur Anweisungen verwenden, die von der QPU (Quantum Processing Unit) unterstützt werden, bevor sie an die Qiskit Runtime Primitives übermittelt werden. Wir nennen diese *Instruction Set Architecture* (ISA)-Schaltkreise und -Observables. Eine gängige Methode hierfür ist die Verwendung der `generate_preset_pass_manager`-Funktion des Transpilers. Sie können jedoch auch einem manuelleren Prozess folgen.

Beispielsweise möchten Sie möglicherweise eine bestimmte Teilmenge von Qubits auf einem bestimmten Gerät ansprechen. Dieser Walkthrough testet die Leistung verschiedener Transpiler-Einstellungen, indem der vollständige Prozess der Erstellung, Transpilierung und Einreichung von Schaltkreisen durchgeführt wird.
## Voraussetzungen
Stellen Sie vor Beginn sicher, dass Sie Folgendes installiert haben:

* Qiskit SDK v1.2 oder höher, mit [Visualisierungs](https://docs.quantum.ibm.com/api/qiskit/visualization)-Unterstützung
* Qiskit Runtime v0.28 oder höher (`pip install qiskit-ibm-runtime`)
## Setup

In [None]:
# Create circuit to test transpiler on
from qiskit import QuantumCircuit
from qiskit.transpiler.preset_passmanagers import generate_preset_pass_manager
from qiskit.circuit.library import GroverOperator, Diagonal

# Use Statevector object to calculate the ideal output
from qiskit.quantum_info import Statevector
from qiskit.visualization import plot_histogram
from qiskit.transpiler import PassManager

from qiskit.circuit.library import XGate
from qiskit.quantum_info import hellinger_fidelity

# Qiskit Runtime
from qiskit_ibm_runtime import (
    QiskitRuntimeService,
    Batch,
    SamplerV2 as Sampler,
)
from qiskit_ibm_runtime.transpiler.passes.scheduling import (
    ASAPScheduleAnalysis,
    PadDynamicalDecoupling,
)

## Schritt 1: Klassische Eingaben auf ein Quantenproblem abbilden
Erstellen Sie einen kleinen Schaltkreis, den der Transpiler versuchen soll zu optimieren. Dieses Beispiel erstellt einen Schaltkreis, der Grovers Algorithmus mit einem Orakel durchführt, das den Zustand `111` markiert. Simulieren Sie als Nächstes die ideale Verteilung (was Sie erwarten würden zu messen, wenn Sie dies auf einem perfekten Quantencomputer unendlich oft ausführen würden) zum späteren Vergleich.

In [None]:
# To run on hardware, select the backend with the fewest number of jobs in the queue
service = QiskitRuntimeService()
backend = service.least_busy(
    operational=True, simulator=False, min_num_qubits=127
)
backend.name

'ibm_brisbanse'

In [29]:
oracle = Diagonal([1] * 7 + [-1])
qc = QuantumCircuit(3)
qc.h([0, 1, 2])
qc = qc.compose(GroverOperator(oracle))

qc.draw(output="mpl", style="iqp")

<Image src="../docs/images/guides/circuit-transpilation-settings/extracted-outputs/7e7944c5-68ac-40cf-a0eb-5f4a44d53931-0.avif" alt="Output of the previous code cell" />

In [30]:
ideal_distribution = Statevector.from_instruction(qc).probabilities_dict()

plot_histogram(ideal_distribution)

<Image src="../docs/images/guides/circuit-transpilation-settings/extracted-outputs/761afe09-b669-453f-8363-55070d6c8f57-0.avif" alt="Output of the previous code cell" />

## Step 2: Optimize problem for quantum hardware execution

Next, transpile the circuits for the QPU. You will compare the performance of the transpiler with `optimization_level` set to `0` (lowest) against `3` (highest). The lowest optimization level does the bare minimum needed to get the circuit running on the device; it maps the circuit qubits to the device qubits and adds swap gates to allow all two-qubit operations. The highest optimization level is much smarter and uses lots of tricks to reduce the overall gate count. Since multi-qubit gates have high error rates and qubits decohere over time, the shorter circuits should give better results.

The following cell transpiles `qc` for both values of `optimization_level`, prints the number of two-qubit gates, and adds the transpiled circuits to a list. Some of the transpiler's algorithms are randomized, so it sets a seed for reproducibility.

In [31]:
# Need to add measurements to the circuit
qc.measure_all()

# Find the correct two-qubit gate
twoQ_gates = set(["ecr", "cz", "cx"])
for gate in backend.basis_gates:
    if gate in twoQ_gates:
        twoQ_gate = gate

circuits = []
for optimization_level in [0, 3]:
    pm = generate_preset_pass_manager(
        optimization_level, backend=backend, seed_transpiler=0
    )
    t_qc = pm.run(qc)
    print(
        f"Two-qubit gates (optimization_level={optimization_level}): ",
        t_qc.count_ops()[twoQ_gate],
    )
    circuits.append(t_qc)

Two-qubit gates (optimization_level=0):  21
Two-qubit gates (optimization_level=3):  14


![Output of the previous code cell](../docs/images/guides/circuit-transpilation-settings/extracted-outputs/761afe09-b669-453f-8363-55070d6c8f57-0.avif)

## Schritt 2: Problem für Quanten-Hardware-Ausführung optimieren
Transpilieren Sie als Nächstes die Schaltkreise für die QPU. Sie werden die Leistung des Transpilers mit `optimization_level` auf `0` (niedrigste) gegen `3` (höchste) vergleichen. Das niedrigste Optimierungslevel macht das Minimum, das erforderlich ist, um den Schaltkreis auf dem Gerät zum Laufen zu bringen; es ordnet die Schaltkreis-Qubits den Geräte-Qubits zu und fügt Swap-Gates hinzu, um alle Zwei-Qubit-Operationen zu ermöglichen. Das höchste Optimierungslevel ist viel intelligenter und verwendet viele Tricks, um die Gesamtanzahl der Gates zu reduzieren. Da Multi-Qubit-Gates hohe Fehlerraten haben und Qubits im Laufe der Zeit dekohärieren, sollten die kürzeren Schaltkreise bessere Ergebnisse liefern.

Die folgende Zelle transpiliert `qc` für beide Werte von `optimization_level`, gibt die Anzahl der Zwei-Qubit-Gates aus und fügt die transpilierten Schaltkreise einer Liste hinzu. Einige der Algorithmen des Transpilers sind randomisiert, daher wird ein Seed für Reproduzierbarkeit festgelegt.

In [None]:
# Get gate durations so the transpiler knows how long each operation takes
durations = backend.target.durations()

# This is the sequence we'll apply to idling qubits
dd_sequence = [XGate(), XGate()]

# Run scheduling and dynamic decoupling passes on circuit
pm = PassManager(
    [
        ASAPScheduleAnalysis(durations),
        PadDynamicalDecoupling(durations, dd_sequence),
    ]
)
circ_dd = pm.run(circuits[1])

# Add this new circuit to our list
circuits.append(circ_dd)

In [33]:
circ_dd.draw(output="mpl", style="iqp", idle_wires=False)

<Image src="../docs/images/guides/circuit-transpilation-settings/extracted-outputs/4ada6498-b9d7-4d88-b8a9-ef1dc0a85bf7-0.avif" alt="Output of the previous code cell" />

Da CNOTs normalerweise eine hohe Fehlerrate haben, sollte der mit `optimization_level=3` transpilierte Schaltkreis viel besser abschneiden.

Eine weitere Möglichkeit, die Leistung zu verbessern, ist durch [Dynamic Decoupling](https://docs.quantum.ibm.com/api/qiskit/qiskit.transpiler.passes.PadDynamicalDecoupling), indem eine Sequenz von Gates auf unbeschäftigte Qubits angewendet wird. Dies hebt einige unerwünschte Wechselwirkungen mit der Umgebung auf. Die folgende Zelle fügt Dynamic Decoupling zu dem mit `optimization_level=3` transpilierten Schaltkreis hinzu und fügt ihn der Liste hinzu.

In [34]:
with Batch(backend=backend):
    sampler = Sampler()
    job = sampler.run(
        [(circuit) for circuit in circuits],  # sample all three circuits
        shots=8000,
    )
    result = job.result()

## Step 4: Post-process and return result in desired classical format

Finally, plot the results from the device runs against the ideal distribution. You can see the results with `optimization_level=3` are closer to the ideal distribution due to the lower gate count, and `optimization_level=3 + dd` is even closer due to the dynamic decoupling.

In [35]:
binary_prob = [
    {
        k: v / res.data.meas.num_shots
        for k, v in res.data.meas.get_counts().items()
    }
    for res in result
]
plot_histogram(
    binary_prob + [ideal_distribution],
    bar_labels=False,
    legend=[
        "optimization_level=0",
        "optimization_level=3",
        "optimization_level=3 + dd",
        "ideal distribution",
    ],
)

<Image src="../docs/images/guides/circuit-transpilation-settings/extracted-outputs/525777ea-d438-4f3b-acb6-53e579f24a0e-0.avif" alt="Output of the previous code cell" />

![Output of the previous code cell](../docs/images/guides/circuit-transpilation-settings/extracted-outputs/4ada6498-b9d7-4d88-b8a9-ef1dc0a85bf7-0.avif)

## Schritt 3: Ausführung mit Qiskit Primitives
An diesem Punkt haben Sie eine Liste von Schaltkreisen, die für die angegebene QPU transpiliert wurden. Erstellen Sie als Nächstes eine Instanz des Sampler-Primitive und starten Sie einen Batch-Job mit dem Context Manager (`with ...:`), der den Batch automatisch öffnet und schließt.

Innerhalb des Context Managers sampeln Sie die Schaltkreise und speichern die Ergebnisse in `result`.

In [None]:
for prob in binary_prob:
    print(f"{hellinger_fidelity(prob, ideal_distribution):.3f}")

0.848
0.945
0.990
