In [None]:
# Install required packages (runs automatically in Colab, fast no-op in Binder)
!pip install -q qiskit qiskit-aer qiskit-ibm-runtime pylatexenc matplotlib mthree

# Mitigazione degli errori di lettura per la primitiva Sampler utilizzando M3

*Stima dell'utilizzo: meno di un minuto su un processore Heron r2 (NOTA: Questa √® solo una stima. Il tempo di esecuzione effettivo potrebbe variare.)*

## Contesto
A differenza della primitiva Estimator, la primitiva Sampler non dispone di supporto integrato per la mitigazione degli errori.
Diversi metodi supportati dall'Estimator sono progettati specificamente per i valori di aspettazione e pertanto non sono applicabili alla primitiva Sampler. Un'eccezione √® la mitigazione degli errori di lettura, che √® un metodo altamente efficace applicabile anche alla primitiva Sampler.

L'[addon Qiskit M3](https://qiskit.github.io/qiskit-addon-mthree/) implementa un metodo efficiente per la mitigazione degli errori di lettura. Questo tutorial spiega come utilizzare l'addon Qiskit M3 per mitigare gli errori di lettura per la primitiva Sampler.

### Cos'√® l'errore di lettura?
Immediatamente prima della misura, lo stato di un registro di qubit √®
descritto da una sovrapposizione di stati della base computazionale,
o da una matrice di densit√†.
La misura del registro di qubit in un registro di bit classici procede quindi in due fasi.
Per prima cosa viene eseguita la vera e propria misura quantistica.
Ci√≤ significa che lo stato del registro di qubit
viene proiettato su un singolo stato di base caratterizzato
da una stringa di $1$ e $0$.
La seconda fase consiste nel leggere la stringa di bit che caratterizza questo stato di base
e scriverla nella memoria del computer classico.
Chiamiamo questa fase *lettura* (readout).
Si scopre che la seconda fase (lettura) comporta pi√π errori della prima fase (proiezione sugli stati di base).
Questo ha senso quando si ricorda che la lettura richiede di rilevare uno stato
quantistico microscopico e amplificarlo fino al regno macroscopico. Un risonatore di lettura √® accoppiato al
qubit (transmon), sperimentando cos√¨ un piccolissimo spostamento di frequenza. Un impulso a microonde
viene quindi riflesso dal risonatore, subendo a sua volta piccole variazioni nelle sue
caratteristiche. L'impulso riflesso viene quindi amplificato e analizzato. Si tratta di un processo delicato
soggetto a una moltitudine di errori.

Il punto importante √® che, sebbene sia la misura quantistica che la lettura siano soggette a errori, quest'ultima
comporta l'errore dominante, chiamato errore di lettura, che √® l'obiettivo di questo tutorial.
### Fondamenti teorici
Se la stringa di bit campionata (memorizzata nella memoria classica) differisce dalla stringa di bit che caratterizza
lo stato quantistico proiettato, diciamo che si √® verificato un errore di lettura.
Si osserva che questi errori sono casuali e non correlati da un campione all'altro.
Si √® dimostrato utile modellare l'errore di lettura come un _canale classico rumoroso_.
Ovvero, per ogni coppia di
stringhe di bit $i$ e $j$, esiste una probabilit√† fissa che un valore vero di $j$ venga
letto erroneamente come $i$.

Pi√π precisamente, per ogni coppia di stringhe di bit $(i, j)$, esiste una probabilit√† (condizionale) ${M}_{i,j}$
che $i$ venga letto, dato che il valore vero √® $j.$
Cio√®,
$$
    {M}_{i,j} =  \Pr(\text{il valore letto √® } i | \text{il valore vero √® } j)
    \text{ per } i,j \in (0,...,2^n - 1), \tag{1}
$$
dove $n$ √® il numero di bit nel registro di lettura.
Per concretezza, assumiamo che $i$ sia un intero decimale la cui rappresentazione binaria √®
la stringa di bit che etichetta gli stati della base computazionale.
Chiamiamo la matrice ${M}$ di dimensione $2^n \times 2^n$ la _matrice di assegnazione_.
Per un valore vero $j$ fissato, sommando la probabilit√† su tutti i risultati rumorosi $i$ deve dare $1$. Cio√®
$$
    \sum_{i=0}^{2^n - 1} {M}_{i,j} = 1 \text{ per ogni } j
$$
Una matrice senza elementi negativi che soddisfa (1) √® detta
_stocastica a sinistra_.
Una matrice stocastica a sinistra √® anche detta _stocastica per colonne_ perch√© ciascuna delle sue colonne somma a $1$.
Determiniamo sperimentalmente valori approssimati per ciascun elemento ${M}_{i,j}$
preparando ripetutamente ciascuno stato di base $|j \rangle$ e quindi calcolando le frequenze
dell'occorrenza delle stringhe di bit campionate.

Se un esperimento prevede la stima di una distribuzione di probabilit√† sulle stringhe di bit di output mediante campionamento ripetuto,
allora possiamo utilizzare ${M}$ per mitigare l'errore di lettura a livello di distribuzione.
Il primo passo consiste nel ripetere un circuito fisso di interesse molte volte,
creando un istogramma delle stringhe di bit campionate.
L'istogramma normalizzato √® la distribuzione di probabilit√† misurata sulle
$2^n$ possibili stringhe di bit, che denotiamo con ${\tilde{p}} \in \mathbb{R}^{2^n}$.
La probabilit√† (stimata) ${{\tilde{p}}}_i$ di campionare la stringa di bit $i$
√® uguale alla somma su tutte le vere stringhe di bit $j$, ciascuna ponderata dalla
probabilit√† che sia scambiata per $i$.
Questa affermazione in forma matriciale √®
$$
    {\tilde{p}} = {M} {\vec{p}}, \tag{2},
$$
dove ${\vec{p}}$ √® la distribuzione vera. In parole, l'errore di lettura ha l'effetto di moltiplicare
la distribuzione ideale sulle stringhe di bit ${\vec{p}}$ per la matrice di assegnazione ${M}$ per
produrre la distribuzione osservata ${\tilde{p}}$.
Abbiamo misurato ${\tilde{p}}$ e ${M}$, ma non abbiamo accesso diretto a ${\vec{p}}$. In linea di principio, otterremo
la distribuzione vera delle stringhe di bit per il nostro circuito
risolvendo l'equazione (2) per ${\vec{p}}$ numericamente.

Prima di procedere, vale la pena notare alcune caratteristiche importanti di questo approccio ingenuo.

- In pratica, l'equazione (2) non viene risolta invertendo ${M}$. Le routine di algebra lineare
  nelle librerie software impiegano metodi pi√π stabili, accurati ed efficienti.
- Quando stimiamo ${M}$, assumiamo che si siano verificati solo errori di lettura. In particolare,
  assumiamo che non ci siano stati errori di preparazione dello stato e di misura quantistica ‚Äî
  o almeno che siano stati altrimenti mitigati.
  Nella misura in cui questa √® una buona assunzione, ${M}$ rappresenta davvero
  solo l'errore di lettura. Ma quando _usiamo_ ${M}$ per correggere una distribuzione misurata
  sulle stringhe di bit, non facciamo tale assunzione. Infatti, ci aspettiamo che un circuito
  interessante introduca rumore, ad esempio errori di gate. La distribuzione "vera"
  include ancora gli effetti di eventuali errori che non sono altrimenti mitigati.

Questo metodo, sebbene utile in alcune circostanze, soffre di alcune limitazioni.

Le risorse di spazio e tempo necessarie per stimare ${M}$ crescono esponenzialmente con $n$:
- La stima di ${M}$ e ${\tilde{p}}$ √® soggetta a errori statistici dovuti al campionamento finito.
  Questo rumore pu√≤ essere reso piccolo quanto desiderato
  al costo di pi√π campioni (fino alla scala temporale di parametri hardware alla deriva
  che risultano in errori sistematici in ${M}$).
  Tuttavia, se non vengono fatte assunzioni sulle stringhe di bit osservate
  durante l'esecuzione della mitigazione, il numero di campioni richiesti per stimare ${M}$ cresce
  almeno esponenzialmente con $n$.
- ${M}$ √® una matrice $2^n \times 2^n$.
  Quando $n>10$, la quantit√† di memoria necessaria per memorizzare ${M}$ √®
  maggiore della memoria disponibile in un potente laptop.

Ulteriori limitazioni sono:

- La distribuzione recuperata ${\vec{p}}$ pu√≤ avere una
  o pi√π probabilit√† negative (pur sommando comunque a uno). Una soluzione
  √® minimizzare $||{M} {\vec{p}} - {\tilde{p}}||^2$ soggetto al vincolo che
  ciascun elemento in ${\vec{p}}$ sia non negativo. Tuttavia, il tempo di esecuzione di tale
  metodo √® di ordini di grandezza pi√π lungo rispetto alla risoluzione diretta dell'equazione (2).
- Questa procedura di mitigazione funziona a livello di una distribuzione di probabilit√†
  sulle stringhe di bit. In particolare, non pu√≤ correggere un errore in una singola
  stringa di bit osservata.
### Addon Qiskit M3: Scalare a stringhe di bit pi√π lunghe
Risolvere l'equazione (2) utilizzando routine di algebra lineare numerica standard √® limitato a stringhe di bit lunghe non pi√π di circa 10 bit. M3, tuttavia, pu√≤ gestire stringhe di bit molto pi√π lunghe. Due propriet√† chiave di M3 che rendono ci√≤ possibile sono:
- Le correlazioni nell'errore di lettura di ordine tre e superiore tra raccolte di bit
  sono considerate trascurabili e vengono ignorate. In linea di principio, al costo di pi√π campioni,
  si potrebbero stimare anche correlazioni pi√π elevate.
- Invece di costruire ${M}$ esplicitamente, utilizziamo una matrice effettiva molto pi√π piccola che registra
  le probabilit√† solo per le stringhe di bit raccolte durante la costruzione di ${\tilde{p}}$.

Ad alto livello, la procedura funziona come segue.

Per prima cosa, costruiamo blocchi costitutivi dai quali possiamo costruire una descrizione semplificata ed effettiva di ${M}$.
Quindi, eseguiamo ripetutamente il circuito di interesse e raccogliamo stringhe di bit che usiamo per costruire
sia ${\tilde{p}}$ che, con l'aiuto dei blocchi costitutivi, una ${M}$ effettiva.

Pi√π precisamente,
- Vengono stimate matrici di assegnazione a singolo qubit per ciascun qubit. Per fare ci√≤, prepariamo ripetutamente
  il registro di qubit nello stato tutto-zero $|0 ... 0 \rangle$ e poi nello stato tutto-uno
  $|1 ... 1 \rangle$, e registriamo la probabilit√† per ciascun qubit che venga letto
  in modo errato.
- Le correlazioni di ordine tre e superiore sono considerate trascurabili e vengono ignorate.

  Invece costruiamo un numero $n$ di matrici di assegnazione a singolo qubit $2 \times 2$,
  e un numero $n(n-1)/2$ di matrici di assegnazione a due qubit $4 \times 4$.
  Queste matrici di assegnazione a uno e due qubit vengono memorizzate per un uso
  successivo.
- Dopo aver campionato ripetutamente un circuito per costruire ${\tilde{p}}$,
  costruiamo un'approssimazione effettiva a ${M}$ utilizzando solo
  le stringhe di bit che vengono campionate durante la costruzione di ${\tilde{p}}$. Questa matrice effettiva
  viene costruita utilizzando le matrici a singolo e due qubit descritte nell'elemento precedente.
  La dimensione lineare di questa matrice √® al massimo dell'ordine del numero
  di campioni utilizzati nella costruzione di ${\tilde{p}}$, che √® molto pi√π piccola della
  dimensione $2^n$ della matrice di assegnazione completa ${M}$.

Per i dettagli tecnici su M3, potete fare riferimento a [*Scalable Mitigation of Measurement Errors on Quantum Computers*](https://journals.aps.org/prxquantum/abstract/10.1103/PRXQuantum.2.040326).
### Applicazione di M3 a un algoritmo quantistico
Applicheremo la mitigazione della lettura di M3 al problema dello spostamento nascosto. Il problema dello spostamento nascosto, e problemi strettamente correlati come il [problema del sottogruppo nascosto](https://en.wikipedia.org/wiki/Hidden_subgroup_problem), furono originariamente concepiti in un contesto fault-tolerant (pi√π precisamente, prima che fosse dimostrato possibile avere QPU fault-tolerant!). Ma vengono studiati anche con i processori disponibili. Un esempio di accelerazione esponenziale algoritmica ottenuta per una variante del problema dello spostamento nascosto ottenuta su QPU IBM&reg; da 127 qubit pu√≤ essere trovato in [questo articolo](https://journals.aps.org/prx/accepted/a9074K06A8e1590147da9c69f8c4b64c28247be5a) ([versione arXiv](https://arxiv.org/abs/2401.07934)).

Nel seguito, tutta l'aritmetica √® booleana.
Cio√®, per $a, b \in \mathbb{Z}_2 = {0, 1}$, l'addizione, $a + b$ √® la funzione logica XOR.
Inoltre, la moltiplicazione $a \times b$ (o $a b$) √® la funzione logica AND. Per $x, y \in {0, 1}^n$,
$x + y$ √® definita dall'applicazione bit per bit di XOR.
Il prodotto scalare $\cdot: {\mathbb{Z}_2^n} \rightarrow \mathbb{Z}_2$ √® definito
da $x \cdot y = \sum_i x_i y_i$.
#### Operatore di Hadamard e trasformata di Fourier
Nell'implementazione di algoritmi quantistici, √® molto comune utilizzare l'operatore di Hadamard come trasformata di Fourier.
Gli stati della base computazionale sono talvolta chiamati _stati classici_. Stanno in
una relazione uno a uno con le stringhe di bit classiche.
L'operatore di Hadamard a $n$ qubit sugli stati classici pu√≤ essere visto come una trasformata di Fourier sull'ipercubo booleano:
$$
H^{\otimes n} =  \frac{1}{\sqrt{2^n}} \sum_{x,y \in {\mathbb{Z}_2^n}} (-1)^{x \cdot y} {|{y}\rangle}{\langle{x}|}.
$$
Consideriamo uno stato ${|{s}\rangle}$ corrispondente a una stringa di bit fissa $s$.
Applicando $H^{\otimes n}$, e usando ${\langle {x}|{s}\rangle} = \delta_{x,s}$,
vediamo che la trasformata di Fourier di ${|{s}\rangle}$ pu√≤ essere scritta come
$$
   H^{\otimes n} {|{s}\rangle} =  \frac{1}{\sqrt{2^n}} \sum_{y \in {\mathbb{Z}_2^n}} (-1)^{s \cdot y} {|{y}\rangle}.
$$

L'Hadamard √® la propria inversa, cio√®,
 $H^{\otimes n} H^{\otimes n} = (H H)^{\otimes n} = I^{\otimes n}$.
Quindi, la trasformata di Fourier inversa √® lo stesso operatore, $H^{\otimes n}$.
Esplicitamente, abbiamo,
$$
  {|{s}\rangle} =  H^{\otimes n} H^{\otimes n} {|{s}\rangle}  =  H^{\otimes n} \frac{1}{\sqrt{2^n}} \sum_{y \in {\mathbb{Z}_2^n}} (-1)^{s \cdot y} {|{y}\rangle}.
$$
#### Il problema dello spostamento nascosto
Consideriamo un semplice esempio di un _problema dello spostamento nascosto_.
Il problema consiste nell'identificare uno spostamento costante nell'input di una funzione.
La funzione che consideriamo √® il prodotto scalare. √à il membro pi√π semplice
di una grande classe di funzioni che ammettono un'accelerazione quantistica per il problema dello spostamento nascosto
tramite tecniche simili a quelle presentate di seguito.

Sia $x,y \in {\mathbb{Z}_2^m}$ stringhe di bit di lunghezza $m$.
Definiamo ${f}: {\mathbb{Z}_2^m} \times {\mathbb{Z}_2^m} \rightarrow {-1,1}$ come
$$
  {f}(x, y) = (-1)^{x \cdot y}.
$$
  Sia $a,b \in {\mathbb{Z}_2^m}$ stringhe di bit fisse di lunghezza $m$.
  Definiamo inoltre $g: {\mathbb{Z}_2^m} \times {\mathbb{Z}_2^m} \rightarrow {-1,1}$ come
$$
  g(x, y) = {f}(x+a, y+b) = (-1)^{(x+a) \cdot (y+b)},
  $$
  dove $a$ e $b$ sono parametri (nascosti).
  Ci vengono date due scatole nere, una che implementa $f$ e l'altra $g$.
  Supponiamo di sapere che calcolano le funzioni definite sopra, tranne che non conosciamo
  n√© $a$ n√© $b$. Il gioco consiste nel determinare le stringhe di bit nascoste (spostamenti)
  $a$ e $b$ facendo interrogazioni a $f$ e $g$. √à chiaro che se giochiamo classicamente,
  abbiamo bisogno di $O(2m)$ interrogazioni per determinare $a$ e $b$. Ad esempio, possiamo interrogare $g$ con tutte le coppie di stringhe tali che un elemento della coppia sia tutto zero, e l'altro elemento abbia esattamente un elemento impostato a $1$.
  Ad ogni interrogazione, impariamo un elemento di $a$ o $b$.
  Tuttavia, vedremo che, se le scatole nere sono implementate come circuiti quantistici, possiamo
  determinare $a$ e $b$ con una singola interrogazione a ciascuna di $f$ e $g$.

  Nel contesto della complessit√† algoritmica, una scatola nera √® chiamata _oracolo_.
  Oltre ad essere opaca, un oracolo ha la propriet√† di consumare l'input e
  produrre l'output istantaneamente, non aggiungendo nulla al budget di complessit√† dell'algoritmo
  in cui √® incorporato. Infatti, nel caso in questione, gli oracoli che implementano $f$ e
  $g$ si riveleranno efficienti.
#### Circuiti quantistici per $f$ e $g$
Abbiamo bisogno dei seguenti ingredienti per implementare $f$ e $g$ come circuiti quantistici.

Per stati classici a singolo qubit ${|{x_1}\rangle}, {|{y_1}\rangle}$, con $x_1,y_1 \in \mathbb{Z}_2$,
il gate controlled-$Z$ ${CZ}$ pu√≤ essere scritto come
$$
{CZ} {|{x_1}\rangle}{|{y_1}\rangle}{x_1} = (-1)^{x_1 y_1} {|{x_1}\rangle}{x_1}{|{y_1}\rangle}.
$$
Opereremo con $m$ gate CZ, uno su $(x_1, y_1)$, e uno su $(x_2, y_2)$, e cos√¨ via, fino a $(x_m, y_m)$.
Chiamiamo questo operatore ${CZ}_{x,y}$.

$U_f = {CZ}_{x,y}$ √® una versione quantistica di ${f} = {f}(x,y)$:
$$
%\CZ_{x,y} {|#1\rangle}{z} =
U_f {|{x}\rangle}{|{y}\rangle} = {CZ}_{x,y} {|{x}\rangle}{|{y}\rangle} = (-1)^{x \cdot y}  {|{x}\rangle}{|{y}\rangle}.
$$

Dobbiamo anche implementare uno spostamento di stringa di bit.
Denotiamo l'operatore sul registro $x$ $X^{a_1}\cdots X^{a_m}$ con $X_a$
e allo stesso modo sul registro $y$ $X_b =  X^{b_1}\cdots X^{b_m}$.
Questi operatori applicano $X$ ovunque un singolo bit sia $1$, e l'identit√† $I$ ovunque sia $0$.
Quindi abbiamo
$$
 X_a X_b  {|{x}\rangle}{|{y}\rangle} = {|{x+a}\rangle}{|{y+b}\rangle}.
$$

La seconda scatola nera $g$ √® implementata dall'unitario $U_g$, dato da
$$
%U_g {|{x}\rangle}{|{y}\rangle} = X_aX_b \CZ_{x,y} X_aX_b {|{x}\rangle}{|{y}\rangle}.
U_g = X_aX_b {CZ}_{x,y} X_aX_b.
$$
Per vedere questo, applichiamo gli operatori da destra a sinistra allo stato ${|{x}\rangle}{|{y}\rangle}$.
Prima

$$
 X_a X_b  {|{x}\rangle}{|{y}\rangle} = {|{x+a}\rangle}{|{y+b}\rangle}.
$$

Poi,
$$
  {CZ}_{x,y}  {|{x+a}\rangle}{|{y+b}\rangle} = (-1)^{(x+a)\cdot (y+b)} {|{x+a}\rangle}{|{y+b}\rangle}.
$$

Infine,

$$
  X^a X^b (-1)^{(x+a)\cdot (y+b)} {|{x+a}\rangle}{|{y+b}\rangle} = (-1)^{(x+a)\cdot (y+b)} {|{x}\rangle}{|{y}\rangle},
$$

che √® effettivamente la versione quantistica di $f(x+a, y+b)$.
#### L'algoritmo dello spostamento nascosto
Ora mettiamo insieme i pezzi per risolvere il problema dello spostamento nascosto.
Iniziamo applicando gli Hadamard ai registri inizializzati allo stato tutto-zero.
$$
H^{\otimes 2m} = H^{\otimes m} \otimes H^{\otimes m} {{|{0}\rangle}^{\otimes m}}{{|{0}\rangle}^{\otimes m}} = \frac{1}{\sqrt{2^{2m}}} \sum_{x, y \in {\mathbb{Z}_2^m}} (-1)^{x \cdot y} {|{x}\rangle}{|{y}\rangle}.
$$

Successivamente, interroghiamo l'oracolo $g$ per arrivare a
$$
U_g H^{\otimes 2m} {{|{0}\rangle}^{\otimes m}}{{|{0}\rangle}^{\otimes m}}
= \frac{1}{\sqrt{2^{2m}}} \sum_{x, y \in {\mathbb{Z}_2^m}} (-1)^{(x+a) \cdot (y+b)} {|{x}\rangle}{|{y}\rangle}
$$
$$
\approx \frac{1}{\sqrt{2^{2m}}} \sum_{x, y \in {\mathbb{Z}_2^m}} (-1)^{x \cdot y + x \cdot b + y \cdot a} {|{x}\rangle}{|{y}\rangle}.
$$
Nell'ultima riga, abbiamo omesso il fattore di fase globale costante $(-1)^{a \cdot b}$,
e denotiamo l'uguaglianza a meno di una fase con $\approx$.
Successivamente, applicando l'oracolo $f$ si introduce un altro fattore di $(-1)^{x \cdot y}$, cancellando quello gi√†
presente. Abbiamo quindi:
$$
U_f U_g H^{\otimes 2m} {{|{0}\rangle}^{\otimes m}}{{|{0}\rangle}^{\otimes m}}
\approx \frac{1}{\sqrt{2^{2m}}} \sum_{x, y \in {\mathbb{Z}_2^m}} (-1)^{x \cdot b + y \cdot a} {|{x}\rangle}{|{y}\rangle}.
$$
Il passo finale consiste nell'applicare la trasformata di Fourier inversa, $H^{\otimes 2m} = H^{\otimes m} \otimes H^{\otimes m}$,
risultando in
$$
H^{\otimes 2m} U_f U_g  H^{\otimes 2m} {{|{0}\rangle}^{\otimes m}}{{|{0}\rangle}^{\otimes m}}
\approx {|{b}\rangle}{|{a}\rangle}.
$$
Il circuito √® terminato. In assenza di rumore, il campionamento dei registri quantistici restituir√†
le stringhe di bit $b, a$ con probabilit√† $1$.

Il prodotto interno booleano √® un esempio delle cosiddette funzioni bent.
Non definiremo qui le funzioni bent,
ma notiamo semplicemente che esse
"sono massimamente resistenti agli attacchi che cercano di sfruttare una dipendenza
delle uscite da qualche sottospazio lineare degli ingressi."
Questa citazione √® tratta dall'articolo [_Quantum algorithms for highly non-linear Boolean functions_](https://arxiv.org/abs/0811.3208), che
fornisce algoritmi di spostamento nascosto efficienti per diverse classi di funzioni bent.
L'algoritmo in questo tutorial appare nella Sezione 3.1 dell'articolo.

Nel caso pi√π generale, il circuito per trovare uno spostamento nascosto $s \in \mathbb{Z}^n$ √®
$$
 H^{\otimes n} U_{\tilde{f}}  H^{\otimes n} U_g  H^{\otimes n} {|{0}\rangle}^{\otimes n} = {|{s}\rangle}.
$$
 Nel caso generale, $f$ e $g$ sono funzioni di una singola variabile.
 Il nostro esempio del prodotto interno ha questa forma se facciamo $f(x, y) \to f(z)$,
 con $z$ uguale alla concatenazione di $x$ e $y$, e $s$ uguale alla concatenazione
 di $a$ e $b$.
 Il caso generale richiede esattamente due oracoli: un oracolo per $g$ e uno per $\tilde{f}$,
 dove quest'ultimo √® una funzione nota come _duale_ della funzione bent $f$.
 La funzione prodotto interno ha la propriet√† di auto-dualit√† $\tilde{f}=f$.

 Nel nostro circuito per lo spostamento nascosto sul prodotto interno abbiamo omesso lo strato intermedio
 di Hadamard che appare nel circuito per il caso generale. Mentre nel caso generale
 questo strato √® necessario, abbiamo risparmiato un po' di profondit√† omettendolo, al costo di un po'
 di post-elaborazione perch√© l'output √® ${|{b}\rangle}{|{a}\rangle}$ invece del desiderato ${|{a}\rangle}{|{b}\rangle}$.
## Requisiti
Prima di iniziare questo tutorial, assicuratevi di avere installato quanto segue:

- Qiskit SDK v2.1 o successivo, con supporto per la [visualizzazione](https://docs.quantum.ibm.com/api/qiskit/visualization)
- Qiskit Runtime v0.41 o successivo (`pip install qiskit-ibm-runtime`)
- Addon Qiskit M3 v3.0 (`pip install mthree`)
## Configurazione

In [None]:
from collections.abc import Iterator, Sequence
from random import Random
from qiskit.circuit import (
    CircuitInstruction,
    QuantumCircuit,
    QuantumRegister,
    Qubit,
)
from qiskit.circuit.library import CZGate, HGate, XGate
from qiskit.transpiler.preset_passmanagers import generate_preset_pass_manager
from qiskit_ibm_runtime import QiskitRuntimeService
import timeit
import matplotlib.pyplot as plt
from qiskit_ibm_runtime import SamplerV2 as Sampler
import mthree

## Step 1: Mappare gli input classici a un problema quantistico
Per prima cosa, scriviamo le funzioni per implementare il problema dello spostamento nascosto come un `QuantumCircuit`.

In [None]:
def apply_hadamards(qubits: Sequence[Qubit]) -> Iterator[CircuitInstruction]:
    """Apply a Hadamard gate to every qubit."""
    for q in qubits:
        yield CircuitInstruction(HGate(), [q], [])


def apply_shift(
    qubits: Sequence[Qubit], shift: int
) -> Iterator[CircuitInstruction]:
    """Apply X gates where the bits of the shift are equal to 1."""
    for i, q in zip(range(shift.bit_length()), qubits):
        if shift >> i & 1:
            yield CircuitInstruction(XGate(), [q], [])


def oracle_f(qubits: Sequence[Qubit]) -> Iterator[CircuitInstruction]:
    """Apply the f oracle."""
    for i in range(0, len(qubits) - 1, 2):
        yield CircuitInstruction(CZGate(), [qubits[i], qubits[i + 1]])


def oracle_g(
    qubits: Sequence[Qubit], shift: int
) -> Iterator[CircuitInstruction]:
    """Apply the g oracle."""
    yield from apply_shift(qubits, shift)
    yield from oracle_f(qubits)
    yield from apply_shift(qubits, shift)


def determine_hidden_shift(
    qubits: Sequence[Qubit], shift: int
) -> Iterator[CircuitInstruction]:
    """Determine the hidden shift."""
    yield from apply_hadamards(qubits)
    yield from oracle_g(qubits, shift)
    # We omit this layer in exchange for post processing
    # yield from apply_hadamards(qubits)
    yield from oracle_f(qubits)
    yield from apply_hadamards(qubits)


def run_hidden_shift_circuit(n_qubits, rng):
    hidden_shift = rng.getrandbits(n_qubits)

    qubits = QuantumRegister(n_qubits, name="q")
    circuit = QuantumCircuit.from_instructions(
        determine_hidden_shift(qubits, hidden_shift), qubits=qubits
    )
    circuit.measure_all()
    # Format the hidden shift as a string.
    hidden_shift_string = format(hidden_shift, f"0{n_qubits}b")
    return (circuit, hidden_shift, hidden_shift_string)


def display_circuit(circuit):
    return circuit.remove_final_measurements(inplace=False).draw(
        "mpl", idle_wires=False, scale=0.5, fold=-1
    )

Inizieremo con un piccolo esempio:

In [2]:
n_qubits = 6
random_seed = 12345
rng = Random(random_seed)
circuit, hidden_shift, hidden_shift_string = run_hidden_shift_circuit(
    n_qubits, rng
)

print(f"Hidden shift string {hidden_shift_string}")

display_circuit(circuit)

Hidden shift string 011010


<Image src="../docs/images/tutorials/readout-error-mitigation-sampler/extracted-outputs/8297843e-00c3-4bb5-9d33-a7e558d1698c-1.avif" alt="Output of the previous code cell" />

## Step 2: Optimize circuits for quantum hardware execution

In [3]:
job_tags = [
    f"shift {hidden_shift_string}",
    f"n_qubits {n_qubits}",
    f"seed = {random_seed}",
]
job_tags

['shift 011010', 'n_qubits 6', 'seed = 12345']

In [None]:
# Uncomment this to run the circuits on a quantum computer on IBMCloud.
service = QiskitRuntimeService()
backend = service.least_busy(
    operational=True, simulator=False, min_num_qubits=100
)

# from qiskit_ibm_runtime.fake_provider import FakeMelbourneV2
# backend = FakeMelbourneV2()
# backend.refresh(service)

print(f"Using backend {backend.name}")


def get_isa_circuit(circuit, backend):
    pass_manager = generate_preset_pass_manager(
        optimization_level=3, backend=backend, seed_transpiler=1234
    )
    isa_circuit = pass_manager.run(circuit)
    return isa_circuit


isa_circuit = get_isa_circuit(circuit, backend)
display_circuit(isa_circuit)

Using backend ibm_kingston


<Image src="../docs/images/tutorials/readout-error-mitigation-sampler/extracted-outputs/f2b77d93-c34a-43a4-b436-e7a25024a94a-1.avif" alt="Output of the previous code cell" />

## Step 3: Execute circuits using Qiskit primitives

In [None]:
# submit job for solving the hidden shift problem using the Sampler primitive
NUM_SHOTS = 50_000


def run_sampler(backend, isa_circuit, num_shots):
    sampler = Sampler(mode=backend)
    sampler.options.environment.job_tags
    pubs = [(isa_circuit, None, NUM_SHOTS)]
    job = sampler.run(pubs)
    return job


def setup_mthree_mitigation(isa_circuit, backend):
    # retrieve the final qubit mapping so mthree knows which qubits to calibrate
    qubit_mapping = mthree.utils.final_measurement_mapping(isa_circuit)

    # submit jobs for readout error calibration
    mit = mthree.M3Mitigation(backend)
    mit.cals_from_system(qubit_mapping, rep_delay=None)

    return mit, qubit_mapping

In [6]:
job = run_sampler(backend, isa_circuit, NUM_SHOTS)
mit, qubit_mapping = setup_mthree_mitigation(isa_circuit, backend)

## Step 4: Post-process and return results in classical format

In the theoretical discussion above, we determined that for input $ab$, we expect output $ba$.
An additional complication is that, in order to have a simpler (pre-transpiled) circuit, we inserted the required CZ gates between
neighboring pairs of qubits. This amounts to interleaving the bitstrings $a$ and $b$ as $a1 b1 a2 b2 \ldots$.
The output string $ba$ will be interleaved in a similar way: $b1 a1 b2 a2 \ldots$. The function `unscramble` below
transforms the output string from $b1 a1 b2 a2 \ldots$ to $a1 b1 a2 b2 \ldots$ so that the input and output strings can be compared directly.

In [7]:
# retrieve bitstring counts
def get_bitstring_counts(job):
    result = job.result()
    pub_result = result[0]
    counts = pub_result.data.meas.get_counts()
    return counts, pub_result

In [8]:
counts, pub_result = get_bitstring_counts(job)

The Hamming distance between two bitstrings is the number of indices at which the bits differ.

In [9]:
def hamming_distance(s1, s2):
    weight = 0
    for c1, c2 in zip(s1, s2):
        (c1, c2) = (int(c1), int(c2))
        if (c1 == 1 and c2 == 1) or (c1 == 0 and c2 == 0):
            weight += 1

    return weight

In [10]:
# Replace string of form a1b1a2b2... with b1a1b2a1...
# That is, reverse order of successive pairs of bits.
def unscramble(bitstring):
    ps = [bitstring[i : i + 2][::-1] for i in range(0, len(bitstring), 2)]
    return "".join(ps)


def find_hidden_shift_bitstring(counts, hidden_shift_string):
    # convert counts to probabilities
    probs = {
        unscramble(bitstring): count / NUM_SHOTS
        for bitstring, count in counts.items()
    }

    # Retrieve the most probable bitstring.
    most_probable = max(probs, key=lambda x: probs[x])

    print(f"Expected hidden shift string: {hidden_shift_string}")
    if most_probable == hidden_shift_string:
        print("Most probable bitstring matches hidden shift üòä.")
    else:
        print("Most probable bitstring didn't match hidden shift ‚òπÔ∏è.")
    print("Top 10 bitstrings and their probabilities:")
    display(
        {
            k: (v, hamming_distance(hidden_shift_string, k))
            for k, v in sorted(
                probs.items(), key=lambda x: x[1], reverse=True
            )[:10]
        }
    )

    return probs, most_probable

In [11]:
probs, most_probable = find_hidden_shift_bitstring(
    counts, hidden_shift_string
)

Expected hidden shift string: 011010
Most probable bitstring matches hidden shift üòä.
Top 10 bitstrings and their probabilities:


{'011010': (0.9743, 6),
 '001010': (0.00812, 5),
 '010010': (0.0063, 5),
 '011000': (0.00554, 5),
 '011011': (0.00492, 5),
 '011110': (0.00044, 5),
 '001000': (0.00012, 4),
 '010000': (8e-05, 4),
 '001011': (6e-05, 4),
 '000010': (6e-05, 4)}

La distanza di Hamming tra due stringhe di bit √® il numero di indici in cui i bit differiscono.

In [12]:
max_probability_before_M3 = probs[most_probable]
max_probability_before_M3

0.9743

Now we apply the readout correction learned by M3 to the counts.
The function `apply_corrections` returns a quasi-probability distribution. This is a list of `float` objects that sum to $1$. But some values might be negative.

In [13]:
def perform_mitigation(mit, counts, qubit_mapping):
    # mitigate readout error
    quasis = mit.apply_correction(counts, qubit_mapping)

    # print results
    most_probable_after_m3 = unscramble(max(quasis, key=lambda x: quasis[x]))

    is_hidden_shift_identified = most_probable_after_m3 == hidden_shift_string
    if is_hidden_shift_identified:
        print("Most probable bitstring matches hidden shift üòä.")
    else:
        print("Most probable bitstring didn't match hidden shift ‚òπÔ∏è.")
    print("Top 10 bitstrings and their quasi-probabilities:")
    topten = {
        unscramble(k): f"{v:.2e}"
        for k, v in sorted(quasis.items(), key=lambda x: x[1], reverse=True)[
            :10
        ]
    }
    max_probability_after_M3 = float(topten[most_probable_after_m3])
    display(topten)

    return max_probability_after_M3, is_hidden_shift_identified

In [14]:
print(f"Expected hidden shift string: {hidden_shift_string}")
max_probability_after_M3, is_hidden_shift_identified = perform_mitigation(
    mit, counts, qubit_mapping
)

Expected hidden shift string: 011010
Most probable bitstring matches hidden shift üòä.
Top 10 bitstrings and their quasi-probabilities:


{'011010': '1.01e+00',
 '001010': '8.75e-04',
 '001000': '7.38e-05',
 '010000': '4.51e-05',
 '111000': '2.18e-05',
 '001011': '1.74e-05',
 '000010': '6.42e-06',
 '011001': '-7.18e-06',
 '011000': '-4.53e-04',
 '010010': '-1.28e-03'}

#### Compare identifying the hidden shift string before and after applying M3 correction

In [15]:
def compare_before_and_after_M3(
    max_probability_before_M3,
    max_probability_after_M3,
    is_hidden_shift_identified,
):
    is_probability_improved = (
        max_probability_after_M3 > max_probability_before_M3
    )
    print(f"Most probable probability before M3: {max_probability_before_M3}")
    print(f"Most probable probability after M3: {max_probability_after_M3}")
    if is_hidden_shift_identified and is_probability_improved:
        print("Readout error mitigation effective! üòä")
    else:
        print("Readout error mitigation not effective. ‚òπÔ∏è")

In [16]:
compare_before_and_after_M3(
    max_probability_before_M3,
    max_probability_after_M3,
    is_hidden_shift_identified,
)

Most probable probability before M3: 0.9743
Most probable probability after M3: 1.01
Readout error mitigation effective! üòä


Registriamo la probabilit√† della stringa di bit pi√π probabile prima di applicare la mitigazione dell'errore di lettura con M3.

In [None]:
# Collect samples for numbers of shots varying from 5000 to 25000.
shots_range = range(5000, NUM_SHOTS + 1, 2500)
times = []
for shots in shots_range:
    print(f"Applying M3 correction to {shots} shots...")
    t0 = timeit.default_timer()
    _ = mit.apply_correction(
        pub_result.data.meas.slice_shots(range(shots)).get_counts(),
        qubit_mapping,
    )
    t1 = timeit.default_timer()
    print(f"\tDone in {t1 - t0} seconds.")
    times.append(t1 - t0)

fig, ax = plt.subplots()
ax.plot(shots_range, times, "o--")
ax.set_xlabel("Shots")
ax.set_ylabel("Time (s)")
ax.set_title("Time to apply M3 correction")

Applying M3 correction to 5000 shots...
	Done in 0.003321983851492405 seconds.
Applying M3 correction to 7500 shots...
	Done in 0.004425413906574249 seconds.
Applying M3 correction to 10000 shots...
	Done in 0.006366567220538855 seconds.
Applying M3 correction to 12500 shots...
	Done in 0.0071477219462394714 seconds.
Applying M3 correction to 15000 shots...
	Done in 0.00860048783943057 seconds.
Applying M3 correction to 17500 shots...
	Done in 0.010026784148067236 seconds.
Applying M3 correction to 20000 shots...
	Done in 0.011459112167358398 seconds.
Applying M3 correction to 22500 shots...
	Done in 0.012727141845971346 seconds.
Applying M3 correction to 25000 shots...
	Done in 0.01406092382967472 seconds.
Applying M3 correction to 27500 shots...
	Done in 0.01546052098274231 seconds.
Applying M3 correction to 30000 shots...
	Done in 0.016769016161561012 seconds.
Applying M3 correction to 32500 shots...
	Done in 0.019537431187927723 seconds.
Applying M3 correction to 35000 shots...
	Do

Text(0.5, 1.0, 'Time to apply M3 correction')

<Image src="../docs/images/tutorials/readout-error-mitigation-sampler/extracted-outputs/33addc38-f738-48ed-a29d-9790f446c036-2.avif" alt="Output of the previous code cell" />

#### Interpreting the plot

The plot above shows that the time required to apply M3 correction scales linearly in the number of shots.

## Scaling up

In [18]:
n_qubits = 80
rng = Random(12345)
circuit, hidden_shift, hidden_shift_string = run_hidden_shift_circuit(
    n_qubits, rng
)

print(f"Hidden shift string {hidden_shift_string}")

Hidden shift string 00000010100110101011101110010001010000110011101001101010101001111001100110000111


In [19]:
isa_circuit = get_isa_circuit(circuit, backend)

In [20]:
job = run_sampler(backend, isa_circuit, NUM_SHOTS)
mit, qubit_mapping = setup_mthree_mitigation(isa_circuit, backend)

In [21]:
counts, pub_result = get_bitstring_counts(job)

In [22]:
probs, most_probable = find_hidden_shift_bitstring(
    counts, hidden_shift_string
)

Expected hidden shift string: 00000010100110101011101110010001010000110011101001101010101001111001100110000111
Most probable bitstring matches hidden shift üòä.
Top 10 bitstrings and their probabilities:


{'00000010100110101011101110010001010000110011101001101010101001111001100110000111': (0.50402,
  80),
 '00000010100110101011101110010001010000110011100001101010101001111001100110000111': (0.0396,
  79),
 '00000010100110101011101110010001010000110011101001101010101001111001100100000111': (0.0323,
  79),
 '00000010100110101011101110010001010000110011101001101010101001101001100110000111': (0.01936,
  79),
 '00000010100110101011101110010011010000110011101001101010101001111001100110000111': (0.01432,
  79),
 '00000010100110101011101110010001010000110011101001101010101001011001100110000111': (0.0101,
  79),
 '00000010100110101011101110010001010000110011101001101010101001110001100110000111': (0.00924,
  79),
 '00000010100110101011101110010001010000010011101001101010101001111001100110000111': (0.00908,
  79),
 '00000010100110101011100110010001010000110011101001101010101001111001100110000111': (0.00888,
  79),
 '00000010100110101011101110010001010000110011101001100010101001111001100110000111': 

#### Confrontare l'identificazione della stringa di spostamento nascosto prima e dopo l'applicazione della correzione M3

In [23]:
max_probability_before_M3 = probs[most_probable]
max_probability_before_M3

0.50402

In [24]:
print(f"Expected hidden shift string: {hidden_shift_string}")
max_probability_after_M3, is_hidden_shift_identified = perform_mitigation(
    mit, counts, qubit_mapping
)

Expected hidden shift string: 00000010100110101011101110010001010000110011101001101010101001111001100110000111
Most probable bitstring matches hidden shift üòä.
Top 10 bitstrings and their quasi-probabilities:


{'00000010100110101011101110010001010000110011101001101010101001111001100110000111': '9.85e-01',
 '00000010100110101011101110010001010000110011100001101010101001111001100110000111': '6.84e-03',
 '00000010100110101011100110010001010000110011101001101010101001111001100110000111': '3.87e-03',
 '00000010100110101011101110010011010000110011101001101010101001111001100110000111': '3.42e-03',
 '00000010100110101011101110010001010000110011101001101010101001111001100100000111': '3.30e-03',
 '00000010100110101011101110010001010000110011101001101010101001110001100110000111': '3.28e-03',
 '00000010100010101011101110010001010000110011101001101010101001111001100110000111': '2.62e-03',
 '00000010100110101011101110010001010000110011101001101010101001101001100110000111': '2.43e-03',
 '00000010100110101011101110010000010000110011101001101010101001111001100110000111': '1.73e-03',
 '00000010100110101011101110010001010000110011101001101010101001111001000110000111': '1.63e-03'}

In [24]:
compare_before_and_after_M3(
    max_probability_before_M3,
    max_probability_after_M3,
    is_hidden_shift_identified,
)

Most probable probability before M3: 0.54348
Most probable probability after M3: 0.99
Readout error mitigation effective! üòä


### Tracciare come il tempo di CPU richiesto da M3 scala con gli shot