# **Quantum Longest Common Substring**

Con il seguente elaborato, si affronta una soluzione ibrida classico-quantistica per la risoluzione del problema **Longest Common Substring**.

## **Problema *Longest Common Substring***

Il problema Longest Common Substring è un **problema di ottimizzazione** definito nel seguente modo:

> Date due stringhe $X = \{x_1, x_2, \dots, x_n\}$ e $Y = \{y_1, y_2, \dots, y_m\}$, trovare $S = \{s_1, s_2, \dots, s_k\}$ tale che $S$ sia sottostringa sia di $X$ che di $Y$, e massimizzando la lunghezza $k$. 

È un problema tipico del text processing, cui soluzioni trovano applicazioni nell'ambito della deduplicazione dei dati, negli algoritmi anti-plagio e nella bioinformatica (assieme al Longest Common Subsequence).

## **Quantum-LCS Algorithm**

L'algoritmo che si propone, è una soluzione ibrida classico-quantistica, che si compone di un algoritmo iterativo classico, e uno step di verifica quantistico.

```
QUANTUM-LCS(x,y,n):                    
    l = 0;                             
    r = n;                             
    while l < r do                     
        d = floor((l+r)/2)             
        if QUANTUM-TEST(x, y, d) then  
            l = d                      
        else                           
            r = d - 1                  
                                       
    return l                           
```

## **Algoritmo classico**

Tratteremo temporaneamente $\text{QUANTUM-TEST}(X, Y, d)$ come una black-box, ignorandone il funzionamento, ma solo il comportamento. Questa funzione ritorna `True` se e solo se 
$$\exists S \text{ sottostringa di } X \text{ e } Y \text{ di dimensione } d$$


Noto questo, l'algoritmo $\text{QUANTUM-LCS}(X,Y,n)$ si basa su una ricerca binaria del valore di $k$, verificando ad ogni step usando $\text{QUANTUM-TEST}(X,Y,d)$ come verifica. In altre parole:


> 1. Pongo $l = 0$ ed $r = n$. Questi coincidono col più ampio range di valori che la dimensione della LCS può assumere, ossia $0 \leq |S| \leq n$.
> 2. Stimo che la LCS tra $X$ e $Y$ sia di dimensione $d = \lfloor (l + r)/2\rfloor$.
> 3. Se esiste una sottostringa comune a $X$ e a $Y$ di dimensione $d$, pongo $l = d$, altrimenti pongo $r = d - 1$.
> 4. Se $l = r$, $l$ è la lunghezza della LCS ad $X$ e $Y$, altrimenti torno allo step $2$. 

Noto questo, è banale dire che la complessità della funzione, sarà:

$$
\mathcal{O}(\log n) \cdot (\text{Complessità di QUANTUM-TEST})
$$

## **Test quantistico**

Affrontiamo adesso l'analisi della componente quantistica dell'algoritmo. Abbiamo già detto che vogliamo che $\text{QUANTUM-TEST}(X,Y,d)$ torni `True` se e solo se esiste una sottostringa di dimensione $d$ condivisa tra $X$ e $Y$.

### **Prerequisiti di computazione quantistica**

Riassumiamo i prerequisiti di computazione quantistica (non triviali) richiesti per la comprensione della funzione $\text{QUANTUM-TEST}(X,Y,d)$.

- [Oracoli booleani](../q-miscellaneous/q-oracles/boolean-oracles.ipynb) - gate che implementano funzioni del tipo $f: \{0,1\}^n \to \{0,1\}$;
- [Phase kickback](../q-miscellaneous/q-oracles/phase-kickback.ipynb) - conseguenza dell'applicazione di operazioni controllate su qubit in sovrapposizione;
- [Oracoli di fase](../q-miscellaneous/q-oracles/phase-oracles.ipynb) - i quali uniscono le intuizioni degli oracoli booleani col phase kickback;
- [Algoritmo di Grover](../Grover-algorithm/grover.ipynb) - per amplificare la probabilità di ottenere stati che soddisfano le condizioni di un oracolo di fase.

### **Idea dietro il test quantistico**

Come tutti i problemi risolti tramite l'algoritmo di Grover, vogliamo costruire degli oracoli di fase $P_f$ per invertire la fase delle soluzioni che cerchiamo. Lo step di diffusione, farà invece da ponte tra la verifica di una soluzione e la sua costruzione effettiva.
