# Progetto: Un algoritmo di correzione per un motore di ricerca

## Problema

Il problema principale di Searchify è che molti utenti commettono errori di digitazione durante l'inserimento delle parole chiave. Questi errori causano risultati di ricerca nulli o non pertinenti, portando a insoddisfazione tra gli utenti. Ad esempio, se un utente cerca "raporto vendite 2023" invece di "rapporto vendite 2023", il motore di ricerca non restituisce alcun risultato.

## Obiettivo del progetto:

L'obiettivo è sviluppare un algoritmo di correzione automatica per il motore di ricerca di Searchify. Questo algoritmo dovrà:

1. Rilevare automaticamente gli errori di digitazione o le parole non valide.
2. Suggerire la parola corretta più probabile.
3. Restituire risultati pertinenti basati sulla correzione suggerita.

L'implementazione di questa funzionalità migliorerà notevolmente l'esperienza utente, aumentando l'efficienza del motore di ricerca e la soddisfazione dei clienti.

## Benefici del progetto:


- **Miglioramento dell'accuratezza:** Riduzione degli errori di ricerca dovuti a digitazioni errate.
- **Incremento della produttività:** Gli utenti troveranno le informazioni più velocemente.
- **Aumento della fedeltà dei clienti:** Un'esperienza utente più fluida e soddisfacente porterà a una maggiore adozione del prodotto.

---

## Codice:

In [None]:
def _Levenshtein_distance(word1,word2): # Funzione per la distanza di Levenshtein

    m = len(word1)
    n = len(word2)

    matrix = [[0 for _ in range(n+1)] for _ in range(m+1)] # Creo la matrice con tutti i valori a 0

    # inizializando la prima riga e colonna
    for i in range(1, m+1):
        matrix[i][0] = i
    for j in range(1, n+1):
        matrix[0][j] = j

    # riempimento della matrice
    for i in range(1, m+1):
        for j in range(1, n+1):
            if (word1[i-1] == word2[j-1]): # nessun costo se i caratteri sono uguali
                matrix[i][j] = matrix[i-1][j-1]
            else: # calcolo del costo minimo
                matrix[i][j] = min(
                    matrix[i-1][j], # Rimozione
                    matrix[i][j-1], # Inserimento
                    matrix[i-1][j-1] # Sostituzione
                ) + 1

    return matrix[m][n]


def suggest_correction(query, dictionary): # Funzione che suggerisce la parola migliore o la stessa

    if query in dictionary:
        return query

    min_distance= float('inf') # inizialmente la distanza minima è infinita
    best_correction = None # non esiste ancora una miglior parola

    for word in dictionary: # itera su tutte la parole della lista
        distance = _Levenshtein_distance(query, word) # calcola la distanza
        if distance < min_distance: # Se questa distanza è minore della minima trovata finora:
            min_distance = distance # Aggiorna la distanza minima
            best_correction = word # Aggiorna la parola migliore

    return "La parola da te inserita non esiste la più simile a: '%s' è '%s' con una distanza di: %s." % (query, best_correction, min_distance) # Restituisci la parola migliore e la distanza

In [None]:
if __name__ == "__main__":

    dictionary = {
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    }

    query = input("Inserisci la parola: ")

    result = suggest_correction(query, dictionary)
    print(result)

Inserisci la parola: valoree
La parola da te inserita non esiste la più simile a: 'valoree' è 'valore' con una distanza di: 1.


----

## Spiegazione del codice:

### Il primo blocco di codice: <br>

![codice](https://lh3.googleusercontent.com/pw/AP1GczPIFVRZAjRu9A3QhHg1KeV1kag_tulEozhPSWRbBqSYWlwHTbCxBCrRKf_gVKIzKIQOtbw2LUXfkrv3uFZyshNOi0FlzrY6aYSVV3OBxgkofOlsGuAVllAKuT0YoemJFtmo7Z9jhRww9HxhZ8z0r94=w752-h764-s-no-gm?authuser=0) <br>

**Ci sono 2 funzioni principali:** <br>

- **La prima (`_Levenshtein_distance`) calcola la distanza di Levenshtein:** <br>
  La distanza di Levenshtein rappresenta il numero minimo di operazioni necessarie per trasformare una parola in un'altra. <br>  
  Date due parole:  
  - Si calcolano le loro lunghezze.  
  - Si costruisce una matrice $m \times n$, dove $m$ è la lunghezza della prima parola e $n$ quella della seconda. <br>
  La prima riga e la prima colonna della matrice vengono numerate da 0 alla lunghezza della rispettiva parola. Questo permette di calcolare il costo di ogni operazione. <br>  

  Le operazioni possibili sono: <br>
  - **Sostituzione**: cambiare una lettera con un'altra.  
  - **Inserimento**: aggiungere una lettera.  
  - **Rimozione**: eliminare una lettera.  

  Ogni operazione ha un costo. Quando due lettere non coincidono, si aggiunge un `+1`. Se invece le lettere coincidono, si riporta il valore della diagonale precedente senza aggiungere costi. <br>
  Una volta completata la matrice, il valore nell'ultima cella indica il numero totale di operazioni necessarie per trasformare la prima stringa nella seconda. <br>  

  *Ecco un'immagine riassuntiva del processo:* <br>  
  ![operazioni](https://miro.medium.com/v2/resize:fit:1400/1*AYkR7hgpBztvNnwVB1S56Q.png) <br><br>

- **La seconda (`suggest_correction`) suggerisce la parola più corretta o conferma quella inserita:** <br>
  Questa funzione utilizza la parola fornita dall'utente e la confronta con un dizionario (una lista di parole). <br>
  - Se la parola è già presente nel dizionario, viene restituita direttamente.  
  - Se la parola non è presente (ad esempio, per un errore di battitura, una lettera mancante o un carattere extra), viene trovata la parola più simile. <br>  

  Questo confronto viene effettuato utilizzando la funzione `_Levenshtein_distance`. Per ogni parola nel dizionario: <br>
  - Si calcola la distanza di Levenshtein rispetto alla parola inserita.  
  - La parola con la distanza minore viene considerata la correzione migliore.  

  Alla fine, la funzione restituisce questa parola come risultato.


---

### Il secondo blocco di codice:
<br> ![codice2](https://lh3.googleusercontent.com/pw/AP1GczMOO6GPeMzNXdY7UrePr09UaqOpse8OGM5kjujVlZFDnVLO8J56KU2nSuE21lRNKlVXzetLdQr0pq3HX5-3YDmrn7kvxZtnLdFiMbDx2AJLychQ8VHUB2pr7ABNx4yylJMOazyxXUE1zeQc2JjXOaY=w837-h436-s-no-gm?authuser=0)
<br> <br>
Questo è il corpo principale dell'algoritmo, dove vengono utilizzate le due funzioni precedentemente descritte. <br>  
La prima operazione consiste nella creazione del dizionario, ovvero una lista di parole. <br>  
Successivamente, viene richiesto all'utente di inserire una parola che desidera cercare. <br>  

Utilizzando la funzione `suggest_correction(query, dictionary)`, si ottiene che: <br>  
- Il primo argomento, `query`, rappresenta la parola inserita dall'utente. <br>  
- Il secondo argomento, `dictionary`, è il dizionario creato precedentemente. <br>  

La funzione confronta la parola inserita con il dizionario per trovare la parola più corretta rispetto a quella fornita dall'utente. <br>  
Se la parola inserita è già presente nel dizionario, viene restituita direttamente. <br>  
In caso contrario, il programma calcola la parola più simile utilizzando l'algoritmo di Levenshtein (implementato nella funzione `_Levenshtein_distance`). <br>  

Il risultato è quindi la parola corretta o suggerita, ottenuta come output della funzione. <br>


---

## Test Funzionamento:

### 1.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: efficienza
efficienza


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola corretta già presente nel dizionario.   
L'output restituito dal programma è la stessa parola, confermando che non sono necessarie correzioni.


---

### 2.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: aoluzione
La parola da te inserita non esiste la più simile a: 'aoluzione' è 'soluzione' con una distanza di: 1.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: la lettera 'a' è stata usata al posto della lettera 's'.   
L'output del programma suggerisce la parola corretta **"soluzione"**, come la più simile a quella inserita.


---

### 3.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: risultat
La parola da te inserita non esiste la più simile a: 'risultat' è 'risultato' con una distanza di: 1.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: manca la lettera 'o'.   
L'output del programma suggerisce la parola corretta **"risultato"**, come la più simile a quella inserita.

---

### 4.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: progettto
La parola da te inserita non esiste la più simile a: 'progettto' è 'progetto' con una distanza di: 1.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: c'è una 't' in più.   
L'output del programma suggerisce la parola corretta **"progetto"**, come la più simile a quella inserita.

---

### 5.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: tecnologia
tecnologia


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola corretta già presente nel dizionario.   
L'output restituito dal programma è la stessa parola, confermando che non sono necessarie correzioni.

---

### 6.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: miiting
La parola da te inserita non esiste la più simile a: 'miiting' è 'meeting' con una distanza di: 2.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: due lettere 'i' sono state usate al posto di due lettere 'e'.   
L'output del programma suggerisce la parola corretta **"meeting"**, come la più simile a quella inserita.

---

### 7.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: obietivo
La parola da te inserita non esiste la più simile a: 'obietivo' è 'obiettivo' con una distanza di: 1.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: manca un'altra lettera 't'.   
L'output del programma suggerisce la parola corretta **"obiettivo"**, come la più simile a quella inserita.

---

### 8.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: aziendaa
La parola da te inserita non esiste la più simile a: 'aziendaa' è 'azienda' con una distanza di: 1.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: c'è una 'a' in più.   
L'output del programma suggerisce la parola corretta **"azienda"**, come la più simile a quella inserita.

---

### 9.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: opportunita
La parola da te inserita non esiste la più simile a: 'opportunita' è 'opportunità' con una distanza di: 1.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: è stata inserita la 'a' al posto della 'à'.   
L'output del programma suggerisce la parola corretta **"opportunità"**, come la più simile a quella inserita.

---

### 10.

In [None]:
dictionary = [
    "strategia", "progetto", "marketing", "vendite", "risorse", "budget", "cliente", "profitto", "team", "obiettivo",
    "qualità", "innovazione", "processo", "report", "analisi", "fornitore", "logistica", "fattura", "contratto", "scadenza",
    "collega", "meeting", "agenda", "risultato", "bilancio", "comunicazione", "investimento", "crescita", "network", "partner",
    "sviluppo", "produttività", "efficienza", "soluzione", "formazione", "risultati", "azienda", "servizio", "organizzazione",
    "leadership", "valore", "mercato", "innovazione", "relazione", "opportunità", "strategico", "competenza", "tecnologia", "risultato"
    ]

query = input("Inserisci la parola: ")
result = suggest_correction(query, dictionary)
print(result)

Inserisci la parola: proprietà
La parola da te inserita non esiste la più simile a: 'proprietà' è 'profitto' con una distanza di: 4.


**Esempio di utilizzo:** <br>  
In questo caso, è stata inserita una parola errata: la parola è completamente sbagliata.   
L'output del programma suggerisce la parola corretta **"profitto"**, come la più simile a quella inserita.

---