<a href="https://colab.research.google.com/github/SGulmini/sgulmini-ai-development-portfolio/blob/main/Progetto.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Algoritmo di Correzione per Searchify - Motore di Ricerca Intelligente

import string

def levenshtein_distance(s1, s2):
    """
    Calcola la distanza di Levenshtein tra due stringhe.
    La distanza di Levenshtein è il numero minimo di operazioni (inserimento,
    cancellazione o sostituzione) necessarie per trasformare la stringa s1 in s2.
    
    Parametri:
        s1 (str): La prima stringa.
        s2 (str): La seconda stringa da confrontare con la prima.
    
    Ritorna:
        int: La distanza di Levenshtein tra s1 e s2.
    """
    len_s1, len_s2 = len(s1), len(s2)
    # Creazione di una matrice per calcolare la distanza
    matrix = [[0] * (len_s2 + 1) for _ in range(len_s1 + 1)]

    # Riempimento della matrice
    for i in range(len_s1 + 1):
        for j in range(len_s2 + 1):
            if i == 0:
                matrix[i][j] = j  # Prima riga: inserimenti
            elif j == 0:
                matrix[i][j] = i  # Prima colonna: cancellazioni
            else:
                cost = 0 if s1[i - 1].lower() == s2[j - 1].lower() else 1  # Confronto case-insensitive
                matrix[i][j] = min(
                    matrix[i - 1][j] + 1,    # Cancellazione
                    matrix[i][j - 1] + 1,    # Inserimento
                    matrix[i - 1][j - 1] + cost  # Sostituzione
                )
    return matrix[len_s1][len_s2]

def suggest_correction(query, dictionary):
    """
    Corregge le parole errate in una query utilizzando la distanza di Levenshtein.
    Per ogni parola che non è nel dizionario, cerca la parola più simile e la sostituisce.

    Parametri:
        query (str): La stringa della query inserita dall'utente.
        dictionary (set): Un insieme di parole corrette che il programma può utilizzare per la correzione.
    
    Ritorna:
        str: La query corretta con le parole errate sostituite.
    """
    # Rimuove la punteggiatura dalla query
    translator = str.maketrans('', '', string.punctuation)
    cleaned_query = query.translate(translator)  # Rimuove la punteggiatura
    words = cleaned_query.split()  # Dividi la query in singole parole
    corrected_words = []  # Lista per contenere le parole corrette

    # Correggi ogni parola della query
    for word in words:
        word_lower = word.lower()  # Confronta le parole in modo case-insensitive
        if word_lower in dictionary or word.isdigit():
            # Se la parola è già nel dizionario o è un numero, aggiungila senza modificarla
            corrected_words.append(word)
        else:
            # Trova la parola nel dizionario con la distanza di Levenshtein più bassa
            closest_match = min(dictionary, key=lambda w: levenshtein_distance(word_lower, w))
            corrected_words.append(closest_match)  # Aggiungi la parola corretta

    # Ricostruisci la query corretta
    return " ".join(corrected_words)

# Dizionario di parole comuni in ambito aziendale
# (Riferimenti temporali come Q2, anni o numeri non sono inclusi per evitare confusioni)
dictionary = {
    "rapporto", "vendite", "fatturato", "azienda", "cliente", "prodotto", "dipendenti",
    "marketing", "finanza", "documento", "analisi", "bilancio", "strategia", "obiettivo",
    "ricavi", "profitto", "risultati", "trend", "mercato", "gestione", "operazioni",
    "investimenti", "crescita", "performance", "sviluppo", "tecnologia", "digitalizzazione",
    "innovazione", "risorse", "competizione", "benchmarking", "previsione", "statistiche",
    "produttività", "efficienza", "processi", "automazione", "implementazione",
    "ottimizzazione", "qualità", "customer", "experience", "segmentazione", "target",
    "conversione", "retail", "ecommerce", "reporting", "dashboard", "query", "annuo",
    "digitali", "strategie", "finanziaria", "incrementali", "trimestre"
}

def user_input_loop():
    """
    Funzione principale che gestisce l'interazione con l'utente.
    Permette di inserire una query, correggerla se necessario e stampare il risultato.
    L'utente può terminare il programma digitando 'esci'.
    """
    print("\nInserisci una query da correggere (scrivi 'esci' per terminare):")
    while True:
        user_query = input(" > ")  # Chiede all'utente di inserire una query
        if user_query.lower() == 'esci':
            print("Programma terminato.")  # Termina il programma se l'utente scrive 'esci'
            break
        corrected = suggest_correction(user_query, dictionary)  # Corregge la query
        print(f"Query corretta: {corrected}\n")  # Stampa la query corretta

if __name__ == "__main__":
    # Avvia il ciclo di input dell'utente
    user_input_loop()
