In [1]:
#Ho modificato la struttuta dei manuali per evitare i conflitti. In particolare nei moduli del treno arancio e viola nella parte della base anteriore
#ho elimitato la frase assemblaggio finale poichè per eliminare il problema della presenza costante dell'assemblaggio finale nella risposta, in questo codice
#c'è una funzione che elimina la parte di testo che contiene "assemblaggio finale" dalle risposte del chatbot o a meno che non vengia chiesto specificatamente dall'autente.
#Questa funzione però non permetteva al cahtbot di dare istruzioni riguardo la base anteriore perchè nel manuale, in quella sezione, copariva la frase assemblaggio finale.
#In più ho modificato l'interfaccia perchè con l'altro codice le frasi troppo lunge le troncava con dei puntini di sospensione, in questo modo la risposta si legge completamente.
#NB:quando l'utente pone la domanda il chatbot impiega qualche secondo a restituire la risposta.

import requests
import re
import ipywidgets as widgets
from IPython.display import display
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.metrics.pairwise import cosine_similarity

# Configura l'API di GPT-2
API_URL = "https://api-inference.huggingface.co/models/gpt2"
headers = {"Authorization": "Bearer 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"}

def query_gpt2(prompt):
    response = requests.post(API_URL, headers=headers, json={"inputs": prompt})
    if response.status_code == 200:
        return response.json()
    else:
        return {"error": "Request failed with status code " + str(response.status_code)}

def preprocess_text(text):
    return text.lower()

class ManualLoader:
    def __init__(self, manual_paths):
        self.manuals = {}
        self.load_manuals(manual_paths)

    def load_manuals(self, paths):
        for name, path in paths.items():
            with open(path, 'r', encoding='utf-8') as file:
                content = file.read()
                self.manuals[name] = self._split_into_chunks(content)

    def _split_into_chunks(self, text):
        chunks = [preprocess_text(chunk.strip()) for chunk in text.split('---') if chunk.strip()]
        return chunks

class AssemblyAssistantBot:
    def __init__(self, manuals):
        self.manual_loader = ManualLoader(manuals)
        self.vectorizer = TfidfVectorizer()
        self._fit_vectorizer()

    def _fit_vectorizer(self):
        all_chunks = []
        for chunks in self.manual_loader.manuals.values():
            all_chunks.extend(chunks)
        self.vectorizer.fit(all_chunks)

    def handle_query(self, product, query):
        # Ricerca nei manuali
        response_from_manuals = self._search_in_manuals(product, query)
        
        # Usa GPT-2 per arricchire la risposta
        if response_from_manuals:
            gpt_prompt = f"Given the following information from the manual: {', '.join(response_from_manuals)}, provide a precise answer to the question: {query}"
            gpt_response = query_gpt2(gpt_prompt)
        
            if 'generated_text' in gpt_response:
                return response_from_manuals + [self._filter_gpt_response(gpt_response['generated_text'].strip(), query)]
        
        return response_from_manuals

    def _search_in_manuals(self, product, query):
        query = preprocess_text(query)
        if product not in self.manual_loader.manuals:
            return ["Manuale non trovato."]
        
        chunks = self.manual_loader.manuals.get(product, [])
        if not chunks:
            return ["Nessuna informazione trovata nel manuale per questo prodotto."]
        
        # Filtra la sezione "assemblaggio finale" se non richiesta esplicitamente
        include_final_assembly = any(kw in query.lower() for kw in ['assemblaggio finale', 'fase finale', 'finale'])
        if not include_final_assembly:
            chunks = [chunk for chunk in chunks if 'assemblaggio finale' not in chunk.lower()]
        
        # Trova i chunk più simili alla query
        query_vec = self.vectorizer.transform([query])
        chunk_vecs = self.vectorizer.transform(chunks)
        similarities = cosine_similarity(query_vec, chunk_vecs).flatten()

        # Riduci la soglia per trovare più risposte
        results = [chunks[index] for index, similarity in enumerate(similarities) if similarity > 0.1]
        
        # Riduci la lunghezza delle risposte
        results = self._truncate_responses(results)
        
        return results if results else ["Nessuna informazione trovata."]

    def _filter_gpt_response(self, response, query):
        # Includi la sezione "assemblaggio finale" solo se esplicitamente richiesta
        if 'assemblaggio finale' in query.lower():
            return response  # Mantieni l'intera risposta se richiesta
        
        # Altrimenti, filtra la sezione
        pattern = re.compile(r'assemblaggio finale dei moduli.*', re.DOTALL)
        filtered_response = pattern.split(response)[0].strip()
        
        return filtered_response

    def _truncate_responses(self, responses, max_length=2000):
        truncated_responses = []
        for response in responses:
            if len(response) > max_length:
                truncated_responses.append(response[:max_length] + '...')
            else:
                truncated_responses.append(response)
        return truncated_responses

def on_submit(_):
    product = product_dropdown.value
    query = query_input.value
    if product and query:
        response = bot.handle_query(product, query)
        conversation_output.value = f"Tu: {query}\n\n" + "\n\n".join([f"Bot: {info}" for info in response])
        query_input.value = ""
    else:
        conversation_output.value = "Bot: Seleziona un prodotto e inserisci una domanda."

# Percorsi ai manuali
manuals = {
    "Treno Arancio": "C:\\Users\\marid\\OneDrive\\Desktop\\Progetto SF\\TrenoArancio.txt",
    "Treno Viola": "C:\\Users\\marid\\OneDrive\\Desktop\\Progetto SF\\TrenoViola.txt",
    "Giraffa": "C:\\Users\\marid\\OneDrive\\Desktop\\Progetto SF\\Giraffa.txt"
}

# Creazione del bot
bot = AssemblyAssistantBot(manuals)

# Menu a tendina per la selezione del prodotto
product_dropdown = widgets.Dropdown(
    options=[('Seleziona un prodotto', None)] + [(name, name) for name in manuals.keys()],
    value=None,
    description='Prodotto:',
)

# Campo di inserimento per la domanda
query_input = widgets.Text(
    value='',
    placeholder='Inserisci la tua domanda',
    description='Domanda:',
)

# Pulsante di invio
submit_button = widgets.Button(
    description='Invia',
    button_style='primary',
)
submit_button.on_click(on_submit)

# Finestra di conversazione (modificata per visualizzare tutto il testo)
conversation_output = widgets.Textarea(
    value='',
    placeholder='Le risposte verranno visualizzate qui...',
    description='Conversazione:',
    layout={'width': '100%', 'height': '400px'},
    style={'description_width': 'initial'}
)

# Visualizza tutti i widget
display(product_dropdown, query_input, submit_button, conversation_output)


Dropdown(description='Prodotto:', options=(('Seleziona un prodotto', None), ('Treno Arancio', 'Treno Arancio')…

Text(value='', description='Domanda:', placeholder='Inserisci la tua domanda')

Button(button_style='primary', description='Invia', style=ButtonStyle())

Textarea(value='', description='Conversazione:', layout=Layout(height='400px', width='100%'), placeholder='Le …