# Import dataset

In [7]:
import pandas as pd

# Define the file path
csv_file_path = './output/menus.csv'

# Read the CSV file and assign headers explicitly
df = pd.read_csv(csv_file_path, header=None, names=["FileName", "Text"])

# Display the first few rows of the DataFrame
display(df)

# Confirm the data has been successfully loaded
print(f"DataFrame loaded with {len(df)} rows and {len(df.columns)} columns.")

Unnamed: 0,FileName,Text
0,Sapore del Dune.pdf,"Ristorante ""Sapore del Dune""\nChef Alessandra ..."
1,Universo Gastronomico di Namecc.pdf,Universo Gastronomico di Namecc\nChef Alice Qu...
2,L Equilibrio Quantico.pdf,"Ristorante ""L'Equilibrio Quantico""\nChef Aless..."
3,L Architetto dell Universo.pdf,"Ristorante ""L'Architetto dell'Universo""\nChef ..."
4,L Essenza Cosmica.pdf,"Ristorante ""L'Essenza Cosmica""\n\nChef Alessan..."
5,Stelle Astrofisiche.pdf,"Ristorante ""Stelle Astrofisiche""\nChef Alessan..."
6,L Essenza di Asgard.pdf,Ristorante: L'Essenza di Asgard\nChef Palissan...
7,Eco di Pandora.pdf,"Ristorante ""L'Eco di Pandora""\nChef Alessandra..."
8,L Eco dei Sapori.pdf,L'Eco dei Sapori\nChef Aurora Vessanti\n\nNell...
9,L Essenza delle Dune.pdf,"Ristorante ""L'Essenza delle Dune""\nChef Alessa..."


DataFrame loaded with 30 rows and 2 columns.


In [8]:
from langchain import hub
from langchain.text_splitter import RecursiveCharacterTextSplitter
from langchain_core.output_parsers import StrOutputParser
from langchain_core.runnables import RunnablePassthrough

In [10]:
from langchain_community.document_loaders import DataFrameLoader

loader = DataFrameLoader(df, page_content_column="Text")
docs_data = loader.load()
docs_data[0]

Document(metadata={'FileName': 'Sapore del Dune.pdf'}, page_content='Ristorante "Sapore del Dune"\nChef Alessandra Quanti\n\nNel cuore arido di Tatooine, dove i mondi si mescolano e le stelle guidano i viaggiatori intergalattici, Chef\nAlessandra Quanti porta una rivoluzione culinaria che sfida le distanze siderali. Non è raro vedere i\ncommensali rimanere incantati osservando i suoi piatti che sembrano danzare tra le dune e le stelle, frutto\ndella sua straordinaria padronanza degli stati quantici, che le permette di esplorare e materializzare le infinite\npossibilità nascoste in ogni ingrediente rarefatto del deserto.\n\nLa sua storia ebbe inizio nei laboratori di spezie di Mos Eisley, dove la passione per la gastronomia\nmolecolare si fuse con la sua profonda comprensione dell\'universo subatomico. Fu proprio durante un\nesperimento particolarmente intenso con i Cristalli Kyber che scoprì la sua innata capacità di percepire le\nprobabilità culinarie, un dono che trasformò ogni sua c

In [137]:
# Split
import pprint
# Possible improvements - future hypertuning of chunk_size and chunk_overlap to improve results and try different slitters
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500)
splits = text_splitter.split_documents(docs_data)
pprint.pprint(splits[0:6])
pprint.pprint(len(splits))

[Document(metadata={'FileName': 'Sapore del Dune.pdf'}, page_content='Ristorante "Sapore del Dune"\nChef Alessandra Quanti'),
 Document(metadata={'FileName': 'Sapore del Dune.pdf'}, page_content='Nel cuore arido di Tatooine, dove i mondi si mescolano e le stelle guidano i viaggiatori intergalattici, Chef\nAlessandra Quanti porta una rivoluzione culinaria che sfida le distanze siderali. Non è raro vedere i\ncommensali rimanere incantati osservando i suoi piatti che sembrano danzare tra le dune e le stelle, frutto\ndella sua straordinaria padronanza degli stati quantici, che le permette di esplorare e materializzare le infinite\npossibilità nascoste in ogni ingrediente rarefatto del deserto.'),
 Document(metadata={'FileName': 'Sapore del Dune.pdf'}, page_content="La sua storia ebbe inizio nei laboratori di spezie di Mos Eisley, dove la passione per la gastronomia\nmolecolare si fuse con la sua profonda comprensione dell'universo subatomico. Fu proprio durante un\nesperimento particolarme

# Watsonx

In [96]:
from ibm_watsonx_ai import Credentials
from ibm_watsonx_ai.foundation_models import ModelInference

In [107]:
credentials = Credentials(
    url="https://us-south.ml.cloud.ibm.com",
    api_key="AnzfgthfcrfRzttoXGiKZUJDMRlcB3w4uemf0PJGFFT5"
)

OVERWRITE = False


In [147]:
from langchain_ibm import WatsonxLLM, WatsonxEmbeddings

watsonLLM = WatsonxLLM(
    model_id="mistralai/mistral-large",  # Che conosciamo bene 😊🏆
    url="https://us-south.ml.cloud.ibm.com",
    apikey="AnzfgthfcrfRzttoXGiKZUJDMRlcB3w4uemf0PJGFFT5",
    project_id="5c33debb-5a25-4bfe-8392-ede4b20884fe",
    params={
        "max_new_tokens": 1024
    }
)

In [125]:
embeddings = WatsonxEmbeddings(
    model_id="ibm/granite-embedding-107m-multilingual",
    url=credentials["url"],
    apikey=credentials["api_key"],
    project_id="5c33debb-5a25-4bfe-8392-ede4b20884fe",
)

In [138]:
from langchain.vectorstores import FAISS
vectorstore = FAISS.from_documents(splits, embeddings)
vectorstore.save_local("local_model_index")

In [151]:
retriever = vectorstore.as_retriever(search_kwargs={"k": 30})
retriever

VectorStoreRetriever(tags=['FAISS', 'WatsonxEmbeddings'], vectorstore=<langchain_community.vectorstores.faiss.FAISS object at 0x7ccd5925b3b0>, search_kwargs={'k': 30})

In [152]:
from langchain_core.prompts import ChatPromptTemplate

# Prompt
template = """
Comportati come un assistente che risponde alle domande del cliente su vari cibi e ristoranti.
Rispondi alla domanda basandoti solo sui seguenti documenti: {context}.
Ritorna solo i nomi dei piatti sotto forma di elenco, senza nessun testo di contesto.

Domanda relativa alla galassia: {question}
"""

prompt = ChatPromptTemplate.from_template(template)
prompt

# Post-processing
def format_docs(splits):
    return "\n\n".join(doc.page_content for doc in splits)

# Chain
rag_chain = (
    {"context": retriever | format_docs, "question": RunnablePassthrough()}
    | prompt
    | watsonLLM
    | StrOutputParser()
)

# Question
question = "Dimmi i piatti con Teste di idra"
response_text = rag_chain.invoke(question)
pprint.pprint(response_text)

('\n'
 'Assistente:\n'
 '- Zuppa di Teste di Idra con Polvere di Stelle\n'
 '- Piatto con petali di Baccacedro e Teste di Idra\n'
 '- Zuppa di Teste di Idra con Funghi dell’Etere\n'
 '- Mousse di Teste di Idra con Salsa Szechuan\n'
 '- Consommé di Teste di Idra con Idro-Cristallizzazione Sonora Quantistica\n'
 '- Fusilli del Vento con Teste di Idra\n'
 '- Arrosto di Teste di Idra con Colonia di Mycoflora\n'
 '- Tartare di Teste di Idra marinata in Psionica\n'
 '- Zuppa di Teste di Idra con Granuli di Nebbia Arcobaleno\n'
 '- Carne di Xenodonte con Teste di Idra\n'
 '- Carne di Mucca con Teste di Idra\n'
 '- Zuppa di Teste di Idra con Essenza di Vuoto\n'
 '- Brodo di Teste di Idra con Flusso di Particelle Isoarmoniche\n'
 '- Fusilli con salsa di Teste di Idra\n'
 '- Carne di Teste di Idra arrostita\n'
 '- Insalata di colonia di Mycoflora e Teste di Idra\n'
 '- Zuppa di Teste di Idra con Lacrime di Andromeda\n'
 '- Più Lontano delle Stelle\n'
 '- Gremolata di Teste di Idra con Gnocchi de