# 🚦 Routing tra SQL, Chat e Off Topic

## 🎯 Obiettivo

Creare un **sistema di routing** che analizzi la domanda dell’utente e scelga dinamicamente il tipo di risposta tra:

| Categoria   | Azione                                                     |
| ----------- | ---------------------------------------------------------- |
| `database`  | Eseguire query SQL sulla tabella `products`                |
| `chat`      | Eseguire catena RAG classica (retriever + LLM)             |
| `off_topic` | Rispondere con un messaggio statico (nessuna chiamata LLM) |

---

## 🧠 Prompt di classificazione

Creiamo un **modello di classificazione** istruito per assegnare una delle tre etichette a ogni domanda:

```txt
Classifica la seguente domanda in una delle tre categorie:

1. database — per domande su prodotti o ordini
2. chat — per domande generiche sul ristorante (es. orari)
3. off_topic — per qualsiasi altra cosa (meteo, calcio, ecc.)

Domanda: "{{question}}"
Categoria: 
```

### ✏️ Esempi:

* “Qual è il dessert più costoso?” → `database` (informazione contenuta nel DB)
* “Chi è il proprietario del ristorante?” → `chat` (informazione contenuta nel Vectostore RAG)
* “Com'è il tempo oggi?” → `off_topic`

In [2]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate

classification_prompt = """You are good at classify a question.
Given the user question below, classify it as either being about 'Database', 'Chat', or 'Offtopic'.

<If the question is about products of the restaurant OR ordering food classify the question as 'Database'>
<If the question is about restaurant related topics like opening hours and similar topics, classify it as 'Chat'>
<If the question is about whether, football or anything not related to the restaurant or products, classify the question as 'Offtopic'>

<question>
{question}
</question>

Classification:
"""

classification_template = PromptTemplate.from_template(classification_prompt)

In [4]:
from langchain_openai import ChatOpenAI

classification_chain = classification_template | ChatOpenAI() | StrOutputParser()

In [5]:
classification_chain.invoke({"question": "How is the weather?"})

'Offtopic'

---

### 🛠️ Step 2 – Router Logico

Usiamo un `RunnableLambda` per decidere il flusso da seguire:

```python
def route_by_topic(data):
    topic = data["topic"]
    if topic == "database":
        return sql_chain
    elif topic == "chat":
        return rag_chain
    else:
        return StaticResponse("Mi dispiace, non posso rispondere su questo argomento.")
```

In [6]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_community.utilities.sql_database import SQLDatabase

template = """Based on the table schema below, write a SQL query that would answer the user's question:
{schema}

Question: {question}
SQL Query:"""


prompt = ChatPromptTemplate.from_template(template)

CONNECTION_STRING = (
    "postgresql+psycopg2://admin:admin@localhost:5432/vectordb"
)

# qui importiamo il database SQL 
# otteniamo l'istanza del nostro databse
db = SQLDatabase.from_uri(CONNECTION_STRING)

# definiamo la funzione per ottenere lo schema 
# fornisce le informazioni al nostro modello
# tutte le informazioni sul nostro database e sulle tabelle saranno fornite 
# da questa funzione 
def get_schema(_):
    schema = db.get_table_info()
    return schema

# funzione che esegue sul database la query 
# generata dal modello 
def run_query(query):
    return db.run(query)

  self._metadata.reflect(


In [7]:
from sqlalchemy import create_engine, inspect
from tabulate import tabulate

# ciò di cui abbiamo sono solo le informazioni sulla nostra tabella products
def get_schema(_):
    engine = create_engine(CONNECTION_STRING)

    inspector = inspect(engine)

    columns = inspector.get_columns("products")

    column_data = [
        {
            "Column Name": col["name"],
            "Data Type": str(col["type"]),
            "Nullable": "Yes" if col["nullable"] else "No",
            "Default": col["default"] if col["default"] else "None",
            "Autoincrement": "Yes" if col["autoincrement"] else "No"
        }
        for col in columns
    ]


    schema_output = tabulate(column_data, headers="keys", tablefmt="grid")

    formatted_schema = f"Schema for 'products' table:\n{schema_output}"

    return formatted_schema

In [8]:
# utilizziamo tale schema per creare la nostra chain

from langchain_core.runnables import RunnablePassthrough
from langchain_openai import ChatOpenAI

model = ChatOpenAI()

# utilizziamo un metodo definito (.bind()) che lega gli argomenti del runtime ai Runnable
# qui leghiamo l'argomento stop al modello
# quindi vogliamo impedire all'LLM di generare token dopo aver creato
# la nostra query SQL, dato che vogliamo solo la query SQL e nient'altro

sql_response = (
    RunnablePassthrough.assign(schema=get_schema)
    | prompt
    | model.bind(stop=["\nSQLResult:"]) 
    | StrOutputParser()
)

In [None]:
from langchain_core.runnables import RunnableLambda

template = """Based on the table schema below, question, sql query, and sql response, write a natural language response:
{schema}

Question: {question}
SQL Query: {query}
SQL Response: {response}"""

prompt_response = ChatPromptTemplate.from_template(template)

def debug(input):
    print("SQL Output: ", input["query"])
    return input

sql_chain = (
    RunnablePassthrough.assign(query=sql_response).assign(
        schema=get_schema,
        response=lambda x: run_query(x['query'])mbedding
    )
    | RunnableLambda(debug)
    | prompt_response
    | model
    | StrOutputParser()
)

In [13]:
# RAG Chain

from langchain_openai import OpenAIEmbeddings
from langchain_text_splitters import RecursiveCharacterTextSplitter
from langchain_community.document_loaders.text import TextLoader
from langchain_community.vectorstores.pgvector import PGVector

DATABASE_URL = "postgresql+psycopg2://admin:admin@localhost:5432/vectordb"

embeddings = OpenAIEmbeddings()

store = PGVector(
    collection_name="vectordb",
    connection_string=DATABASE_URL,
    embedding_function=embeddings
)

loader1 = TextLoader("./data/restaurant.txt")
loader2 = TextLoader("./data/founder.txt")

docs1 = loader1.load()
docs2 = loader2.load()

docs = docs1 + docs2

text_splitter = RecursiveCharacterTextSplitter(chunk_size=250, chunk_overlap=50)

chunks = text_splitter.split_documents(docs)

store.add_documents(chunks)

retriever = store.as_retriever()

  store = PGVector(


In [14]:
from operator import itemgetter

template = """Answer the question based only on the following context:
{context}

Question: {question}"""

rag_prompt = ChatPromptTemplate.from_template(template)

rag_chain = (
    {"context": itemgetter("question") | retriever, 
     "question": itemgetter("question")}
    | rag_prompt
    | ChatOpenAI()
    | StrOutputParser()
)

In [15]:
rag_chain.invoke({"question": "Who is the owner of the restaurant?"})

'Chef Amico is the owner of the restaurant.'

## Router

In [18]:
def route(info):
    if "database" in info['topic'].lower():
        print("Using sql_chain")
        return sql_chain
    elif "chat" in info["topic"].lower():
        print("Using chain")
        return rag_chain
    else: # offtopic
        return "I am sorry, I am not allowed to answer about this topic."

In [19]:
from langchain_core.runnables import RunnableLambda, RunnableParallel

full_chain = RunnableParallel(
    {
        "topic": classification_chain,
        "question": lambda x: x['question']
    }
) | RunnableLambda(route)

---

## 🔁 Catena Finale Composta

```
User Input
   ↓
Parallel (pass-through) → Classificatore (→ "topic")
   ↓
Router (RunnableLambda con logica `if topic == ...`)
   → SQL chain
   → RAG chain
   → Static message
```

---

## ✅ Esempi di Test

### ❓ Domanda: “Qual è il dessert più costoso che offrite?”

* 🔀 Routing → `database`
* ✅ Output: “Il panettone, al prezzo di 15 dollari.”

---

### ❓ Domanda: “Com’è il tempo domani?”

* 🔀 Routing → `off_topic`
* ✅ Output: “Mi dispiace, non posso rispondere su questo argomento.”

---

### ❓ Domanda: “Chi è il proprietario del ristorante?”

* 🔀 Routing → `chat`
* ✅ Output: “Chef Amico.”

In [25]:
full_chain.invoke({"question": "Whats the most expensive dessert you offer?"})

Using sql_chain
SQL Output:  SELECT name, price
FROM products
WHERE category = 'dessert'
ORDER BY price DESC
LIMIT 1;


'The most expensive dessert we offer is the panettone priced at $15.00.'

In [26]:
full_chain.invoke({"question": "How will the weather be tomorrow?"})

'I am sorry, I am not allowed to answer about this topic.'

In [None]:
full_chain.invoke({"question": "Who is the owner of the restaurant?"})

Using chain


'Chef Amico.'

: 

---

## 🔐 Note sulla Sicurezza

* Il routing evita **chiamate non necessarie** all’LLM (es. su argomenti off topic).
* Protegge la **coerenza del dominio** (non vogliamo che un bot aziendale risponda sul meteo o sulla politica).
* È un primo passo verso un **controllo conversazionale più robusto**.

---

## 🚀 Conclusione

Hai imparato a:

* Integrare query SQL con LLM in modo sicuro (accesso in sola lettura).
* Costruire un classificatore LLM-based per instradare le domande.
* Gestire con eleganza i casi fuori dominio (`off_topic`).

> 🔜 Nella prossima lezione impareremo a usare **[Nemo Guardrails](https://nemoguardrails.ai/)** per rafforzare ancora di più la **sicurezza e il controllo dei flussi conversazionali**.