# 🔍 Tracciamento delle Catene LLM con LangFuse

## 📦 Cos’è LangView?

**LangFuse** è una piattaforma **open source** di osservabilità per applicazioni LLM:

| Caratteristica           | Descrizione                                            |
| ------------------------ | ------------------------------------------------------ |
| ✅ Autonoma               | Può essere self-hosted (alternativa a LangSmith cloud) |
| 🔒 Privacy-friendly      | Ideale per aziende con policy restrittive sui dati     |
| 📈 Tracciamento completo | Latency, costi, input/output, struttura della catena   |

---

## 🐳 Setup LangFuse con Docker

### 🗂️ Struttura della directory

```bash
/app/
├── docker-compose.yml
├── .env
├── frontend/
├── backend/
└── langfuse/
```

### 🚀 Avvio servizi

1. Spostarsi nella cartella `app`
2. Assicurarsi che non ci siano container attivi (`docker ps`)
3. Avviare:

```bash
docker compose up
```

Questo avvia:

* `langfuse` (monitoring)
* `postgres` (database richiesto)
* Altri servizi (frontend/backend), ma **non obbligatori per il tracciamento**
* LangFuse dipende dal servizio Postgres e abbiamo bisogno di questo database SQL per far funzionare il vectorstore PGVector che usa Postgres sotto il cofano  

---

## 🔑 Variabili d’Ambiente da configurare

```yaml
  langfuse:
    image: ghcr.io/langfuse/langfuse:sha-23150b6
    restart: always
    environment:
      DATABASE_URL: postgresql://admin:admin@postgres:5432/vectordb
      NEXTAUTH_URL: http://localhost:3000
      NEXTAUTH_SECRET: mysecret
      SALT: mysalt
    ports:
      - "3000:3000"
    depends_on:
      - postgres`
```

### ✅ Cosa fa `DATABASE_URL: postgresql://admin:admin@postgres:5432/vectordb`?

Indica che il servizio **Langfuse si connette a un database PostgreSQL** (probabilmente definito altrove nello stesso `docker-compose.yaml` sotto il nome `postgres`) per **salvare i suoi dati interni**.


### 🧠 Langfuse usa PostgreSQL per:

1. ✅ **Loggare tutte le richieste** LLM: prompt, risposte, metadati, durata, token, ecc.
2. 📊 **Salvare tracce e valutazioni**: step di catene (`traces`, `spans`, ecc.)
3. 🧪 **Archiviare metriche, annotazioni e valutazioni umane/automatiche**
4. 📂 **Gestire utenti e autenticazione** (usando `NEXTAUTH_SECRET` e `SALT`)


### 🧩 Ruolo della variabile `DATABASE_URL`

Questa stringa:

```
postgresql://admin:admin@postgres:5432/vectordb
```

va interpretata così:

* `admin:admin` → username e password del DB
* `@postgres:5432` → host del database (nome del servizio `postgres`, non `localhost`)
* `vectordb` → nome del database che Langfuse userà per creare le sue **tabelle interne**

### ✅ Quindi in sintesi:

Langfuse usa PostgreSQL come **backend per archiviare tutti i dati di tracciamento e monitoraggio** delle interazioni con LLM, valutazioni, errori e metriche — è **essenziale** per il funzionamento dell'app Langfuse.

---

## 🌐 Accesso all’interfaccia

Visita: [http://localhost:3000](http://localhost:3000)

* ✅ Crea un account (es. John Doe)
* ✅ Nessuna email di conferma richiesta
* ✅ Crea un progetto (es. `udemy-course`)
* ✅ Naviga in **Dashboard**, **Tracce**, **Valutazioni**, **API Keys**

---

## 🔐 Creazione Chiavi API

1. Vai su `Settings > API Keys`
2. Genera:

   * `Public Key`
   * `Secret Key`
3. ⚠️ **Segnati subito la secret key** (visibile una sola volta)
4. Inseriscile in `.env`:

```env
LANGFUSE_PUBLIC_KEY=...
LANGFUSE_SECRET_KEY=...
LANGFUSE_HOST=http://localhost:3000
```

In [1]:
from dotenv import load_dotenv
load_dotenv()

True

In [2]:
# per utilizzo con langchain
from langfuse.callback import CallbackHandler
langfuse_handler = CallbackHandler()

ImportError: cannot import name 'ENCODERS_BY_TYPE' from 'pydantic.json' (c:\Users\felip\Desktop\Advanced_RAG\.venv\Lib\site-packages\pydantic\json.py)



---

## 🤖 Esempio base: catena Chat + LangView

### 📋 Prompt

```python
from langchain.prompts import ChatPromptTemplate
from langchain.chat_models import ChatOpenAI

prompt = ChatPromptTemplate.from_template("Raccontami una barzelletta su {argomento}")
llm = ChatOpenAI()
chain = prompt | llm
```

### 🏃 Esecuzione con tracciamento

```python
chain.invoke(
    {"argomento": "un pappagallo"},
    config={"callbacks": [handler]}
)
```



In [7]:
# creiamo una spemplice chain

from langchain_core.prompts import ChatPromptTemplate
from langchain_openai import ChatOpenAI

model = ChatOpenAI()
prompt = ChatPromptTemplate.from_template("tell me a joke about {topic}")

chain = prompt | model


ImportError: cannot import name 'SkipValidation' from 'pydantic' (c:\Users\felip\Desktop\Advanced_RAG\.venv\Lib\site-packages\pydantic\__init__.cp312-win_amd64.pyd)

In [6]:
chain.invoke({"topic": "parrot"}, config={"callbacks": [langfuse_handler]})

AIMessage(content='Why did the parrot wear a raincoat?\n\nIn case he wanted to "polyurethane" around!', additional_kwargs={'refusal': None}, response_metadata={'token_usage': {'completion_tokens': 22, 'prompt_tokens': 14, 'total_tokens': 36, 'completion_tokens_details': {'accepted_prediction_tokens': 0, 'audio_tokens': 0, 'reasoning_tokens': 0, 'rejected_prediction_tokens': 0}, 'prompt_tokens_details': {'audio_tokens': 0, 'cached_tokens': 0}}, 'model_name': 'gpt-3.5-turbo-0125', 'system_fingerprint': None, 'id': 'chatcmpl-BvVdyxpNDqhtpBjQ92l4lR2gjfsmr', 'service_tier': 'default', 'finish_reason': 'stop', 'logprobs': None}, id='run--441b7f1a-2dc4-48ab-9894-962d38669db5-0', usage_metadata={'input_tokens': 14, 'output_tokens': 22, 'total_tokens': 36, 'input_token_details': {'audio': 0, 'cache_read': 0}, 'output_token_details': {'audio': 0, 'reasoning': 0}})

---

## 📊 Interfaccia LangView

### 📌 Traccia creata:

* ID run
* Latency, costi
* Messaggi scambiati (prompt + risposta)
* Token count
* Argomenti usati
* Metadati dei run

### 🔍 Analisi approfondita:

* Cliccando su una traccia si può:

  * Vedere tutti i `Runnable`
  * Esplorare input/output intermedi
  * Analizzare il flusso completo della catena

---

## 📌 Vantaggi di LangView

| Funzione                       | Beneficio                                               |
| ------------------------------ | ------------------------------------------------------- |
| 🪪 Tracciamento identificabile | Ogni run è tracciabile con ID                           |
| 🧪 Debug profondo              | Visualizzazione completa delle fasi della catena        |
| 📊 Monitoraggio produttivo     | Perfetto per test, staging e produzione                 |
| 🔐 On-premise                  | Nessun invio dati verso il cloud LangChain              |
| 🧩 Integrazione diretta        | Plug & play con LangChain `config={"callbacks": [...]}` |

---

## ✅ Conclusione

Hai imparato a:

* Configurare **LangView** con Docker per il tracciamento delle catene LLM
* Creare chiavi API e integrarle con LangChain
* Usare `LangViewCallbackHandler` per osservabilità
* Tracciare dettagli su costi, latenza, input, output, flow di catena

> ✅ Ottimo punto di partenza per **monitorare applicazioni LLM su larga scala**