# Notebook 1: Chat Base con LLM Locale

**Obiettivo**: Creare la prima chat funzionante usando LangChain e Ollama

---


## 1. Import e Setup

Importiamo le librerie necessarie.

**Nota**: Assicurati che Ollama sia in esecuzione:
- **Docker**: `docker-compose up -d` (porta 11434)
- **Installazione diretta**: `ollama serve` (porta 11434)


In [None]:
# Import LangChain (versione 1.0+)
from langchain_ollama import OllamaLLM

print("‚úÖ Import completati")


## 2. Connessione a Ollama

Creiamo una connessione al modello LLM locale tramite Ollama.

**Nota**: Assicurati che Ollama sia in esecuzione (`ollama serve`)


In [None]:
# Crea istanza LLM collegata a Ollama (API moderna LangChain 1.0+)
# Modello: llama3.2:3b (o il modello che hai scaricato)
llm = OllamaLLM(
    model="llama3.2:1b",  # Cambia se usi un modello diverso
    base_url="http://localhost:11434"  # URL default Ollama
)

print("‚úÖ LLM inizializzato")


## 3. Prima Chat Semplice

Facciamo la prima chiamata al LLM!


In [None]:
# Prima chiamata semplice
prompt = "Ciao! Presentati brevemente."

print(f"Domanda: {prompt}")
print("\nRisposta:")
print("-" * 50)

response = llm.invoke(prompt)
print(response)


## 4. Chat Interattiva Base

Creiamo una funzione per chattare in modo interattivo.


In [None]:
def chat_semplice(messaggio):
    """Funzione per chat semplice senza memoria"""
    risposta = llm.invoke(messaggio)
    return risposta

# Test
domanda = "Quali sono i vantaggi di usare un chatbot nella pubblica amministrazione?"
risposta = chat_semplice(domanda)

print(f"Domanda: {domanda}")
print(f"\nRisposta:\n{risposta}")


## 5. Esplorazione Parametri LLM

### **temperature** (0.0 - 1.0)
Controlla la **creativit√†** dell'output.

- **0.0-0.3**: Output deterministico e prevedibile. Ideale per FAQ e risposte precise.
- **0.4-0.7**: Bilanciamento tra coerenza e variet√†. Uso generale conversazionale.
- **0.8-1.0**: Output creativo e imprevedibile. Utile per storytelling e brainstorming.

**Default**: 0.8

### **top_p** (0.0 - 1.0) - Nucleus Sampling
Definisce il **sottoinsieme dinamico di token** da cui scegliere.

- **0.7-0.8**: Output focalizzato, considera solo i token pi√π probabili.
- **0.9-0.95**: Output pi√π diversificato, include pi√π opzioni.

**Best practice**: Usare **o** temperature **o** top_p, non entrambi insieme.

### **num_predict** (numero intero)
**Numero massimo di token** generati.

- **100-200**: Risposte brevi
- **500-1000**: Risposte articolate (valore consigliato)
- **>1000**: Contenuti lunghi

### **repeat_penalty** (1.0 - 2.0)
Penalizza le **ripetizioni** di parole gi√† generate.

- **1.0**: Nessuna penalit√†
- **1.1-1.3**: Penalit√† leggera, riduce ripetizioni mantenendo naturalezza
- **>1.5**: Penalit√† forte, pu√≤ rendere il testo meno naturale

---




In [None]:
# LLM con parametri personalizzati
llm_configurato = OllamaLLM(
    model="llama3.2:1b",
    temperature=0.7,  # Creativit√†: 0.0 (deterministico) - 1.0 (creativo)
    # top_p=1.0,  # Nucleus sampling
    num_predict=500,  # Max token generati
    repeat_penalty=1.1  # Penalit√† ripetizioni
)

prompt = "Spiega in 2 righe cosa sono i Large Language Models."
# prompt = "Inventa un nome originale per una nuova bevanda energetica futuristica e scrivi il suo slogan."

risposta = llm_configurato.invoke(prompt)

print(f"Prompt: {prompt}")
print(f"\nRisposta:\n{risposta}")


## 6. Esempio Pratico: Chatbot FAQ

Creiamo un esempio pi√π realistico: un chatbot che risponde a domande frequenti.


In [None]:
def chatbot_faq(domanda):
    """Chatbot semplice per FAQ"""
    # Aggiungiamo contesto al prompt
    prompt_completo = f"""
Sei un assistente virtuale di Sicilia Digitale, azienda che fornisce servizi ICT per la Pubblica Amministrazione.

Rispondi in modo professionale, chiaro e conciso alle domande degli utenti.
Se non conosci la risposta, ammettilo onestamente.

Domanda: {domanda}

Risposta:
"""
    
    risposta = llm.invoke(prompt_completo)
    return risposta.strip()

# Test con domande reali
domande_test = [
    "Quali servizi offre Sicilia Digitale?",
    "Come posso contattare il supporto?",
    "Quali sono gli orari di apertura?",
    "Qual √® la partita IVA o il codice fiscale dell'azienda?"
]

for domanda in domande_test:
    print(f"\n{'='*60}")
    print(f"Domanda: {domanda}")
    print(f"\nRisposta:")
    risposta = chatbot_faq(domanda)
    print(risposta)
    print("\n" + "-"*60)

# Successivamente, sottoporremo le stesse domande ad un agente con knowledge base

## 7. Note e Best Practices

### Cosa abbiamo imparato:
1. Come connettere LangChain a Ollama
2. Come fare chiamate base a un LLM
3. Come controllare parametri (temperature, etc.)
4. Come strutturare prompt con contesto

### Limitazioni attuali:
- Nessuna memoria: ogni chiamata √® indipendente
- Nessun retrieval: il LLM usa solo conoscenza pre-addestrata
- Nessun tool: non pu√≤ interagire con sistemi esterni

### Prossimi passi:
- Aggiungeremo memoria conversazionale
- Implementeremo RAG per knowledge base
- Integreremo tools per azioni esterne

---

**Congratulazioni! Hai completato il Notebook 1! üéâ**
