# Introduzione a LangChain

***Argomenti:***
* Prompt Template
* Runnable
* Memoria Sequenziale
* Parserizzazione

In [None]:
from dotenv import load_dotenv
load_dotenv()


In [None]:
import os

from langchain_openai import ChatOpenAI  # pip install langchain-openai

# Connettore verso il modello di linguaggio OpenAI
llm = ChatOpenAI(
    model="gpt-4o-mini",                            # modello di linguaggio da utilizzare
    openai_api_key=os.getenv("openai_api_key"),     # chiave API OpenAI
    temperature=.7,                                 # controlla la creatività del modello
    max_tokens=1024,                                # numero massimo di token nella risposta    
    request_timeout=30                              # timeout della richiesta in secondi

    # Per utilizzare un connettore per modelli in locale, puoi usare:
    #model = "meta-llama/Llama-3.2-3B-Instruct",      # esempio di modello locale attraverso LM Studio
    #base_url = "http://127.0.0.1:8000/v1"
)

## Connettore al locale

In [None]:
from langchain_ollama import ChatOllama         # pip install langchain-ollama

llm = ChatOllama(
    model="llama-vincent",
    temperature=0.7,
    num_predict=1024,
    base_url="http://localhost:11434",  # opzionale
    request_timeout=30
)

In [None]:
llm.invoke("crea un prompt per l'immagine in allegato in modo da trasformare la persona nell'immagine in allegato in un personaggio fantasy")

## 🧠 OpenAI GPT-4o mini

**GPT-4o mini** (*Generative Pre-trained Transformer 4o mini*) è una versione compatta e ottimizzata del modello **GPT-4o**, introdotta da **OpenAI nel 2024**.

Progettato per **massimizzare l'efficienza computazionale** mantenendo elevate prestazioni conversazionali, GPT-4o mini rappresenta un compromesso ideale tra **potenza, velocità e costi operativi**, risultando perfetto per applicazioni real-time, mobile, embedded o cloud a basso consumo.

---

### ⚙️ Caratteristiche tecniche principali

| Caratteristica                         | Dettaglio                                         |
|----------------------------------------|--------------------------------------------------|
| **Architettura**                       | Transformer Decoder-only                         |
| **Context window**                     | Fino a **128K token**                            |
| **Token generabili per output**        | Fino a **16.384 token**                          |
| **Modalità input/output**              | Testo, codice, immagini, audio (come GPT-4o)     |
| **Tecnica di addestramento**          | RLHF (*Reinforcement Learning from Human Feedback*) |
| **Performance/costo**                 | Ottimizzato per ambienti a risorse limitate      |
| **Compatibilità API**                 | Interfaccia OpenAI compatibile (`/v1/chat/completions`) |

---

### ✅ Vantaggi d’uso

- 🔋 **Basso consumo di risorse**: adatto per dispositivi edge, inferenza locale o istanze cloud leggere.  
- 🚀 **Alta velocità di risposta**: eccellente per sistemi in tempo reale (es. agenti, chatbot, copiloti).  
- 💰 **Costo ridotto**: bilanciamento ideale per applicazioni in larga scala o multitenant.  
- 🧩 **Facilmente integrabile**: piena compatibilità con l'ecosistema OpenAI, LangChain e agent frameworks.

---

### 🧪 Quando usarlo

GPT-4o mini è particolarmente indicato per:

- App AI-powered con migliaia/milioni di utenti simultanei  
- Interfacce conversazionali rapide (es. helpdesk, tutor virtuali)  
- Sistemi embedded, mobile o con requisiti real-time  
- Test e prototipazione low-cost di agenti AI


## ⚙️ Tecniche di Addestramento dei LLMs  
### 🎯 Fine-tuning vs RLHF (Reinforcement Learning from Human Feedback)

L’addestramento dei modelli linguistici di grandi dimensioni (*LLMs*) può avvenire tramite due approcci principali: **Fine-tuning** e **RLHF**. Sebbene entrambi puntino a migliorare le prestazioni del modello, differiscono profondamente nella metodologia e negli obiettivi.

---

### 🔧 Fine-tuning

Nel **fine-tuning**, il modello viene ulteriormente addestrato su un **dataset statico** di esempi *input-output* già etichettati. Durante questo processo:

- ✅ I **pesi del modello** vengono aggiornati per adattarsi ai dati specifici.
- 🎯 Il modello **imita** gli esempi forniti, replicando schemi e risposte.
- 🧠 È un processo **diretto e supervisionato**, ideale per:
  - Domini specifici (es. medicina, finanza)
  - Task precisi (es. classificazione, Q&A tecnico)

> 📌 Il modello *non apprende attivamente dal feedback umano*, ma si adatta passivamente ai dati forniti.

---

### 🧠 RLHF — Reinforcement Learning from Human Feedback

Il **RLHF** è un approccio **più interattivo e iterativo**, in cui il modello apprende sulla base delle **preferenze espresse dagli esseri umani**.

1. Il modello genera più risposte per uno stesso input.
2. Gli umani **valutano le risposte**, indicando quale preferiscono.
3. Un **modello di ricompensa** converte questo feedback in **punteggi numerici**.
4. Un algoritmo di **reinforcement learning** (es. PPO) aggiorna i pesi del modello, spingendolo verso risposte più coerenti con i desideri umani.

> 🔁 Questo processo consente **adattamenti graduali e continui**, favorendo un comportamento più allineato a **valori, etica e qualità percepita dall’utente**.

---

### 🆚 Confronto rapido

| Aspetto                | Fine-tuning                           | RLHF                                         |
|------------------------|----------------------------------------|----------------------------------------------|
| Tipo di dati           | Dataset statico etichettato           | Feedback umano in tempo reale                |
| Modalità               | Supervisato                           | Interattivo, basato su ricompensa            |
| Obiettivo              | Adattamento a compiti o domini        | Allineamento a preferenze e valori umani     |
| Apprendimento          | Diretto                               | Iterativo e adattivo                         |
| Complessità            | Più semplice                          | Più complesso (richiede interazione umana)   |

---

🔬 **Conclusione**  
Mentre il fine-tuning è ideale per specializzare un modello, il RLHF è cruciale per ottenere **comportamenti generativi più umani e sicuri**, particolarmente nei modelli conversazionali avanzati come ChatGPT, Claude o Gemini.



In [None]:
llm.invoke("La nebbia agli irti colli...")

# Prompt Template

In [None]:
from langchain.prompts import ChatPromptTemplate  # pip install langchain

# creazione di un template di prompt per il modello
prompt = ChatPromptTemplate.from_messages([
    ("system", "Act as a novelist from the Romantic era, yet highly knowledgeable about contemporary topics. Use highly technical terms wherever possible. Answer accordig to the user language"),
    ("user", "{un_placeholder}"), # tra parentesi graffe va il placeholder che verrà riempito con il contenuto e può avere un nome qualsiasi
    # ("user", "Scrivi un racconto breve su un tema romantico su {un_placeholder}, ma con riferimenti a {un_altro_placeholder}."),
])

# concatenazione del prompt al modello tramite il carattere pipe |
# il simbolo | deriva da langchain expression language (LCEL), che permette di concatenare oggetti
chain = prompt | llm  # il prompt (ChatPromptTemplate) va =>  nel modello (ChatOpenAI)

In [None]:
prompt.invoke({"un_placeholder": "Cos'è chatGPT?",})

In [None]:
print(prompt.messages)

In [None]:
result=chain.invoke({"un_placeholder": "Cos'è chatGPT?"})
result

In [None]:
result=chain.invoke({"un_placeholder": "qual è il modello di machine learning più adatto per risolvere un problema di classificazione?"})
result

In [None]:
# rimuoviamo il placeholder per l'utente
result=chain.invoke({"quali sono le metriche di valutazione più comuni per un modello di classificazione?"})  # questa volta manca il "placeholder" per user
result

In [None]:
result.content

In [None]:
result.response_metadata.get("token_usage")

## Interfaccia Runnable

Per rendere più semplice la creazione di catene di eventi/esecuzione anche molto complesse i componenti di LangChain implementano tutti un protocollo "runnable" tramite un'interfaccia comune che permette di usare qualsiasi componente in modo standard; di seguito sono elencati i 3 principali metodi:

* **stream** - inviare risposte parziali mentre vengono generate
* **invoke** - eseguire la catena su un input
* **batch** - esecuzione della catena su più input

Uno dei vantaggi delle interfacce Runnable è dato dal fatto che dei componenti *runnable* possono essere concatenati in sequenze di esecuzione, facendo in modo che, automaticamente, gli output di un componente possano entrare in input ad un altro; il comando *pipe* `|` serve a questo e permette, nella sintassi LCEL (LangChain Expression Language) di creare componenti runnable partendo da altri componenti runnable, configurandoli in una sequenza di componenti che agiranno sinergicamente.

   
[https://python.langchain.com/docs/concepts/messages/#langchain-messages](https://python.langchain.com/docs/concepts/messages/#langchain-messages)

In [None]:
chain.stream("Parlami delle GPU e del loro utilizzo nel deep learning", stream=True)

In [None]:
chain.invoke("Ciao, il mio cantate preferito è Lucio Battisti")

In [None]:
chain.invoke("Chi è il mio cantante preferito?")

# Memory

In [None]:
# memoria sequenziale di una conversazione
from langchain.memory import ConversationBufferMemory

memory = ConversationBufferMemory()
memory.chat_memory.add_user_message("Buongiono")
memory.chat_memory.add_ai_message("Ciao, come va?")
memory.chat_memory.add_user_message("Tutto ok, grazie. A te?")

In [None]:
history = memory.load_memory_variables({})
print(history)


In [None]:
memory = ConversationBufferMemory(return_messages=True) # impostiamo return_messages=True per ottenere i messaggi della conversazione in maniera composta

# memory.chat_memory.clear() per svuotare la memoria conversazionale
memory.chat_memory.add_user_message("ciao")
memory.chat_memory.add_ai_message("ciao, come và?")
memory.chat_memory.add_user_message("mah, non benissimo, ho un problema con il mio codice javascript")
memory.chat_memory.add_ai_message("mi spiace uso python")



history = memory.load_memory_variables("")
print(history)

In [None]:
for i in history['history']:
    print(i.content)

In [None]:
history.get("history")[0].content

In [None]:
from operator import itemgetter
from langchain.prompts import ChatPromptTemplate, MessagesPlaceholder
from langchain.schema.runnable import RunnableLambda, RunnablePassthrough

# il messaggio di sistema per il modello è opzionale, ma è utile per fornire un contesto specifico
system_template = "Agisci come un esperto AI engineer e cerca sempre di fare collegamenti al contesto AI."

# includiamo la memoria nella conversazione
# MessagesPlaceholder è un segnaposto per i messaggi della memoria conversazionale
chat_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_template),
        MessagesPlaceholder(variable_name="history"), # qui iniettiamo tutta la conversazione passata
        ("human", "{input}"),
    ]
)

# importiamo le classi necessarie per la memoria conversazionale
# impostiamo memory_key="history" per indicare che la memoria conversazionale sarà associata alla chiave "history"
memory = ConversationBufferMemory(memory_key="history", return_messages=True)

# ATTENZIONE:
# creiamo la conversazione utilizzando RunnablePassthrough e RunnableLambda
# RunnablePassthrough permette di passare i dati attraverso la pipeline senza modificarli
# RunnableLambda permette di eseguire una funzione su di essi.
conversation = (
        # questo è il passaggio della memoria conversazionale
        RunnablePassthrough.assign(history=RunnableLambda(memory.load_memory_variables) | itemgetter("history"))
        | chat_prompt
        | llm
)

In [None]:
RunnablePassthrough.assign(history=RunnableLambda(memory.load_memory_variables) | itemgetter("history"))

1. RunnablePassthrough.assign(...)
    - RunnablePassthrough è un runnable (un oggetto composabile) che tipicamente passa i dati inalterati, ma con .assign() puoi arricchire i dati con nuove chiavi.

    - .assign(history=...) significa che aggiungerà (o sovrascriverà) la chiave "history" nel dizionario che passa lungo la pipeline

2. history=RunnableLambda(memory.load_memory_variables) | itemgetter("history")
    - RunnableLambda(memory.load_memory_variables) prende una funzione (memory.load_memory_variables) e la rende compatibile con la pipeline dei runnable.

    - La funzione memory.load_memory_variables restituisce un dizionario che contiene la storia della conversazione (e forse anche altri dati).

    - La pipe | compone due runnable: il risultato di RunnableLambda(...) viene passato a itemgetter("history").

        - itemgetter("history") prende un dizionario in ingresso e estrae il valore associato alla chiave "history".

3. Comportamento finale
Quando la pipeline è attivata:

    - Verranno passati i dati (ad esempio, l’input utente).

    - La chiave "history" sarà iniettata nel dizionario e conterrà solo il valore specifico della storia conversazionale, estratto dalla memoria.

In [None]:
msg_input = {"input": "ciao, mi piace il rock anni '70!"}
result = conversation.invoke(msg_input)

# aggiorno la memoria
memory.chat_memory.add_user_message(msg_input["input"])
memory.chat_memory.add_ai_message(result.content)

In [None]:
print(result.content)

In [None]:
memory

In [None]:
msg_input = {"input": "elencami tre artisti che hanno contraddistinto questo genere musicale"}

result = conversation.invoke(msg_input)

# aggiorno la memoria
memory.chat_memory.add_user_message(msg_input["input"])
memory.chat_memory.add_ai_message(result.content)

print(result)

In [None]:
# Debugging della memoria
memory.load_memory_variables({})

In [None]:
from langchain_core.runnables.history import RunnableWithMessageHistory
from langchain_core.chat_history import InMemoryChatMessageHistory  # in-memory semplice

# 1) Chat Prompt
chat_prompt = ChatPromptTemplate.from_messages(
    [
        ("system", system_template),
        MessagesPlaceholder(variable_name="history"), # qui iniettiamo tutta la conversazione passata
        ("human", "{input}"),
    ]
)

# 2) Chain
base_chain = chat_prompt | llm 

# 3) Store per history per-sessione
store = {}  # sostituisci con Redis, DB, ecc. in produzione

def get_session_history(session_id: str):
    if session_id not in store:
        store[session_id] = InMemoryChatMessageHistory()
    return store[session_id]

# 4) Wrappa la catena con la gestione automatica della history
chain = RunnableWithMessageHistory(
    base_chain,
    get_session_history,
    input_messages_key="input",     # chiave dell’input utente
    history_messages_key="history", # deve matchare il MessagesPlaceholder
    # output_messages_key è opzionale: se omesso, salva l'AI message di default
)


In [None]:
# 5) Uso
session_id = "demo-123"  # es. id utente o thread
res1 = chain.invoke(
    {"input": "ciao, mi piace il rock anni '70!"},
    config={"configurable": {"session_id": session_id}},
)
print(res1.content)

# Nuovo turno: la history è già aggiornata automaticamente
res2 = chain.invoke(
    {"input": "Suggeriscimi 3 band e perché."},
    config={"configurable": {"session_id": session_id}},
)

<hr>    
    
# Parserizzazione degli Output

In [None]:
from langchain.prompts import PromptTemplate

template = """Agisci come un esperto Frontend Developer e concludi le tue frasi facendo riferimento all'importanza dell'accessibilità nel design.
Domanda: {input}
Risposta:"""

prompt = PromptTemplate.from_template(template)

from langchain_core.output_parsers import StrOutputParser

output_parser = StrOutputParser()

chain = prompt | llm | output_parser

chain.invoke({"input": "Mi piace la boxe!"})

### Oggetti Python con Pydantic

In [None]:
llm = ChatOpenAI(model="gpt-4o-mini",
                 api_key=os.getenv("OPENAI_API_KEY"),
                 temperature=0.7, max_tokens=1024, request_timeout=30)

In [64]:
from pydantic import BaseModel, Field, field_validator

class User(BaseModel):
    id: int = Field(description="user identification number")
    name: str = Field(description="user name")
    mail: str = Field(description="user mail address")
    
    @field_validator("mail")
    def is_valid(cls, field):
        if not "@" in field or "." not in field:
            raise ValueError("Invalid mail")
        return field

from langchain.output_parsers import PydanticOutputParser

parser = PydanticOutputParser(pydantic_object=User)

prompt = PromptTemplate(
    template="""Analizza il testo
{format_instructions}

Applica il parser su:
{query}
""",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

chain = prompt | llm | parser

In [None]:
print(parser.get_format_instructions())

In [65]:
query = "id: 123456, nominativo: Mario Rossi, e-mail: mario.rossi@gmail.com"

chain.invoke({"query": query})

User(id=123456, name='Mario Rossi', mail='mario.rossi@gmail.com')

In [66]:
query = ("Mario 123456 Rossi mario.rossi@gmail.com")

tizio=chain.invoke({"query": query})
tizio

User(id=123456, name='Mario Rossi', mail='mario.rossi@gmail.com')

In [67]:
tizio.name

'Mario Rossi'

In [68]:
query = ("Oggi Mario, che ha il badge n.123456, ha inviato una mail dall'indirizzo mario.rossi@gmail.com")

chain.invoke({"query": query})

User(id=123456, name='Mario', mail='mario.rossi@gmail.com')

In [69]:
raw_emails = """
Gentile Reparto,

stiamo completando una revisione dei dati identificativi dei nostri collaboratori e avremmo bisogno di alcune conferme.

In particolare, ci servirebbe verificare:

- Il numero di badge associato al sig. Chiapperini (che ci risulta essere 101090).

- Le attività principali svolte nell’ultimo trimestre.

- La correttezza dei dati di contatto ufficiali.

Vi chiediamo cortesemente di rispondere a questa mail entro la fine della settimana.

Grazie per la collaborazione,
Ufficio Risorse Umane

----------------------

Mail 2 – Reparto Operativo → Ufficio HR
Buongiorno,

in riferimento alla vostra richiesta:

Il sig. M. Chiapperini risulta registrato con il badge numero 101098, non 101090.

Nel corso dell’ultimo trimestre ha gestito:

- Supervisione magazzino e logistica.

- Coordinamento attività inventariali.

- Supporto nella migrazione del sistema gestionale.

I dati di contatto risultano confermati: marco.Chiapperini@openrai.com
 è l’indirizzo principale associato.

Cordiali saluti,
Responsabile Operativo

----------------------

Mail 3 – Ufficio HR → Reparto Operativo
Grazie della risposta,

abbiamo aggiornato i nostri registri interni con il badge 101098 e con le attività riportate.
Vorremmo chiedere ancora una conferma: il sig. Chiapperini continuerà a operare nello stesso reparto anche per il prossimo trimestre?

Cordiali saluti,
Ufficio Risorse Umane

----------------------

Mail 4 – Reparto Operativo → Ufficio HR
Confermiamo che Marco proseguirà con le stesse mansioni nel reparto Logistica e Coordinamento, almeno fino a conclusione del progetto di digitalizzazione.

Rimaniamo a disposizione per ulteriori chiarimenti.

Distinti saluti,
Responsabile Operativo

Vuoi che lo trasformi in un testo più realistico e lungo, tipo una vera catena di mail forward/reply (con “Re:” e “Fw:”, date e firme), oppure va bene questa simulazione “pulita” da presentazione?
"""

In [84]:
chain.invoke({"query": raw_emails})

KeyError: "Input to PromptTemplate is missing variables {'question'}.  Expected: ['question'] Received: ['query']\nNote: if you intended {question} to be part of the string and not a variable, please escape it with double curly braces like: '{{question}}'.\nFor troubleshooting, visit: https://python.langchain.com/docs/troubleshooting/errors/INVALID_PROMPT_INPUT "

### JSON Output Parser

In [71]:
from langchain_core.output_parsers import JsonOutputParser

parser = JsonOutputParser(pydantic_object=User)

chain = prompt | llm | parser

chain.invoke({"query": query})

{'id': 123456, 'name': 'Mario', 'mail': 'mario.rossi@gmail.com'}

In [72]:
# riuso delle istruzioni di formattazione di un parser già esistente

prompt = PromptTemplate(
    template="Estrai identificativo, nominativo e indirizzo mail\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

chain = prompt | llm | parser

chain.invoke({"query": query})

{'id': 123456, 'name': 'Mario', 'mail': 'mario.rossi@gmail.com'}

### Pandas Parser

In [73]:
import pandas as pd
from langchain.output_parsers import PandasDataFrameOutputParser

df = pd.DataFrame(
    {
        "model": ["Canon EOS D60", "Agfa ePhoto CL45", "Casio QV-R62", "Kodak P850"],
        "max_res": [3072, 1600, 2816, 2592],
        "eff_pixels": [6, 1, 4, 5],
    }
)

parser = PandasDataFrameOutputParser(dataframe=df)

In [74]:
df

Unnamed: 0,model,max_res,eff_pixels
0,Canon EOS D60,3072,6
1,Agfa ePhoto CL45,1600,1
2,Casio QV-R62,2816,4
3,Kodak P850,2592,5


In [75]:
print(parser.get_format_instructions())

The output should be formatted as a string as the operation, followed by a colon, followed by the column or row to be queried on, followed by optional array parameters.
1. The column names are limited to the possible columns below.
2. Arrays must either be a comma-separated list of numbers formatted as [1,3,5], or it must be in range of numbers formatted as [0..4].
3. Remember that arrays are optional and not necessarily required.
4. If the column is not in the possible columns or the operation is not a valid Pandas DataFrame operation, return why it is invalid as a sentence starting with either "Invalid column" or "Invalid operation".

As an example, for the formats:
1. String "column:num_legs" is a well-formatted instance which gets the column num_legs, where num_legs is a possible column.
2. String "row:1" is a well-formatted instance which gets row 1.
3. String "column:num_legs[1,2]" is a well-formatted instance which gets the column num_legs for rows 1 and 2, where num_legs is a p

In [76]:
llm = ChatOpenAI(
    model="gpt-4o-mini",
    openai_api_key=os.getenv("OPENAI_API_KEY"),
    temperature=0,
    max_tokens=1024,
    request_timeout=30
)

prompt = PromptTemplate(
    template="Answer the user query. Attention: don't use double quote where not needed.\n{format_instructions}\n{query}\n",
    input_variables=["query"],
    partial_variables={"format_instructions": parser.get_format_instructions()},
)

chain = prompt | llm | parser

In [77]:
df_query = "Retrieve the last column."

parser_output = chain.invoke({"query": df_query})
parser_output

{'eff_pixels': 0    6
 1    1
 2    4
 3    5
 Name: eff_pixels, dtype: int64}

In [78]:
df_query = "Retrieve the first column."

parser_output = chain.invoke({"query": df_query})

print(parser_output)

{'model': 0       Canon EOS D60
1    Agfa ePhoto CL45
2        Casio QV-R62
3          Kodak P850
Name: model, dtype: object}


In [79]:
df_query = "Recupera la media della colonna max_res dalle righe da 1 a 3."

parser_output = chain.invoke({"query": df_query})

print(parser_output)

{'mean': np.float64(2336.0)}


### Output Strutturato

In [80]:
from langchain.output_parsers import ResponseSchema, StructuredOutputParser

response_schemas = [
    ResponseSchema(  name="answer", description="answer to the user's question"),
    ResponseSchema(  name="source", description="source used to answer the user's question, should be a website.",    ),
]
output_parser = StructuredOutputParser.from_response_schemas(response_schemas)

In [81]:
format_instructions = output_parser.get_format_instructions()

prompt = PromptTemplate(
    template="answer the users question as best as possible.\n{format_instructions}\n{question}",
    input_variables=["question"],
    partial_variables={"format_instructions": format_instructions},
)

In [82]:
print(format_instructions)

The output should be a markdown code snippet formatted in the following schema, including the leading and trailing "```json" and "```":

```json
{
	"answer": string  // answer to the user's question
	"source": string  // source used to answer the user's question, should be a website.
}
```


In [83]:
chain = prompt | llm | output_parser

chain.invoke({"question": "capitale dell'italia?"})

{'answer': "La capitale dell'Italia è Roma.",
 'source': 'https://www.italia.it'}

### DateTime Parser

In [86]:
from langchain.output_parsers import DatetimeOutputParser

output_parser = DatetimeOutputParser()
template = """Answer the users question:

{question}

{format_instructions}"""

prompt = PromptTemplate.from_template(
    template,
    partial_variables={"format_instructions": output_parser.get_format_instructions()},
)

In [87]:
print(output_parser.get_format_instructions())

Write a datetime string that matches the following pattern: '%Y-%m-%dT%H:%M:%S.%fZ'.

Examples: 1492-10-15T16:40:11.965271Z, 1391-09-04T06:39:56.445358Z, 0625-07-14T04:01:01.991688Z

Return ONLY this string, no other words!


In [88]:
chain = prompt | llm | output_parser

output = chain.invoke({"question": "Quando è nato Steve Jobs?"})

print(output)

1955-02-24 00:00:00


### Enum Parser

In [92]:
from langchain.output_parsers.enum import EnumOutputParser
from enum import Enum

class Colors(Enum):
    BLACK = "Nero"
    GREEN = "Verde"
    BLUE = "Blu"
    GRAY = "Grigio"
    BROWN = "Marrone"

parser = EnumOutputParser(enum=Colors)

prompt = PromptTemplate.from_template(
    """Dimmi qual è il colore degli occhi di questa persona?

> Persona: {person}

Attenzione! Atteiniti stettamente a queste istruzioni: {instructions} seleziona sola una delle opzioni"""
).partial(instructions=parser.get_format_instructions())

chain = prompt | llm | parser

print(chain.invoke({"person": "Fabrizio De André"}))

Colors.BLUE


In [93]:
parser.get_format_instructions()

'Select one of the following options: Nero, Verde, Blu, Grigio, Marrone'

### Lista di valori

In [94]:
from langchain.output_parsers import CommaSeparatedListOutputParser

output_parser = CommaSeparatedListOutputParser()

format_instructions = output_parser.get_format_instructions()
prompt = PromptTemplate(
    template="List five {subject}.\n{format_instructions}",
    input_variables=["subject"],
    partial_variables={"format_instructions": format_instructions},
)

In [95]:
print(format_instructions)

Your response should be a list of comma separated values, eg: `foo, bar, baz` or `foo,bar,baz`


In [96]:
chain = prompt | llm | output_parser

print(chain.invoke({"subject": "elenca i pianeti del sistema solare in ordine dal più vicino al più lontano dal Sole"}))

['Mercurio', 'Venere', 'Terra', 'Marte', 'Giove', 'Saturno', 'Urano', 'Nettuno']


### Gradio Example

In [None]:
import gradio as gr

def echo(message, history):
    return message

demo = gr.ChatInterface(fn=echo, type="messages", examples=["hello", "ciao", "salve"], title="Echo Bot")
demo.launch()