# **Laboratorio 11: LLM y Agentes Aut√≥nomos ü§ñ**

MDS7202: Laboratorio de Programaci√≥n Cient√≠fica para Ciencia de Datos

### **Cuerpo Docente:**

- Profesores: Ignacio Meza, Sebasti√°n Tinoco
- Auxiliar: Eduardo Moya
- Ayudantes: Nicol√°s Ojeda, Melanie Pe√±a, Valentina Rojas

### **Equipo: SUPER IMPORTANTE - notebooks sin nombre no ser√°n revisados**

- Nombre de alumno 1: Carolina Nu√±ez
- Nombre de alumno 2: Alonso Uribe

### **Link de repositorio de GitHub:** [Repositorioüíª](https://github.com/carinunez/Labs_MDS)

## **Temas a tratar**

- Reinforcement Learning
- Large Language Models

## **Reglas:**

- **Grupos de 2 personas**
- Cualquier duda fuera del horario de clases al foro. Mensajes al equipo docente ser√°n respondidos por este medio.
- Prohibidas las copias.
- Pueden usar cualquer matrial del curso que estimen conveniente.

### **Objetivos principales del laboratorio**

- Resoluci√≥n de problemas secuenciales usando Reinforcement Learning
- Habilitar un Chatbot para entregar respuestas √∫tiles usando Large Language Models.

El laboratorio deber√° ser desarrollado sin el uso indiscriminado de iteradores nativos de python (aka "for", "while"). La idea es que aprendan a exprimir al m√°ximo las funciones optimizadas que nos entrega `pandas`, las cuales vale mencionar, son bastante m√°s eficientes que los iteradores nativos sobre DataFrames.

## **1. Reinforcement Learning (2.0 puntos)**

En esta secci√≥n van a usar m√©todos de RL para resolver dos problemas interesantes: `Blackjack` y `LunarLander`.

In [None]:
!pip install -qqq gymnasium stable_baselines3
!pip install -qqq swig
!pip install -qqq gymnasium[box2d]

### **1.1 Blackjack (1.0 puntos)**

<p align="center">
  <img src="https://www.recreoviral.com/wp-content/uploads/2016/08/s3.amazonaws.com-Math.gif"
" width="400">
</p>

La idea de esta subsecci√≥n es que puedan implementar m√©todos de RL y as√≠ generar una estrategia para jugar el cl√°sico juego Blackjack y de paso puedan ~~hacerse millonarios~~ aprender a resolver problemas mediante RL.

Comencemos primero preparando el ambiente. El siguiente bloque de c√≥digo transforma las observaciones del ambiente a `np.array`:


In [None]:
import gymnasium as gym
from gymnasium.spaces import MultiDiscrete
import numpy as np

class FlattenObservation(gym.ObservationWrapper):
    def __init__(self, env):
        super(FlattenObservation, self).__init__(env)
        self.observation_space = MultiDiscrete(np.array([32, 11, 2]))

    def observation(self, observation):
        return np.array(observation).flatten()

# Create and wrap the environment
env = gym.make("Blackjack-v1")
env = FlattenObservation(env)

#### **1.1.1 Descripci√≥n de MDP (0.2 puntos)**

Entregue una breve descripci√≥n sobre el ambiente [Blackjack](https://gymnasium.farama.org/environments/toy_text/blackjack/) y su formulaci√≥n en MDP, distinguiendo de forma clara y concisa los estados, acciones y recompensas.

`escriba su respuesta ac√°`

#### **1.1.2 Generando un Baseline (0.2 puntos)**

Simule un escenario en donde se escojan acciones aleatorias. Repita esta simulaci√≥n 5000 veces y reporte el promedio y desviaci√≥n de las recompensas. ¬øC√≥mo calificar√≠a el performance de esta pol√≠tica? ¬øC√≥mo podr√≠a interpretar las recompensas obtenidas?

#### **1.1.3 Entrenamiento de modelo (0.2 puntos)**

A partir del siguiente [enlace](https://stable-baselines3.readthedocs.io/en/master/guide/algos.html), escoja un modelo de `stable_baselines3` y entrenelo para resolver el ambiente `Blackjack`.

#### **1.1.4 Evaluaci√≥n de modelo (0.2 puntos)**

Repita el ejercicio 1.1.2 pero utilizando el modelo entrenado. ¬øC√≥mo es el performance de su agente? ¬øEs mejor o peor que el escenario baseline?

#### **1.1.5 Estudio de acciones (0.2 puntos)**

Genere una funci√≥n que reciba un estado y retorne la accion del agente. Luego, use esta funci√≥n para entregar la acci√≥n escogida frente a los siguientes escenarios:

- Suma de cartas del agente es 6, dealer muestra un 7, agente no tiene tiene un as
- Suma de cartas del agente es 19, dealer muestra un 3, agente tiene tiene un as

¬øSon coherentes sus acciones con las reglas del juego?

Hint: ¬øA que clase de python pertenecen los estados? Pruebe a usar el m√©todo `.reset` para saberlo.

### **1.2 LunarLander**

<p align="center">
  <img src="https://i.redd.it/097t6tk29zf51.jpg"
" width="400">
</p>

Similar a la secci√≥n 2.1, en esta secci√≥n usted se encargar√° de implementar una gente de RL que pueda resolver el ambiente `LunarLander`.

Comencemos preparando el ambiente:


In [None]:
import gymnasium as gym
env = gym.make("LunarLander-v2", render_mode = "rgb_array", continuous = True) # notar el par√°metro continuous = True

Noten que se especifica el par√°metro `continuous = True`. ¬øQue implicancias tiene esto sobre el ambiente?

Adem√°s, se le facilita la funci√≥n `export_gif` para el ejercicio 2.2.4:

In [None]:
import imageio
import numpy as np

def export_gif(model, n = 5):
  '''
  funci√≥n que exporta a gif el comportamiento del agente en n episodios
  '''
  images = []
  for episode in range(n):
    obs = model.env.reset()
    img = model.env.render()
    done = False
    while not done:
      images.append(img)
      action, _ = model.predict(obs)
      obs, reward, done, info = model.env.step(action)
      img = model.env.render(mode="rgb_array")

  imageio.mimsave("agent_performance.gif", [np.array(img) for i, img in enumerate(images) if i%2 == 0], fps=29)

#### **1.2.1 Descripci√≥n de MDP (0.2 puntos)**

Entregue una breve descripci√≥n sobre el ambiente [LunarLander](https://gymnasium.farama.org/environments/box2d/lunar_lander/) y su formulaci√≥n en MDP, distinguiendo de forma clara y concisa los estados, acciones y recompensas. ¬øComo se distinguen las acciones de este ambiente en comparaci√≥n a `Blackjack`?

Nota: recuerde que se especific√≥ el par√°metro `continuous = True`

`escriba su respuesta ac√°`

#### **1.2.2 Generando un Baseline (0.2 puntos)**

Simule un escenario en donde se escojan acciones aleatorias. Repita esta simulaci√≥n 10 veces y reporte el promedio y desviaci√≥n de las recompensas. ¬øC√≥mo calificar√≠a el performance de esta pol√≠tica?

#### **1.2.3 Entrenamiento de modelo (0.2 puntos)**

A partir del siguiente [enlace](https://stable-baselines3.readthedocs.io/en/master/guide/algos.html), escoja un modelo de `stable_baselines3` y entrenelo para resolver el ambiente `LunarLander` **usando 10000 timesteps de entrenamiento**.

#### **1.2.4 Evaluaci√≥n de modelo (0.2 puntos)**

Repita el ejercicio 1.2.2 pero utilizando el modelo entrenado. ¬øC√≥mo es el performance de su agente? ¬øEs mejor o peor que el escenario baseline?

#### **1.2.5 Optimizaci√≥n de modelo (0.2 puntos)**

Repita los ejercicios 1.2.3 y 1.2.4 hasta obtener un nivel de recompensas promedio mayor a 50. Para esto, puede cambiar manualmente par√°metros como:
- `total_timesteps`
- `learning_rate`
- `batch_size`

Una vez optimizado el modelo, use la funci√≥n `export_gif` para estudiar el comportamiento de su agente en la resoluci√≥n del ambiente y comente sobre sus resultados.

Adjunte el gif generado en su entrega (mejor a√∫n si adem√°s adjuntan el gif en el markdown).

## **2. Large Language Models (4.0 puntos)**

En esta secci√≥n se enfocar√°n en habilitar un Chatbot que nos permita responder preguntas √∫tiles a trav√©s de LLMs.

### **2.0 Configuraci√≥n Inicial**
<!--
<p align="center">
  <img src="https://media1.tenor.com/m/uqAs9atZH58AAAAd/config-config-issue.gif"
" width="400">
</p> -->

Como siempre, cargamos todas nuestras API KEY al entorno:

In [11]:
import getpass
import os

if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("Enter your Google AI API key: ")

if "TAVILY_API_KEY" not in os.environ:
    os.environ["TAVILY_API_KEY"] = getpass.getpass("Enter your Tavily API key: ")

Enter your Google AI API key: ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑
Enter your Tavily API key: ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑


### **2.1 Retrieval Augmented Generation (1.5 puntos)**

<!-- <p align="center">
  <img src="https://y.yarn.co/218aaa02-c47e-4ec9-b1c9-07792a06a88f_text.gif"
" width="400">
</p> -->

El objetivo de esta subsecci√≥n es que habiliten un chatbot que pueda responder preguntas usando informaci√≥n contenida en documentos PDF a trav√©s de **Retrieval Augmented Generation.**

#### **2.1.1 Reunir Documentos (0 puntos)**

Reuna documentos PDF sobre los que hacer preguntas siguiendo las siguientes instrucciones:
  - 2 documentos .pdf como m√≠nimo.
  - 50 p√°ginas de contenido como m√≠nimo entre todos los documentos.
  - Ideas para documentos: Documentos relacionados a temas acad√©micos, laborales o de ocio. Aprovechen este ejercicio para construir algo √∫til y/o relevante para ustedes!
  - Deben ocupar documentos reales, no pueden utilizar los mismos de la clase.
  - Deben registrar sus documentos en la siguiente [planilla](https://docs.google.com/spreadsheets/d/1Hy1w_dOiG2UCHJ8muyxhdKPZEPrrL7BNHm6E90imIIM/edit?usp=sharing). **NO PUEDEN USAR LOS MISMOS DOCUMENTOS QUE OTRO GRUPO**
  - **Recuerden adjuntar los documentos en su entrega**.

In [5]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [1]:
%pip install --upgrade --quiet PyPDF2

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/232.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[90m‚ï∫[0m[90m‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m204.8/232.6 kB[0m [31m5.8 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m232.6/232.6 kB[0m [31m4.6 MB/s[0m eta [36m0:00:00[0m
[?25h

In [2]:
%pip install --upgrade --quiet  langchain-google-genai

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/41.3 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m41.3/41.3 kB[0m [31m1.7 MB/s[0m eta [36m0:00:00[0m
[?25h

In [3]:
%pip install --upgrade --quiet faiss-cpu langchain_community pypdf

[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m27.5/27.5 MB[0m [31m63.6 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m2.4/2.4 MB[0m [31m67.7 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m298.0/298.0 kB[0m [31m21.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m3.1/3.1 MB[0m [31m79.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m49.5/49.5 kB[0m [31m3.2 MB/s[0m eta [36m0:00:00[0m
[?25h

In [12]:
import PyPDF2

doc_paths = ['/content/gdrive/MyDrive/pdf_LLM/506.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/La-guia-peq-cambios-castella.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/Manual_basico_N_clinica_y_Dietetica_Valencia_2012.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/food-for-thought-mental-health-nutrition-briefing-march-2017.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/nutrients-14-00750.pdf'] # rellenar con los path a sus documentos

assert len(doc_paths) >= 2, "Deben adjuntar un m√≠nimo de 2 documentos"

total_paginas = sum(len(PyPDF2.PdfReader(open(doc, "rb")).pages) for doc in doc_paths)
assert total_paginas >= 50, f"P√°ginas insuficientes: {total_paginas}"

#### **2.1.2 Vectorizar Documentos (0.2 puntos)**

Vectorice los documentos y almacene sus representaciones de manera acorde.

In [13]:
from langchain_community.document_loaders import PyPDFLoader

docs = PyPDFLoader(doc_paths[-1]).load()

for doc in doc_paths[:-1]:
  new_doc = PyPDFLoader(doc).load()
  docs.extend(new_doc)


In [14]:
# Splits docs in chunks
from langchain_text_splitters import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs) # dividir documentos en chunks

In [15]:
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_community.vectorstores import FAISS

embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
vectorstore

<langchain_community.vectorstores.faiss.FAISS at 0x7da76aec21a0>

#### **2.1.3 Habilitar RAG (0.3 puntos)**

Habilite la soluci√≥n RAG a trav√©s de una *chain* y gu√°rdela en una variable.

In [19]:
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 3}, # n¬∞ documentos a recuperar
                                     )

# Funcion para corregir formato
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

retriever_chain = retriever | format_docs # chain
print(retriever_chain.invoke("lista de verduras con mayor contenido en fibra"))

MANUAL B√ÅSICO DE NUTRICI√ìN CL√çNICA Y DIET√âTICA
76
tatas produce una respuesta gluc√©mica del 70% respecto a una cantidad equivalente de pan blanco. La utili-
dad de este √≠ndice pierde parte de su valor debido a que las comidas incluyen mezclas de diversos alimentos.
2.2 Fibra. Es un HC complejo, no absorbible, que se encuentra principalmente en verduras, hortalizas, le-
gumbres, cereales y frutas. Se recomienda una ingesta de 20-35 g por d√≠a (10-15 g de fibra cada 1000 kcal/

CAP√çTULO 2. DIET√âTICA Y DIETOTERAPIA
47
GRUPO DE LAS VERDURAS Y HORTALIZAS
A pesar de que las verduras y las hortalizas forman una amplia gama de alimentos, pueden ser reunidas en 
un mismo grupo, ya que los nutrientes que aportan son similares. Son alimentos en general de bajo conteni-
do energ√©tico, ya que casi un 80% de su composici√≥n es agua. Aportan vitaminas A, C, √°cido f√≥lico, betaca-

rotenos y otros carotenos (licopeno, alfacaroteno), adem√°s de flavonoides, compuestos fen√≥licos y clorofila 


In [20]:
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash", # modelo de lenguaje
    temperature=0.2, # probabilidad de "respuestas creativas"
    max_tokens=None, # sin tope de tokens
    timeout=None, # sin timeout
    max_retries=2, # n√∫mero m√°ximo de intentos
)

# Entrego contexto para las respuestas
rag_template = '''
Eres un asistente experto en nutrici√≥n y salud. Haces recomendaciones sobre alimentos
a consumir seg√∫n el contexto que se te entrega.
Tu √∫nico rol es contestar preguntas del usuario a partir de informaci√≥n relevante que te sea proporcionada.
Responde siempre de la forma m√°s completa posible y usando toda la informaci√≥n entregada.
Responde s√≥lo lo que te pregunten a partir de la informaci√≥n relevante, NUNCA inventes una respuesta.
Responde en espa√±ol, a menos que se te indique lo contrario.

Informaci√≥n relevante: {context}
Pregunta: {question}
Respuesta √∫til:
'''
rag_prompt = PromptTemplate.from_template(rag_template)


from langchain_core.runnables import RunnablePassthrough

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

question = "que frutas recomiendas para la deshidrataci√≥n?"
response = rag_chain.invoke(question)
print(response)


La informaci√≥n proporcionada no incluye recomendaciones espec√≠ficas de frutas para la deshidrataci√≥n.  Solo menciona que las frutas y hortalizas, en general, contribuyen a una buena hidrataci√≥n debido a su contenido de agua.



In [15]:
# question = "entregame 5 verduras con alto contenido en fibra y su cantidad, si dispones de ella'"
# response = rag_chain.invoke(question)
# print(response)

In [21]:
question = "que alimentos recomeindas para reducir la obesidad"
response = rag_chain.invoke(question)
print(response)

Para reducir la obesidad, se recomienda reducir el aporte cal√≥rico global y la ingesta de grasas.  Espec√≠ficamente, se sugiere consumir:

* **Pescado:** Dos o m√°s raciones a la semana (excepto filetes fritos comerciales), por su aporte de √°cidos grasos poliinsaturados n-3.  Se mencionan espec√≠ficamente las conservas de pescado en aceite de oliva.

* **Carnes magras:** Conejo, pollo o pavo sin piel (asado, frito en aceite de oliva o al horno).  La ternera, el cerdo magro y el jam√≥n serrano se pueden consumir suprimiendo la grasa visible.

* **Huevos:**  2 a la semana.

* **Frutos secos:** Nueces naturales diariamente.

* **Frutas y verduras:** Frescas a diario (naranjas, fresas, kiwi, tomates, zanahorias, lechuga, etc.).


Se deben restringir la sal y alimentos salados, el az√∫car y alimentos y bebidas azucaradas, la carne roja y procesada, y los alimentos ultraprocesados.



In [22]:
print(rag_chain.invoke('recomendaciones de meriendas dulces'))

Bas√°ndome en la informaci√≥n proporcionada, para una merienda dulce y saludable se podr√≠an considerar las siguientes opciones, evitando siempre el az√∫car a√±adido:

* **Melocot√≥n:**  Se puede consumir solo como fruta fresca.
* **Naranja:** Se puede consumir sola como fruta fresca.  Tambi√©n se menciona la combinaci√≥n de naranja con clavo y canela en rama, lo que podr√≠a ser una opci√≥n arom√°tica.
* **Mandarina:** Se puede consumir sola como fruta fresca, o combinada con albahaca (aunque no se especifica c√≥mo).
* **Manzana √°cida:** Se puede consumir sola o combinada con lim√≥n.

La informaci√≥n tambi√©n sugiere usar fruta muy madura o fruta desecada (pasas, ciruelas, orejones, d√°tiles) como alternativa al az√∫car en recetas dulces.  Sin embargo, no se proporcionan recetas espec√≠ficas.  Se recomienda consultar las recetas saludables del "Canal Salut" mencionado en la informaci√≥n para obtener ideas m√°s concretas.



#### **2.1.4 Verificaci√≥n de respuestas (0.5 puntos)**

Genere un listado de 3 tuplas ("pregunta", "respuesta correcta") y analice la respuesta de su soluci√≥n para cada una. ¬øSu soluci√≥n RAG entrega las respuestas que esperaba?

Ejemplo de tupla:
- Pregunta: ¬øQui√©n es el presidente de Chile?
- Respuesta correcta: El presidente de Chile es Gabriel Boric

In [47]:
referencia[0][1]['respuesta']

'Frutas.Verduras.Granos integrales.Legumbres, como frijoles y       guisantes. Productos l√°cteos bajos en grasa, como leche y queso.'

In [54]:
referencia = [
    ({'pregunta':'que alimentos debe tener la dieta de una persona con diabetes?'},
      {'respuesta':'Frutas.Verduras.Granos integrales.Legumbres, como frijoles y \
      guisantes. Productos l√°cteos bajos en grasa, como leche y queso.'}),

    ({'pregunta':'alimentos recomendados para la deshidrataci√≥n'},
     {'respuesta': "Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.\
                    Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verduras,\
                    sopas, gelatinas, paletas de helado y otros alimentos hidratados"}),
    ({'pregunta':'que alimentos recomindas para reducir la obesidad'},
     {'respuesta':'Incluir en la dieta 2-3 raciones de fruta al d√≠a, repartidas durante la jornada tanto como postres, \
     tentempi√©s o completando un buen desayuno. Incluir 2 raciones de verduras crudas o cocidas al d√≠a. \
     Seleccionar prote√≠nas magras (pescados blancos, carnes blancas) en cocciones sencillas, como a la \
     plancha, brasa, horno, papillote, hervidos, vapor o airfryer. Disminuir las cantidades de sal y \
      az√∫car a√±adido a los alimentos. Beber por lo menos entre 1,5 y 2 litros de agua al d√≠a. \
      Planificar como m√≠nimo 5 men√∫s a la semana para evitar picoteos u otras opciones menos saludables.'})]

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0]['pregunta'])
  print('Respuesta de ref: ', ref[1]['respuesta'])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]['pregunta']))
  print('---------------------------------------------------------------------')

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y       guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes tipo I o II (requiriendo entre 1500 y 2500 Kcals) debe incluir:

* **Pan, cereales, pastas, legumbres, arroz y verduras:**  Estos aportan fibra, especialmente fibra soluble, beneficiosa para el perfil gluc√©mico.

* **Frutas:**  Aportan gl√∫cidos sencillos y fibra.  Sin embargo, se debe tener precauci√≥n con las frutas √°cidas como la naranja y las flatulentas como el mel√≥n y la sand√≠a.

* **Leche:**  Aporta gl√∫cidos sencillos.

La distribuci√≥n de las comidas debe ajustarse a la pauta de insulina del paciente (si es insulinodependiente).  Se debe evitar o limitar el consumo de alimentos flatulentos (cebolla cruda, alcachofa, col, coliflor, coles de Bruselas, br√≥culi, mel√≥n, sand√≠a, legumbres)  y  la

#### **2.1.5 Sensibilidad de Hiperpar√°metros (0.5 puntos)**

Extienda el an√°lisis del punto 2.1.4 analizando c√≥mo cambian las respuestas entregadas cambiando los siguientes hiperpar√°metros:
- `Tama√±o del chunk`. (*¬øC√≥mo repercute que los chunks sean mas grandes o chicos?*)
- `La cantidad de chunks recuperados`. (*¬øQu√© pasa si se devuelven muchos/pocos chunks?*)
- `El tipo de b√∫squeda`. (*¬øC√≥mo afecta el tipo de b√∫squeda a las respuestas de mi RAG?*)

In [55]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=50)
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding)

retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})

retriever_chain = retriever | format_docs # chain

rag_prompt = PromptTemplate.from_template(rag_template)

rag_chain = (
    {"context": retriever_chain, "question": RunnablePassthrough()}
    | rag_prompt | llm | StrOutputParser() )

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0]['pregunta'])
  print('Respuesta de ref: ', ref[1]['respuesta'])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]['pregunta']))
  print('---------------------------------------------------------------------')

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y       guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  De acuerdo a la informaci√≥n proporcionada, la dieta de una persona con diabetes tipo I o tipo II (requiriendo entre 1500 y 2500 Kcals) debe incluir alimentos frescos y poco procesados, principalmente vegetales.  Se deben evitar los alimentos de baja calidad nutricional y las bebidas alcoh√≥licas.  La informaci√≥n tambi√©n menciona, como ejemplos de alimentos adecuados, las legumbres y las frutas √°cidas como la naranja.  Es importante destacar que los cambios diet√©ticos deben ser progresivos para asegurar el mantenimiento a largo plazo de la dieta.  La informaci√≥n no especifica otros alimentos que deban incluirse o excluirse de la dieta.

---------------------------------------------------------------------
Pregunta:  alimentos recomendado

In [56]:
# Chunck de mayor tama√±o
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=50)
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding)

retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": 3})

retriever_chain = retriever | format_docs # chain

rag_prompt = PromptTemplate.from_template(rag_template)

rag_chain = (
    {"context": retriever_chain, "question": RunnablePassthrough()}
    | rag_prompt | llm | StrOutputParser() )

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0]['pregunta'])
  print('Respuesta de ref: ', ref[1]['respuesta'])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]['pregunta']))
  print('---------------------------------------------------------------------')

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y       guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe ser individualizada, considerando su estado nutricional, estilo de vida y objetivos terap√©uticos.  Sin embargo, en general, debe  alcanzar y mantener un control metab√≥lico normal a trav√©s del balance entre dieta, ejercicio y tratamiento (oral o insulina).  Para ello, la dieta debe tener una distribuci√≥n porcentual de nutrientes sobre el valor cal√≥rico total de: 50-55% de gl√∫cidos, 15-20% de prote√≠nas y 30% de l√≠pidos.

Los gl√∫cidos deben provenir principalmente de carbohidratos complejos como pan, cereales, pastas, legumbres, arroz y verduras.  Las frutas y la leche aportan gl√∫cidos sencillos.  Es importante considerar el contenido de fibra, especialmente la fibra soluble, que tiene efectos 

Al aumentar el tama√±o del chunk, se tiene m√°s contexto por lo que tiene sentido que las respuestas entregadas usando chunk_size=1000, sean m√°s completas.

In [59]:
# Cambio numero de docs a recuperar
num_docs_recuperar = [1, 4]
for k in num_docs_recuperar:
    text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
    splits = text_splitter.split_documents(docs)
    embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
    vectorstore = FAISS.from_documents(documents=splits, embedding=embedding)

    retriever = vectorstore.as_retriever(search_type="similarity", search_kwargs={"k": k})

    retriever_chain = retriever | format_docs # chain

    rag_prompt = PromptTemplate.from_template(rag_template)

    rag_chain = (
        {"context": retriever_chain, "question": RunnablePassthrough()}
        | rag_prompt | llm | StrOutputParser() )

    for i, ref in enumerate(referencia):
      print('chuck recuperados :', k)
      print('Pregunta: ', ref[0]['pregunta'])
      print('Respuesta de ref: ', ref[1]['respuesta'])
      print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]['pregunta']))
      print('---------------------------------------------------------------------')

chuck recuperados : 1
Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y       guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe incluir pan, cereales, pastas, legumbres, arroz y verduras.  Estos alimentos, junto con las frutas, aportan fibra, especialmente fibra soluble, que tiene efectos beneficiosos sobre el perfil gluc√©mico.  Adem√°s, las frutas y la leche aportar√°n gl√∫cidos sencillos.  Los horarios de las comidas deben ajustarse seg√∫n la pauta de insulina.

---------------------------------------------------------------------
chuck recuperados : 1
Pregunta:  alimentos recomendados para la deshidrataci√≥n
Respuesta de ref:  Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.                    Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verdu

Tal como ocurri√≥ cuando se aument√≥ el tama√±o de los chunks, al aumentar el n√∫mero de documentos por recuperar tambi√©n mejoran las respuestas entregadas.

In [61]:
# Tipo de busqueda MMR
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50)
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001")
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding)

retriever = vectorstore.as_retriever(search_type="mmr", search_kwargs={"k": 3})

retriever_chain = retriever | format_docs # chain

rag_prompt = PromptTemplate.from_template(rag_template)

rag_chain = (
    {"context": retriever_chain, "question": RunnablePassthrough()}
    | rag_prompt | llm | StrOutputParser() )

for i, ref in enumerate(referencia):
  print('Tipo de b√∫squeda :', 'mmr')
  print('Pregunta: ', ref[0]['pregunta'])
  print('Respuesta de ref: ', ref[1]['respuesta'])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]['pregunta']))
  print('---------------------------------------------------------------------')

Tipo de b√∫squeda : mmr
Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y       guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes mellitus tipo I o tipo II, que requiera entre 1500 y 2500 kcal, debe contener  pan, cereales, pastas, legumbres, arroz y verduras,  para contribuir al aporte de fibra, especialmente fibra soluble, que beneficia el perfil gluc√©mico.  Las frutas y la leche aportar√°n gl√∫cidos sencillos.  La cantidad de carbohidratos, prote√≠nas y grasas variar√° seg√∫n la dieta prescrita:

* **Dieta Diab√©tica 1500:** 20 raciones de carbohidratos, 6 raciones de prote√≠nas y 5 raciones de grasas.
* **Dieta Diab√©tica 1800:** 24 raciones de carbohidratos, 7 raciones de prote√≠nas y 5,5 raciones de grasas.
* **Dieta Diab√©tica 2000:** 27 raciones de carbohidratos, 7.5 raciones de prote√≠nas y 7.5 racio

Al buscar por Maximal marginal Relevance (MMR), se obtienen respuestas m√°s nutridas y diversas respecto a las entregadas mediante la b√∫squeda por similitud.

### **2.2 Agentes (1.0 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/rcqnN2aJCSEAAAAd/secret-agent-man.gif"
" width="400">
</p>

Similar a la secci√≥n anterior, en esta secci√≥n se busca habilitar **Agentes** para obtener informaci√≥n a trav√©s de tools y as√≠ responder la pregunta del usuario.

#### **2.2.1 Tool de Tavily (0.2 puntos)**

Generar una *tool* que pueda hacer consultas al motor de b√∫squeda **Tavily**.

In [70]:
from langchain_community.tools.tavily_search import TavilySearchResults
# inicializamos tool
search_tavily = TavilySearchResults(max_results = 1, include_raw_content=True)
tools = [search_tavily]

In [71]:
search_tavily.invoke('qu√© frutas tienen alto contenido de fibra?')

[{'url': 'https://saludresponde.org/nutricion/10-frutas-con-mas-fibra/',
  'content': 'Los alimentos ricos en fibra son eliminados m√°s f√°cilmente por el organismo, favoreciendo la eliminaci√≥n de toxinas y mantener la salud del intestino. Es ah√≠ que muchas de las frutas guardan la mayor√≠a de sus fibras, como es el caso de la manzana y de la pera, por ejemplo. La pera es una de las frutas con m√°s fibra que usted puede encontrar en el mercado. La frambuesa contiene m√°s antioxidantes que la mayor√≠a de las frutas, siendo considerada por los investigadores uno de los mejores alimentos naturales para la prevenci√≥n y el tratamiento del c√°ncer. Adem√°s de delicioso y rico en fibras, el kiwi es otro de los beneficios para la salud.'}]

#### **2.2.2 Tool de Wikipedia (0.2 puntos)**

Generar una *tool* que pueda hacer consultas a **Wikipedia**.

*Hint: Le puede ser de ayuda el siguiente [link](https://python.langchain.com/v0.1/docs/modules/tools/).*

In [64]:
%pip install wikipedia

Collecting wikipedia
  Downloading wikipedia-1.4.0.tar.gz (27 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: wikipedia
  Building wheel for wikipedia (setup.py) ... [?25l[?25hdone
  Created wheel for wikipedia: filename=wikipedia-1.4.0-py3-none-any.whl size=11679 sha256=702a29ee4aee58ef25c34d0f034b1c8dd614dac2f4e20792a4362c2551fec298
  Stored in directory: /root/.cache/pip/wheels/5e/b6/c5/93f3dec388ae76edc830cb42901bb0232504dfc0df02fc50de
Successfully built wikipedia
Installing collected packages: wikipedia
Successfully installed wikipedia-1.4.0


In [74]:
from langchain_community.tools import WikipediaQueryRun
from langchain_community.utilities import WikipediaAPIWrapper

api_wrapper = WikipediaAPIWrapper(top_k_results=1,
                                  doc_content_chars_max=600,
                                  lang='es' # respuestas en espa√±ol
                                  )
search_wiki = WikipediaQueryRun(api_wrapper=api_wrapper)

tools += [search_wiki]

In [75]:
search_wiki.invoke('qu√© frutas tienen alto contenido de fibra?')

'Page: Fruta\nSummary: Por fruta se entiende aquellos frutos comestibles obtenidos de plantas cultivadas o silvestres que, por su sabor generalmente dulce y acidulado, su aroma intenso y agradable, y sus propiedades nutritivas, suelen consumirse mayormente en su estado fresco, como jugo o como postre (y en menor medida, en otras preparaciones), una vez alcanzada la madurez organol√©ptica, o luego de ser sometidos a cocci√≥n.[1]\u200b\nLa definici√≥n del diccionario de la Real Academia Espa√±ola no es espec√≠fica: "fruto comestible de ciertas plantas cultivadas; p. ej. la pera, la guinda, la fresa, etc."[2]'

#### **2.2.3 Crear Agente (0.3 puntos)**

Crear un agente que pueda responder preguntas preguntas usando las *tools* antes generadas. Aseg√∫rese que su agente responda en espa√±ol. Por √∫ltimo, guarde el agente en una variable.

In [111]:
from langchain.agents import create_react_agent, AgentExecutor
from langchain import hub


react_prompt = hub.pull("hwchase17/react") + PromptTemplate.from_template(
                                                """
                                                Responde utilizando search_wiki si la pregunta puede ser
                                                respondida mediante b√∫squedas en Wikipedia, sino utiliza
                                                search_tavily.
                                                No respondas, ni inventes respuestas, en caso de que la
                                                pregunta no pueda ser respondida con ninguna tool.
                                                Responde en espa√±ol.
                                                """)


agente = create_react_agent(llm, tools, react_prompt) # primero inicializamos el agente ReAct
agente_executor = AgentExecutor(agent=agente, tools=tools,
                                verbose=True,
                                return_intermediate_steps=True,
                                max_iterations=5)



#### **2.2.4 Verificaci√≥n de respuestas (0.3 puntos)**

Pruebe el funcionamiento de su agente y aseg√∫rese que el agente est√© ocupando correctamente las tools disponibles. ¬øEn qu√© casos el agente deber√≠a ocupar la tool de Tavily? ¬øEn qu√© casos deber√≠a ocupar la tool de Wikipedia?

En caso de que se est√© buscando una respuesta, lo ideal es usar la tool de Tavily que busca, filtra y extrae informaci√≥n desde distintas fuentes en l√≠nea. La tool de Wikipedia, busca informaci√≥n solo a partir  de p√°ginas de wikipedia, por lo que podr√≠a estar desactualizada o con errores.

In [100]:
agente_executor.invoke({'input':'qu√© pas√≥ con Cathy Barriga?'})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: This question asks about what happened to Cathy Barriga.  A Wikipedia search should provide information about her recent activities or life events.

Action: wikipedia
Action Input: Cathy Barriga
[0m[38;5;200m[1;3mPage: Cathy Barriga
Summary: Cathy Carolina Barriga Guerra (nacida Catherine Carolina Barriga Guerra; Santiago, 9 de abril de 1973)[6]‚Äã[7]‚Äã es una figura televisiva, licenciada en psicolog√≠a y pol√≠tica chilena.[8]‚Äã[3]‚Äã Entre diciembre de 2016 y junio de 2021 se desempe√±√≥ como alcaldesa de Maip√∫.[9]‚Äã A ra√≠z de sus gestiones como alcaldesa, en enero de 2024 fue formalizada por delitos de fraude al fisco y falsificaci√≥n de instrumento p√∫blico, quedando con arresto domiciliario mientras prosiguen su juicio.[10]‚Äã En noviembre de ese mismo a√±o, Barriga fue puesta en prisi√≥n preventiva.[5]‚Äã[0m[32;1m[1;3mThought:The Wikipedia article provides a summary of what happened to Cathy Barriga.

{'input': 'qu√© pas√≥ con Cathy Barriga?',
 'output': 'Cathy Barriga, alcaldesa de Maip√∫ entre 2016 y 2021, fue formalizada en enero de 2024 por delitos de fraude al fisco y falsificaci√≥n de instrumento p√∫blico.  Inicialmente se le otorg√≥ arresto domiciliario, pero en noviembre de 2024 fue puesta en prisi√≥n preventiva mientras contin√∫a su juicio.',
 'intermediate_steps': [(AgentAction(tool='wikipedia', tool_input='Cathy Barriga\n', log='Thought: This question asks about what happened to Cathy Barriga.  A Wikipedia search should provide information about her recent activities or life events.\n\nAction: wikipedia\nAction Input: Cathy Barriga\n'),
   'Page: Cathy Barriga\nSummary: Cathy Carolina Barriga Guerra (nacida Catherine Carolina Barriga Guerra; Santiago, 9 de abril de 1973)[6]\u200b[7]\u200b es una figura televisiva, licenciada en psicolog√≠a y pol√≠tica chilena.[8]\u200b[3]\u200b Entre diciembre de 2016 y junio de 2021 se desempe√±√≥ como alcaldesa de Maip√∫.[9]\u200b A ra√

In [90]:
agente_executor.invoke({'input':'√∫ltimos albums de Jin de BTS'})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought:The question asks about Jin's (from BTS) latest albums.  Since Jin is a person and this is a question about his musical releases, Wikipedia is a good resource.

Action: wikipedia
Action Input: Jin (BTS) discography
[0m[38;5;200m[1;3mPage: Jin (cantante)
Summary: Kim Seok-Jin (en hangul, ÍπÄÏÑùÏßÑ; Gwacheon, 4 de diciembre de 1992), conocido por su nombre art√≠stico Jin, es un cantante y bailar√≠n surcoreano.[1]‚Äã[2]‚Äã Desde 2013 es miembro del grupo BTS bajo la compa√±√≠a Big Hit Music.[2]‚Äã Jin ha coescrito y lanzado tres canciones en solitario con BTS: ¬´Awake¬ª (2016), ¬´Epiphany¬ª (2018) y ¬´Moon¬ª (2020); todas han entrado en la lista digital Gaon de Corea del Sur. Tambi√©n apareci√≥ en la banda sonora del drama Hwarang (2016) junto a su compa√±ero de grupo V. El 28 de octubre del 2022 present√≥ su √∫ltimo sencillo ¬´The Astronaut¬ª antes de [0m[32;1m[1;3mThought:The Wikipedia page provides information a

{'input': '√∫ltimos albums de Jin de BTS',
 'output': 'El √∫ltimo lanzamiento de Jin de BTS es el sencillo "The Astronaut", publicado en 2022.  Se espera que lance su √°lbum debut "Happy" en noviembre de 2024, seg√∫n algunas fuentes.',
 'intermediate_steps': [(AgentAction(tool='wikipedia', tool_input='Jin (BTS) discography\n', log="Thought:The question asks about Jin's (from BTS) latest albums.  Since Jin is a person and this is a question about his musical releases, Wikipedia is a good resource.\n\nAction: wikipedia\nAction Input: Jin (BTS) discography\n"),
   'Page: Jin (cantante)\nSummary: Kim Seok-Jin (en hangul, ÍπÄÏÑùÏßÑ; Gwacheon, 4 de diciembre de 1992), conocido por su nombre art√≠stico Jin, es un cantante y bailar√≠n surcoreano.[1]\u200b[2]\u200b Desde 2013 es miembro del grupo BTS bajo la compa√±√≠a Big Hit Music.[2]\u200b Jin ha coescrito y lanzado tres canciones en solitario con BTS: ¬´Awake¬ª (2016), ¬´Epiphany¬ª (2018) y ¬´Moon¬ª (2020); todas han entrado en la lista dig

In [101]:
agente_executor.invoke({'input':'actual presidente de Chile'})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: This question asks for the current president of Chile.  Wikipedia should have this information.

Action: wikipedia
Action Input: Presidente de Chile
[0m[38;5;200m[1;3mPage: Presidente de Chile
Summary: El presidente de la Rep√∫blica de Chile es el jefe de Estado y de Gobierno del pa√≠s, por ende, titular del poder ejecutivo. Como m√°xima autoridad pol√≠tica de la naci√≥n, designa o remueve a los comandantes en jefe de las Fuerzas Armadas.[n 5]‚Äã El actual mandatario es Gabriel Boric Font, quien asumi√≥ el cargo el 11 de marzo de 2022, dando inicio as√≠ a su gesti√≥n.
Le corresponde, como mandato gen√©rico, el gobierno y la administraci√≥n del Estado.[6]‚Äã Si bien su papel y significaci√≥n ha experimentado cambios a lo largo de la historia, al igual que su posici√≥n y rel[0m[32;1m[1;3mThought: The Wikipedia page clearly states the current president.

Thought: I now know the final answer

Final Answer: El actua

{'input': 'actual presidente de Chile',
 'output': 'El actual presidente de Chile es Gabriel Boric Font.',
 'intermediate_steps': [(AgentAction(tool='wikipedia', tool_input='Presidente de Chile\n', log='Thought: This question asks for the current president of Chile.  Wikipedia should have this information.\n\nAction: wikipedia\nAction Input: Presidente de Chile\n'),
   'Page: Presidente de Chile\nSummary: El presidente de la Rep√∫blica de Chile es el jefe de Estado y de Gobierno del pa√≠s, por ende, titular del poder ejecutivo. Como m√°xima autoridad pol√≠tica de la naci√≥n, designa o remueve a los comandantes en jefe de las Fuerzas Armadas.[n 5]\u200b El actual mandatario es Gabriel Boric Font, quien asumi√≥ el cargo el 11 de marzo de 2022, dando inicio as√≠ a su gesti√≥n.\nLe corresponde, como mandato gen√©rico, el gobierno y la administraci√≥n del Estado.[6]\u200b Si bien su papel y significaci√≥n ha experimentado cambios a lo largo de la historia, al igual que su posici√≥n y rel')]

### **2.3 Multi Agente (1.5 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/r7QMJLxU4BoAAAAd/this-is-getting-out-of-hand-star-wars.gif"
" width="450">
</p>

El objetivo de esta subsecci√≥n es encapsular las funcionalidades creadas en una soluci√≥n multiagente con un **supervisor**.


#### **2.3.1 Generando Tools (0.5 puntos)**

Transforme la soluci√≥n RAG de la secci√≥n 2.1 y el agente de la secci√≥n 2.2 a *tools* (una tool por cada uno).

In [105]:
from langchain.tools import tool

@tool
def rag_solution(x: str) -> str:
  """ Responde la pregunta 'x' con la solucion RAG, si esta est√° relacionada
      con nutrici√≥n, comida y/o salud.
    """
  return rag_chain.invoke(x)

@tool
def agent_tool(x:str) -> str:
  """ Responde la pregunta 'x' con este agente si esta puede ser respondida
      realizando b√∫squedas en p√°ginas web o mediante wikipedia.
  """
  return agente_executor.invoke({'input':x})


#### **2.3.2 Agente Supervisor (0.5 puntos)**

Habilite un agente que tenga acceso a las tools del punto anterior y pueda responder preguntas relacionadas. Almacene este agente en una variable llamada supervisor.

In [112]:
supervisor_prompt = PromptTemplate.from_template(
    """
    Responde a las preguntas de los usuarios de la mejor manera posible utilizando
    las siguientes tools:
    {tools}
    T√∫ √∫nico rol es redireccionar la pregunta del usuario utilizando las tools
    entregadas, dependiendo de si la pregunta es sobre nutrici√≥n y enfermedades
    relacionadas con esta o realizar b√∫squedas en la web.
    Recuerda ser amable y cordial en tu respuesta.
    Restringete a utilizar solo los agentes dados, no inventes respuestas.

    Pregunta: {question}
    tool_names: {tools_name}
    Respuesta cordial:"""
)
# agent_scratchpad = ""
tools_supervisor = [rag_solution, agent_tool]
tools_name = [rag_solution.name, agent_tool.name]
supervisor = create_react_agent(llm,
                                tools_supervisor,
                                prompt=react_prompt)
supervisor_executor = AgentExecutor(agent=supervisor,
                                    tools=tools_supervisor,
                                    verbose=True,
                                    # return_intermediate_steps=True,
                                    max_iterations=5)


#### **2.3.3 Verificaci√≥n de respuestas (0.25 puntos)**

Pruebe el funcionamiento de su agente repitiendo las preguntas realizadas en las secciones 2.1.4 y 2.2.4 y comente sus resultados. ¬øC√≥mo var√≠an las respuestas bajo este enfoque?

In [113]:
# PREGUNTA 2.1.4
supervisor_executor.invoke({'input': 'que alimentos debe tener la dieta de una persona con diabetes?'})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: This question is about nutrition and diet for people with diabetes, so it's suitable for a RAG-based solution.  I'll try `rag_solution` first. If it fails to provide a satisfactory answer, I can try `agent_tool`.

Action: rag_solution
Action Input: que alimentos debe tener la dieta de una persona con diabetes?[0m[36;1m[1;3mLa dieta de una persona con diabetes mellitus tipo I o tipo II, que requiera entre 1500 y 2500 kcal, debe contener  pan, cereales, pastas, legumbres, arroz y verduras,  para contribuir al aporte de fibra, especialmente fibra soluble, que beneficia el perfil gluc√©mico.  Las frutas y la leche aportar√°n gl√∫cidos sencillos.  La cantidad de carbohidratos, prote√≠nas y grasas depender√° de la ingesta cal√≥rica diaria:

* **Dieta Diab√©tica 1500:** 20 raciones de carbohidratos, 6 raciones de prote√≠nas y 5 raciones de grasas.
* **Dieta Diab√©tica 1800:** 24 raciones de carbohidratos, 7 raciones de p

{'input': 'que alimentos debe tener la dieta de una persona con diabetes?',
 'output': 'Una dieta para una persona con diabetes, dependiendo de sus necesidades cal√≥ricas (1500-2500 kcal), debe incluir pan, cereales, pastas, legumbres, arroz y verduras para aportar fibra.  Frutas y leche aportan gl√∫cidos. La cantidad de carbohidratos, prote√≠nas y grasas var√≠a seg√∫n las calor√≠as diarias (ver detalles en la observaci√≥n).  Se deben moderar o evitar alimentos flatulentos y frutas √°cidas.  La informaci√≥n no incluye detalles sobre raciones espec√≠ficas de cada alimento ni alimentos prohibidos en dietas con control lip√≠dico.'}

Esta respuesta parece estar m√°s procesada que las anteriores, entregando informaci√≥n relevante de manera ordenada.

In [114]:
# PREGUNTA 2.2.4
supervisor_executor.invoke({'input':'qu√© pas√≥ con Cathy Barriga?'})



[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: This question asks about a person, Cathy Barriga.  It's likely that information about her can be found through a web search or Wikipedia.  I'll use the `agent_tool`.

Action: agent_tool
Action Input: qu√© pas√≥ con Cathy Barriga?
[0m

[1m> Entering new AgentExecutor chain...[0m
[32;1m[1;3mThought: This question asks about what happened to Cathy Barriga.  A Wikipedia search should provide information about her recent activities or events in her life.

Action: wikipedia
Action Input: Cathy Barriga
[0m[38;5;200m[1;3mPage: Cathy Barriga
Summary: Cathy Carolina Barriga Guerra (nacida Catherine Carolina Barriga Guerra; Santiago, 9 de abril de 1973)[6]‚Äã[7]‚Äã es una figura televisiva, licenciada en psicolog√≠a y pol√≠tica chilena.[8]‚Äã[3]‚Äã Entre diciembre de 2016 y junio de 2021 se desempe√±√≥ como alcaldesa de Maip√∫.[9]‚Äã A ra√≠z de sus gestiones como alcaldesa, en enero de 2024 fue formalizada por delitos d

{'input': 'qu√© pas√≥ con Cathy Barriga?',
 'output': 'Cathy Barriga, alcaldesa de Maip√∫ entre 2016 y 2021, fue formalizada en enero de 2024 por delitos de fraude al fisco y falsificaci√≥n de instrumento p√∫blico. Inicialmente se le otorg√≥ arresto domiciliario, pero en noviembre de 2024 fue puesta en prisi√≥n preventiva mientras contin√∫a su juicio.'}

Dado que esta respuesta se responde utilizando la tool de wikipedia, era esperable que la respuesta no cambiara ya que se est√° extrayendo informaci√≥n de la misma p√°gina.

#### **2.3.4 An√°lisis (0.25 puntos)**

¬øQu√© diferencias tiene este enfoque con la soluci√≥n *Router* vista en clases? Nombre al menos una ventaja y desventaja.

El agente supervisor, a diferencia de la soluci√≥n Router,

### **2.4 Memoria (Bonus +0.5 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/Gs95aiElrscAAAAd/memory-unlocked-ratatouille-critic.gif"
" width="400">
</p>

Una de las principales falencias de las soluciones que hemos visto hasta ahora es que nuestro chat no responde las interacciones anteriores, por ejemplo:

- Pregunta 1: "Hola! mi nombre es Sebasti√°n"
  - Respuesta esperada: "Hola Sebasti√°n! ..."
- Pregunta 2: "Cual es mi nombre?"
  - Respuesta actual: "Lo siento pero no conozco tu nombre :("
  - **Respuesta esperada: "Tu nombre es Sebasti√°n"**

Para solucionar esto, se les solicita agregar un componente de **memoria** a la soluci√≥n entregada en el punto 2.3.

**Nota: El Bonus es v√°lido <u>s√≥lo para la secci√≥n 2 de Large Language Models.</u>**

### **2.5 Despliegue (0 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/IytHqOp52EsAAAAd/you-get-a-deploy-deploy.gif"
" width="400">
</p>

Una vez tengan los puntos anteriores finalizados, toca la etapa de dar a conocer lo que hicimos! Para eso, vamos a desplegar nuestro modelo a trav√©s de `gradio`, una librer√≠a especializada en el levantamiento r√°pido de demos basadas en ML.

Primero instalamos la librer√≠a:

In [None]:
%pip install --upgrade --quiet gradio

Luego s√≥lo deben ejecutar el siguiente c√≥digo e interactuar con la interfaz a trav√©s del notebook o del link generado:

In [None]:
import gradio as gr
import time

def agent_response(message, history):
  '''
  Funci√≥n para gradio, recibe mensaje e historial, devuelte la respuesta del chatbot.
  '''
  # get chatbot response
  response = ... # rellenar con la respuesta de su chat

  # assert
  assert type(response) == str, "output de route_question debe ser string"

  # "streaming" response
  for i in range(len(response)):
    time.sleep(0.015)
    yield response[: i+1]

gr.ChatInterface(
    agent_response,
    type="messages",
    title="Chatbot MDS7202", # Pueden cambiar esto si lo desean
    description="Hola! Soy un chatbot muy √∫til :)", # tambi√©n la descripci√≥n
    theme="soft",
    ).launch(
        share=True, # pueden compartir el link a sus amig@s para que interactuen con su chat!
        debug = False,
        )