# **Laboratorio 11: LLM y Agentes Aut√≥nomos ü§ñ**

MDS7202: Laboratorio de Programaci√≥n Cient√≠fica para Ciencia de Datos

### **Cuerpo Docente:**

- Profesores: Ignacio Meza, Sebasti√°n Tinoco
- Auxiliar: Eduardo Moya
- Ayudantes: Nicol√°s Ojeda, Melanie Pe√±a, Valentina Rojas

### **Equipo: SUPER IMPORTANTE - notebooks sin nombre no ser√°n revisados**

- Nombre de alumno 1: Carolina Nu√±ez
- Nombre de alumno 2: Alonso Uribe

### **Link de repositorio de GitHub:** [Repositorioüíª](https://github.com/carinunez/Labs_MDS)

## **Temas a tratar**

- Reinforcement Learning
- Large Language Models

## **Reglas:**

- **Grupos de 2 personas**
- Cualquier duda fuera del horario de clases al foro. Mensajes al equipo docente ser√°n respondidos por este medio.
- Prohibidas las copias.
- Pueden usar cualquer matrial del curso que estimen conveniente.

### **Objetivos principales del laboratorio**

- Resoluci√≥n de problemas secuenciales usando Reinforcement Learning
- Habilitar un Chatbot para entregar respuestas √∫tiles usando Large Language Models.

El laboratorio deber√° ser desarrollado sin el uso indiscriminado de iteradores nativos de python (aka "for", "while"). La idea es que aprendan a exprimir al m√°ximo las funciones optimizadas que nos entrega `pandas`, las cuales vale mencionar, son bastante m√°s eficientes que los iteradores nativos sobre DataFrames.

## **1. Reinforcement Learning (2.0 puntos)**

En esta secci√≥n van a usar m√©todos de RL para resolver dos problemas interesantes: `Blackjack` y `LunarLander`.

In [None]:
!pip install -qqq gymnasium stable_baselines3
!pip install -qqq swig
!pip install -qqq gymnasium[box2d]

### **1.1 Blackjack (1.0 puntos)**

<p align="center">
  <img src="https://www.recreoviral.com/wp-content/uploads/2016/08/s3.amazonaws.com-Math.gif"
" width="400">
</p>

La idea de esta subsecci√≥n es que puedan implementar m√©todos de RL y as√≠ generar una estrategia para jugar el cl√°sico juego Blackjack y de paso puedan ~~hacerse millonarios~~ aprender a resolver problemas mediante RL.

Comencemos primero preparando el ambiente. El siguiente bloque de c√≥digo transforma las observaciones del ambiente a `np.array`:


In [None]:
import gymnasium as gym
from gymnasium.spaces import MultiDiscrete
import numpy as np

class FlattenObservation(gym.ObservationWrapper):
    def __init__(self, env):
        super(FlattenObservation, self).__init__(env)
        self.observation_space = MultiDiscrete(np.array([32, 11, 2]))

    def observation(self, observation):
        return np.array(observation).flatten()

# Create and wrap the environment
env = gym.make("Blackjack-v1")
env = FlattenObservation(env)

#### **1.1.1 Descripci√≥n de MDP (0.2 puntos)**

Entregue una breve descripci√≥n sobre el ambiente [Blackjack](https://gymnasium.farama.org/environments/toy_text/blackjack/) y su formulaci√≥n en MDP, distinguiendo de forma clara y concisa los estados, acciones y recompensas.

`escriba su respuesta ac√°`

#### **1.1.2 Generando un Baseline (0.2 puntos)**

Simule un escenario en donde se escojan acciones aleatorias. Repita esta simulaci√≥n 5000 veces y reporte el promedio y desviaci√≥n de las recompensas. ¬øC√≥mo calificar√≠a el performance de esta pol√≠tica? ¬øC√≥mo podr√≠a interpretar las recompensas obtenidas?

#### **1.1.3 Entrenamiento de modelo (0.2 puntos)**

A partir del siguiente [enlace](https://stable-baselines3.readthedocs.io/en/master/guide/algos.html), escoja un modelo de `stable_baselines3` y entrenelo para resolver el ambiente `Blackjack`.

#### **1.1.4 Evaluaci√≥n de modelo (0.2 puntos)**

Repita el ejercicio 1.1.2 pero utilizando el modelo entrenado. ¬øC√≥mo es el performance de su agente? ¬øEs mejor o peor que el escenario baseline?

#### **1.1.5 Estudio de acciones (0.2 puntos)**

Genere una funci√≥n que reciba un estado y retorne la accion del agente. Luego, use esta funci√≥n para entregar la acci√≥n escogida frente a los siguientes escenarios:

- Suma de cartas del agente es 6, dealer muestra un 7, agente no tiene tiene un as
- Suma de cartas del agente es 19, dealer muestra un 3, agente tiene tiene un as

¬øSon coherentes sus acciones con las reglas del juego?

Hint: ¬øA que clase de python pertenecen los estados? Pruebe a usar el m√©todo `.reset` para saberlo.

### **1.2 LunarLander**

<p align="center">
  <img src="https://i.redd.it/097t6tk29zf51.jpg"
" width="400">
</p>

Similar a la secci√≥n 2.1, en esta secci√≥n usted se encargar√° de implementar una gente de RL que pueda resolver el ambiente `LunarLander`.

Comencemos preparando el ambiente:


In [None]:
import gymnasium as gym
env = gym.make("LunarLander-v2", render_mode = "rgb_array", continuous = True) # notar el par√°metro continuous = True

Noten que se especifica el par√°metro `continuous = True`. ¬øQue implicancias tiene esto sobre el ambiente?

Adem√°s, se le facilita la funci√≥n `export_gif` para el ejercicio 2.2.4:

In [None]:
import imageio
import numpy as np

def export_gif(model, n = 5):
  '''
  funci√≥n que exporta a gif el comportamiento del agente en n episodios
  '''
  images = []
  for episode in range(n):
    obs = model.env.reset()
    img = model.env.render()
    done = False
    while not done:
      images.append(img)
      action, _ = model.predict(obs)
      obs, reward, done, info = model.env.step(action)
      img = model.env.render(mode="rgb_array")

  imageio.mimsave("agent_performance.gif", [np.array(img) for i, img in enumerate(images) if i%2 == 0], fps=29)

#### **1.2.1 Descripci√≥n de MDP (0.2 puntos)**

Entregue una breve descripci√≥n sobre el ambiente [LunarLander](https://gymnasium.farama.org/environments/box2d/lunar_lander/) y su formulaci√≥n en MDP, distinguiendo de forma clara y concisa los estados, acciones y recompensas. ¬øComo se distinguen las acciones de este ambiente en comparaci√≥n a `Blackjack`?

Nota: recuerde que se especific√≥ el par√°metro `continuous = True`

`escriba su respuesta ac√°`

#### **1.2.2 Generando un Baseline (0.2 puntos)**

Simule un escenario en donde se escojan acciones aleatorias. Repita esta simulaci√≥n 10 veces y reporte el promedio y desviaci√≥n de las recompensas. ¬øC√≥mo calificar√≠a el performance de esta pol√≠tica?

#### **1.2.3 Entrenamiento de modelo (0.2 puntos)**

A partir del siguiente [enlace](https://stable-baselines3.readthedocs.io/en/master/guide/algos.html), escoja un modelo de `stable_baselines3` y entrenelo para resolver el ambiente `LunarLander` **usando 10000 timesteps de entrenamiento**.

#### **1.2.4 Evaluaci√≥n de modelo (0.2 puntos)**

Repita el ejercicio 1.2.2 pero utilizando el modelo entrenado. ¬øC√≥mo es el performance de su agente? ¬øEs mejor o peor que el escenario baseline?

#### **1.2.5 Optimizaci√≥n de modelo (0.2 puntos)**

Repita los ejercicios 1.2.3 y 1.2.4 hasta obtener un nivel de recompensas promedio mayor a 50. Para esto, puede cambiar manualmente par√°metros como:
- `total_timesteps`
- `learning_rate`
- `batch_size`

Una vez optimizado el modelo, use la funci√≥n `export_gif` para estudiar el comportamiento de su agente en la resoluci√≥n del ambiente y comente sobre sus resultados.

Adjunte el gif generado en su entrega (mejor a√∫n si adem√°s adjuntan el gif en el markdown).

## **2. Large Language Models (4.0 puntos)**

En esta secci√≥n se enfocar√°n en habilitar un Chatbot que nos permita responder preguntas √∫tiles a trav√©s de LLMs.

### **2.0 Configuraci√≥n Inicial**

<p align="center">
  <img src="https://media1.tenor.com/m/uqAs9atZH58AAAAd/config-config-issue.gif"
" width="400">
</p>

Como siempre, cargamos todas nuestras API KEY al entorno:

In [1]:
import getpass
import os

if "GOOGLE_API_KEY" not in os.environ:
    os.environ["GOOGLE_API_KEY"] = getpass.getpass("Enter your Google AI API key: ")

if "TAVILY_API_KEY" not in os.environ:
    os.environ["TAVILY_API_KEY"] = getpass.getpass("Enter your Tavily API key: ")

Enter your Google AI API key: ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑
Enter your Tavily API key: ¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑¬∑


### **2.1 Retrieval Augmented Generation (1.5 puntos)**

<p align="center">
  <img src="https://y.yarn.co/218aaa02-c47e-4ec9-b1c9-07792a06a88f_text.gif"
" width="400">
</p>

El objetivo de esta subsecci√≥n es que habiliten un chatbot que pueda responder preguntas usando informaci√≥n contenida en documentos PDF a trav√©s de **Retrieval Augmented Generation.**

#### **2.1.1 Reunir Documentos (0 puntos)**

Reuna documentos PDF sobre los que hacer preguntas siguiendo las siguientes instrucciones:
  - 2 documentos .pdf como m√≠nimo.
  - 50 p√°ginas de contenido como m√≠nimo entre todos los documentos.
  - Ideas para documentos: Documentos relacionados a temas acad√©micos, laborales o de ocio. Aprovechen este ejercicio para construir algo √∫til y/o relevante para ustedes!
  - Deben ocupar documentos reales, no pueden utilizar los mismos de la clase.
  - Deben registrar sus documentos en la siguiente [planilla](https://docs.google.com/spreadsheets/d/1Hy1w_dOiG2UCHJ8muyxhdKPZEPrrL7BNHm6E90imIIM/edit?usp=sharing). **NO PUEDEN USAR LOS MISMOS DOCUMENTOS QUE OTRO GRUPO**
  - **Recuerden adjuntar los documentos en su entrega**.

In [2]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


In [3]:
%pip install --upgrade --quiet PyPDF2

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/232.6 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [91m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m[91m‚ï∏[0m[90m‚îÅ[0m [32m225.3/232.6 kB[0m [31m7.2 MB/s[0m eta [36m0:00:01[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m232.6/232.6 kB[0m [31m5.0 MB/s[0m eta [36m0:00:00[0m
[?25h

In [4]:
%pip install --upgrade --quiet  langchain-google-genai

[?25l   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m0.0/41.8 kB[0m [31m?[0m eta [36m-:--:--[0m[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m41.8/41.8 kB[0m [31m2.5 MB/s[0m eta [36m0:00:00[0m
[?25h

In [5]:
%pip install --upgrade --quiet faiss-cpu langchain_community pypdf

[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m27.5/27.5 MB[0m [31m31.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m2.4/2.4 MB[0m [31m28.8 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m298.0/298.0 kB[0m [31m12.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m409.3/409.3 kB[0m [31m8.9 MB/s[0m eta [36m0:00:00[0m
[2K   [90m‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ‚îÅ[0m [32m3.1/3.1 MB[0m [31m20.0 MB/s[0m eta [36m0:00:00[0m
[2K  

In [6]:
import PyPDF2

doc_paths = ['/content/gdrive/MyDrive/pdf_LLM/506.pdf',
            #  '/content/gdrive/MyDrive/pdf_LLM/Encyclopedia of Foods. A Guide to Healthy Nutrition ( PDFDrive.com ).pdf',
             '/content/gdrive/MyDrive/pdf_LLM/La-guia-peq-cambios-castella.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/Manual_basico_N_clinica_y_Dietetica_Valencia_2012.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/cb2395en.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/food-for-thought-mental-health-nutrition-briefing-march-2017.pdf',
             '/content/gdrive/MyDrive/pdf_LLM/nutrients-14-00750.pdf'] # rellenar con los path a sus documentos

assert len(doc_paths) >= 2, "Deben adjuntar un m√≠nimo de 2 documentos"

total_paginas = sum(len(PyPDF2.PdfReader(open(doc, "rb")).pages) for doc in doc_paths)
assert total_paginas >= 50, f"P√°ginas insuficientes: {total_paginas}"

#### **2.1.2 Vectorizar Documentos (0.2 puntos)**

Vectorice los documentos y almacene sus representaciones de manera acorde.

In [7]:
from langchain_community.document_loaders import PyPDFLoader

docs = PyPDFLoader(doc_paths[-1]).load()

for doc in doc_paths[:-1]:
  new_doc = PyPDFLoader(doc).load()
  docs.extend(new_doc)


In [30]:
# Splits docs in chunks
from langchain_text_splitters import RecursiveCharacterTextSplitter

text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs) # dividir documentos en chunks

In [31]:
from langchain_google_genai import GoogleGenerativeAIEmbeddings
from langchain_community.vectorstores import FAISS

embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
vectorstore

<langchain_community.vectorstores.faiss.FAISS at 0x789084438fa0>

In [32]:
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 3}, # n¬∞ documentos a recuperar
                                     )

In [33]:
# question = "que frutas recomiendas para una persona deshidratada" # pregunta
# relevant_documents = retriever.invoke(question) # top k documentos relevantes a la pregunta
# relevant_documents

In [34]:
def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

#### **2.1.3 Habilitar RAG (0.3 puntos)**

Habilite la soluci√≥n RAG a trav√©s de una *chain* y gu√°rdela en una variable.

In [35]:
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 3}, # n¬∞ documentos a recuperar
                                     )

def format_docs(docs):
    return "\n\n".join(doc.page_content for doc in docs)

retriever_chain = retriever | format_docs # chain
print(retriever_chain.invoke("lista de verduras con mayor contenido en fibra"))

MANUAL B√ÅSICO DE NUTRICI√ìN CL√çNICA Y DIET√âTICA
76
tatas produce una respuesta gluc√©mica del 70% respecto a una cantidad equivalente de pan blanco. La utili-
dad de este √≠ndice pierde parte de su valor debido a que las comidas incluyen mezclas de diversos alimentos.
2.2 Fibra. Es un HC complejo, no absorbible, que se encuentra principalmente en verduras, hortalizas, le-
gumbres, cereales y frutas. Se recomienda una ingesta de 20-35 g por d√≠a (10-15 g de fibra cada 1000 kcal/

CAP√çTULO 2. DIET√âTICA Y DIETOTERAPIA
47
GRUPO DE LAS VERDURAS Y HORTALIZAS
A pesar de que las verduras y las hortalizas forman una amplia gama de alimentos, pueden ser reunidas en 
un mismo grupo, ya que los nutrientes que aportan son similares. Son alimentos en general de bajo conteni-
do energ√©tico, ya que casi un 80% de su composici√≥n es agua. Aportan vitaminas A, C, √°cido f√≥lico, betaca-

rotenos y otros carotenos (licopeno, alfacaroteno), adem√°s de flavonoides, compuestos fen√≥licos y clorofila 


In [36]:
from langchain_core.prompts import PromptTemplate
from langchain_core.output_parsers import StrOutputParser

from langchain_google_genai import ChatGoogleGenerativeAI

llm = ChatGoogleGenerativeAI(
    model="gemini-1.5-flash", # modelo de lenguaje
    temperature=0.2, # probabilidad de "respuestas creativas"
    max_tokens=None, # sin tope de tokens
    timeout=None, # sin timeout
    max_retries=2, # n√∫mero m√°ximo de intentos
)

# Entrego contexto para las respuestas
rag_template = '''
Eres un asistente experto en nutrici√≥n y salud. Haces recomendaciones sobre alimentos
a consumir seg√∫n el contexto que se te entrega.
Tu √∫nico rol es contestar preguntas del usuario a partir de informaci√≥n relevante que te sea proporcionada.
Responde siempre de la forma m√°s completa posible y usando toda la informaci√≥n entregada.
Responde s√≥lo lo que te pregunten a partir de la informaci√≥n relevante, NUNCA inventes una respuesta.

Informaci√≥n relevante: {context}
Pregunta: {question}
Respuesta √∫til:
'''

rag_prompt = PromptTemplate.from_template(rag_template)

# Finalmente, condensamos todo en una chain para recuperar informaci√≥n relevante y responder al mismo tiempo:


from langchain_core.runnables import RunnablePassthrough

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

question = "que frutas recomiendas para la deshidrataci√≥n?"
response = rag_chain.invoke(question)
print(response)


Las frutas y hortalizas son alimentos ricos en agua, por lo que son una buena opci√≥n para combatir la deshidrataci√≥n. 



In [37]:
# question = "entregame 5 verduras con alto contenido en fibra y su cantidad, si dispones de ella'"
# response = rag_chain.invoke(question)
# print(response)

In [38]:
question = "que alimentos recomeindas para reducir la obesidad"
response = rag_chain.invoke(question)
print(response)

Para reducir la obesidad, se recomienda reducir tanto el aporte cal√≥rico global como la ingesta de grasas. Se recomienda consumir:

* **Pescado:** Dos o m√°s raciones de pescado a la semana (con excepci√≥n de los filetes de pescado frito comerciales) ya que proporcionan √°cidos grasos poliinsaturados n-3.
* **Conservas de pescado en aceite de oliva:**  
* **Conejo, pollo o pavo sin piel asado, frito en aceite de oliva o al horno:** 
* **Ternera, cerdo magro o jam√≥n serrano, suprimiendo la grasa visible:**
* **Huevos:** 2 a la semana.
* **Nueces naturales:** diariamente. 
* **Fruta:** (naranjas, fresas, kiwi, etc.) fresca a diario.
* **Verdura:** (tomates, zanahorias, lechuga), fresca a diario.

Se deben restringir:

* **Sal y alimentos salados:**
* **Az√∫car y alimentos y bebidas azucaradas:**
* **Carne roja y procesada:**
* **Alimentos ultraprocesados:** 



In [39]:
print(rag_chain.invoke('recomendaciones de meriendas dulces'))

Para una merienda dulce, puedes optar por:

* **Fruta entera:** Naranja, melocot√≥n, mel√≥n, lim√≥n, mandarina, sand√≠a, manzana √°cida.
* **Combinaciones de fruta:** Naranja y vainilla, melocot√≥n, lim√≥n y tomillo, pepino y mejorana, mandarina y albahaca, naranja, clavo y canela en rama, sand√≠a y romero, hinojo y naranja o lim√≥n.
* **Fruta desecada:** Pasas, ciruelas, orejones, d√°tiles. 
* **Infusi√≥n:** Puedes preparar una infusi√≥n de hierbas arom√°ticas como tomillo, mejorana, albahaca, romero. 

Recuerda que es importante evitar el az√∫car a√±adido y priorizar la fruta entera. 



#### **2.1.4 Verificaci√≥n de respuestas (0.5 puntos)**

Genere un listado de 3 tuplas ("pregunta", "respuesta correcta") y analice la respuesta de su soluci√≥n para cada una. ¬øSu soluci√≥n RAG entrega las respuestas que esperaba?

Ejemplo de tupla:
- Pregunta: ¬øQui√©n es el presidente de Chile?
- Respuesta correcta: El presidente de Chile es Gabriel Boric

In [41]:
referencia = [
    ('que alimentos debe tener la dieta de una persona con diabetes?',
     #respuesta
    'Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.'),
    ('alimentos recomendados para la deshidrataci√≥n',
     "Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.\
     Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verduras,\
     sopas, gelatinas, paletas de helado y otros alimentos hidratados"),
    ('que alimentos recomeindas para reducir la obesidad',
     'nn')]

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0])
  print('Respuesta de ref: ', ref[1])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]))

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe incluir alimentos como pan, cereales, pastas, legumbres, arroz y verduras. Estos alimentos contribuyen al aporte de fibra, especialmente la fibra soluble, que ha demostrado tener efectos beneficiosos sobre el perfil gluc√©mico. Los gl√∫cidos sencillos ser√°n aportados mediante la ingesta de frutas y leche. Los horarios de las comidas en pacientes insulinodependiente se deben ajustar en funci√≥n de la pauta de insulina. 

Pregunta:  alimentos recomendados para la deshidrataci√≥n
Respuesta de ref:  Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.     Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verduras,     sopas, gelatinas, paletas de helado y otros

#### **2.1.5 Sensibilidad de Hiperpar√°metros (0.5 puntos)**

Extienda el an√°lisis del punto 2.1.4 analizando c√≥mo cambian las respuestas entregadas cambiando los siguientes hiperpar√°metros:
- `Tama√±o del chunk`. (*¬øC√≥mo repercute que los chunks sean mas grandes o chicos?*)
- `La cantidad de chunks recuperados`. (*¬øQu√© pasa si se devuelven muchos/pocos chunks?*)
- `El tipo de b√∫squeda`. (*¬øC√≥mo afecta el tipo de b√∫squeda a las respuestas de mi RAG?*)

In [42]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=300, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
vectorstore
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 3}, # n¬∞ documentos a recuperar
                                     )

retriever_chain = retriever | format_docs # chain

In [43]:
rag_prompt = PromptTemplate.from_template(rag_template)

# Finalmente, condensamos todo en una chain para recuperar informaci√≥n relevante y responder al mismo tiempo:

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0])
  print('Respuesta de ref: ', ref[1])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]))

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe incluir alimentos frescos, poco procesados o sin procesar y principalmente vegetales, evitando los alimentos de baja calidad nutricional y las bebidas alcoh√≥licas. 

Pregunta:  alimentos recomendados para la deshidrataci√≥n
Respuesta de ref:  Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.     Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verduras,     sopas, gelatinas, paletas de helado y otros alimentos hidratados
Respuesta RAG chain:  La mejor bebida para la deshidrataci√≥n es el agua, tanto durante las comidas como entre ellas. 
Si alg√∫n d√≠a quieres tomar una bebida distinta, puedes elegir un agua con gas, un zumo de fruta sin az√∫cares a√±ad

In [44]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
vectorstore
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 3}, # n¬∞ documentos a recuperar
                                     )

retriever_chain = retriever | format_docs # chain

In [45]:
text_splitter = RecursiveCharacterTextSplitter(chunk_size=1000, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
vectorstore
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 3}, # n¬∞ documentos a recuperar
                                     )

retriever_chain = retriever | format_docs # chain
rag_prompt = PromptTemplate.from_template(rag_template)

# Finalmente, condensamos todo en una chain para recuperar informaci√≥n relevante y responder al mismo tiempo:

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0])
  print('Respuesta de ref: ', ref[1])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]))

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe ser individualizada, pero en general debe incluir:

* **Carbohidratos complejos:** Estos se encuentran en alimentos como el pan, cereales, pastas, legumbres, arroz y verduras. Estos alimentos tambi√©n aportan fibra, que es beneficiosa para el control del az√∫car en sangre.
* **Frutas:** Las frutas aportan gl√∫cidos sencillos y fibra.
* **Prote√≠nas:** Las prote√≠nas deben estar presentes en la dieta, pero no en exceso.
* **Grasas:** Las grasas deben ser saludables, como las que se encuentran en el aceite de oliva, los frutos secos y los pescados.

Es importante tener en cuenta que la cantidad de cada tipo de alimento debe ser ajustada seg√∫n las necesidades individuales de cada persona. 

Pregunta:  aliment

Al aumentar el tama√±o del chunk, se tiene m√°s contexto por lo que tiene sentido que las respuestas entregadas la segunda prueba tengan mayor extension.

In [46]:
# Cambio de numero de chunks a recuperar
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
vectorstore
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 6}, # n¬∞ documentos a recuperar
                                     )

retriever_chain = retriever | format_docs # chain
rag_prompt = PromptTemplate.from_template(rag_template)

# Finalmente, condensamos todo en una chain para recuperar informaci√≥n relevante y responder al mismo tiempo:

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0])
  print('Respuesta de ref: ', ref[1])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]))

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe ajustarse de forma individualizada, teniendo en cuenta la valoraci√≥n del estado nutricional, su estilo de vida y los objetivos terap√©uticos marcados. 

**En general, la dieta debe incluir:**

* **Alimentos ricos en fibra:** pan, cereales, pastas, legumbres, arroz y verduras. Estos alimentos contribuyen al aporte de fibra, especialmente la fibra soluble, que ha demostrado tener efectos beneficiosos sobre el perfil gluc√©mico.
* **Frutas:** aportan gl√∫cidos sencillos.
* **Leche:** aporta gl√∫cidos sencillos.
* **Alimentos con control de carbohidratos:** se deben ajustar en funci√≥n de la pauta de insulina utilizada, adaptada a cada paciente, y al perfil gluc√©mico.

**Se deben evitar o limitar:**

* **Alim

In [49]:
# Cambio de numero de chunks a recuperar
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento
retriever = vectorstore.as_retriever(search_type="similarity", # m√©todo de b√∫squeda
                                     search_kwargs={"k": 2}, # n¬∞ documentos a recuperar
                                     )

retriever_chain = retriever | format_docs # chain
rag_prompt = PromptTemplate.from_template(rag_template)

# Finalmente, condensamos todo en una chain para recuperar informaci√≥n relevante y responder al mismo tiempo:

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0])
  print('Respuesta de ref: ', ref[1])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]))

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe incluir alimentos como pan, cereales, pastas, legumbres, arroz y verduras. Estos alimentos contribuyen al aporte de fibra, especialmente la fibra soluble, que ha demostrado tener efectos beneficiosos sobre el perfil gluc√©mico. Los gl√∫cidos sencillos ser√°n aportados mediante la ingesta de frutas y leche. Los horarios de las comidas en pacientes insulinodependiente se deben ajustar en funci√≥n de la pauta. 

Pregunta:  alimentos recomendados para la deshidrataci√≥n
Respuesta de ref:  Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.     Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verduras,     sopas, gelatinas, paletas de helado y otros alimentos h

# cambio en num archivos por recuperar

In [51]:
# Cambio de numero de chunks a recuperar
text_splitter = RecursiveCharacterTextSplitter(chunk_size=500, chunk_overlap=50) # inicializamos splitter
splits = text_splitter.split_documents(docs)
embedding = GoogleGenerativeAIEmbeddings(model="models/embedding-001") # inicializamos los embeddings
vectorstore = FAISS.from_documents(documents=splits, embedding=embedding) # vectorizacion y almacenamiento

# Maximum Marginal Relevance Search
retriever = vectorstore.as_retriever(search_type='mmr', search_kwargs={"k": 2})

retriever_chain = retriever | format_docs # chain
rag_prompt = PromptTemplate.from_template(rag_template)

# Finalmente, condensamos todo en una chain para recuperar informaci√≥n relevante y responder al mismo tiempo:

rag_chain = (
    {
        "context": retriever_chain, # context lo obtendremos del retriever_chain
        "question": RunnablePassthrough(), # question pasar√° directo hacia el prompt
    }
    | rag_prompt # prompt con las variables question y context
    | llm # llm recibe el prompt y responde
    | StrOutputParser() # recuperamos s√≥lo la respuesta
)

for i, ref in enumerate(referencia):
  print('Pregunta: ', ref[0])
  print('Respuesta de ref: ', ref[1])
  print('Respuesta RAG chain: ', rag_chain.invoke(ref[0]))

Pregunta:  que alimentos debe tener la dieta de una persona con diabetes?
Respuesta de ref:  Frutas.Verduras.Granos integrales.Legumbres, como frijoles y guisantes. Productos l√°cteos bajos en grasa, como leche y queso.
Respuesta RAG chain:  La dieta de una persona con diabetes debe incluir alimentos como pan, cereales, pastas, legumbres, arroz y verduras. Estos alimentos contribuyen al aporte de fibra, especialmente la fibra soluble, que ha demostrado tener efectos beneficiosos sobre el perfil gluc√©mico. Las frutas y la leche aportan gl√∫cidos sencillos. 

Pregunta:  alimentos recomendados para la deshidrataci√≥n
Respuesta de ref:  Beba l√≠quidos. A veces, los l√≠quidos muy fr√≠os resultan m√°s f√°ciles de beber.     Recuerde que los alimentos contienen l√≠quidos. Procure comer frutas, verduras,     sopas, gelatinas, paletas de helado y otros alimentos hidratados
Respuesta RAG chain:  Los alimentos recomendados para la deshidrataci√≥n son:

* **Pescado blanco:** Hervido, a la plancha

### **2.2 Agentes (1.0 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/rcqnN2aJCSEAAAAd/secret-agent-man.gif"
" width="400">
</p>

Similar a la secci√≥n anterior, en esta secci√≥n se busca habilitar **Agentes** para obtener informaci√≥n a trav√©s de tools y as√≠ responder la pregunta del usuario.

#### **2.2.1 Tool de Tavily (0.2 puntos)**

Generar una *tool* que pueda hacer consultas al motor de b√∫squeda **Tavily**.

In [59]:
from langchain_community.tools.tavily_search import TavilySearchResults

search_tavily = TavilySearchResults(max_results = 1) # inicializamos tool
tools = [search_tavily] # guardamos las tools en una lista

#### **2.2.2 Tool de Wikipedia (0.2 puntos)**

Generar una *tool* que pueda hacer consultas a **Wikipedia**.

*Hint: Le puede ser de ayuda el siguiente [link](https://python.langchain.com/v0.1/docs/modules/tools/).*

In [60]:
%pip install wikipedia



In [61]:
from langchain_community.tools import WikipediaQueryRun
from langchain_community.utilities import WikipediaAPIWrapper

api_wrapper = WikipediaAPIWrapper(top_k_results=1, doc_content_chars_max=100)
search_wiki = WikipediaQueryRun(api_wrapper=api_wrapper)

tools += [search_wiki]

In [66]:
[search_tavily] + [search_wiki]

[TavilySearchResults(max_results=1, api_wrapper=TavilySearchAPIWrapper(tavily_api_key=SecretStr('**********'))),
 WikipediaQueryRun(api_wrapper=WikipediaAPIWrapper(wiki_client=<module 'wikipedia' from '/usr/local/lib/python3.10/dist-packages/wikipedia/__init__.py'>, top_k_results=1, lang='en', load_all_available_meta=False, doc_content_chars_max=100))]

#### **2.2.3 Crear Agente (0.3 puntos)**

Crear un agente que pueda responder preguntas preguntas usando las *tools* antes generadas. Aseg√∫rese que su agente responda en espa√±ol. Por √∫ltimo, guarde el agente en una variable.

#### **2.2.4 Verificaci√≥n de respuestas (0.3 puntos)**

Pruebe el funcionamiento de su agente y aseg√∫rese que el agente est√© ocupando correctamente las tools disponibles. ¬øEn qu√© casos el agente deber√≠a ocupar la tool de Tavily? ¬øEn qu√© casos deber√≠a ocupar la tool de Wikipedia?

### **2.3 Multi Agente (1.5 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/r7QMJLxU4BoAAAAd/this-is-getting-out-of-hand-star-wars.gif"
" width="450">
</p>

El objetivo de esta subsecci√≥n es encapsular las funcionalidades creadas en una soluci√≥n multiagente con un **supervisor**.


#### **2.3.1 Generando Tools (0.5 puntos)**

Transforme la soluci√≥n RAG de la secci√≥n 2.1 y el agente de la secci√≥n 2.2 a *tools* (una tool por cada uno).

#### **2.3.2 Agente Supervisor (0.5 puntos)**

Habilite un agente que tenga acceso a las tools del punto anterior y pueda responder preguntas relacionadas. Almacene este agente en una variable llamada supervisor.

#### **2.3.3 Verificaci√≥n de respuestas (0.25 puntos)**

Pruebe el funcionamiento de su agente repitiendo las preguntas realizadas en las secciones 2.1.4 y 2.2.4 y comente sus resultados. ¬øC√≥mo var√≠an las respuestas bajo este enfoque?

#### **2.3.4 An√°lisis (0.25 puntos)**

¬øQu√© diferencias tiene este enfoque con la soluci√≥n *Router* vista en clases? Nombre al menos una ventaja y desventaja.

`escriba su respuesta ac√°`

### **2.4 Memoria (Bonus +0.5 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/Gs95aiElrscAAAAd/memory-unlocked-ratatouille-critic.gif"
" width="400">
</p>

Una de las principales falencias de las soluciones que hemos visto hasta ahora es que nuestro chat no responde las interacciones anteriores, por ejemplo:

- Pregunta 1: "Hola! mi nombre es Sebasti√°n"
  - Respuesta esperada: "Hola Sebasti√°n! ..."
- Pregunta 2: "Cual es mi nombre?"
  - Respuesta actual: "Lo siento pero no conozco tu nombre :("
  - **Respuesta esperada: "Tu nombre es Sebasti√°n"**

Para solucionar esto, se les solicita agregar un componente de **memoria** a la soluci√≥n entregada en el punto 2.3.

**Nota: El Bonus es v√°lido <u>s√≥lo para la secci√≥n 2 de Large Language Models.</u>**

### **2.5 Despliegue (0 puntos)**

<p align="center">
  <img src="https://media1.tenor.com/m/IytHqOp52EsAAAAd/you-get-a-deploy-deploy.gif"
" width="400">
</p>

Una vez tengan los puntos anteriores finalizados, toca la etapa de dar a conocer lo que hicimos! Para eso, vamos a desplegar nuestro modelo a trav√©s de `gradio`, una librer√≠a especializada en el levantamiento r√°pido de demos basadas en ML.

Primero instalamos la librer√≠a:

In [47]:
%pip install --upgrade --quiet gradio

Luego s√≥lo deben ejecutar el siguiente c√≥digo e interactuar con la interfaz a trav√©s del notebook o del link generado:

In [48]:
import gradio as gr
import time

def agent_response(message, history):
  '''
  Funci√≥n para gradio, recibe mensaje e historial, devuelte la respuesta del chatbot.
  '''
  # get chatbot response
  response = ... # rellenar con la respuesta de su chat

  # assert
  assert type(response) == str, "output de route_question debe ser string"

  # "streaming" response
  for i in range(len(response)):
    time.sleep(0.015)
    yield response[: i+1]

gr.ChatInterface(
    agent_response,
    type="messages",
    title="Chatbot MDS7202", # Pueden cambiar esto si lo desean
    description="Hola! Soy un chatbot muy √∫til :)", # tambi√©n la descripci√≥n
    theme="soft",
    ).launch(
        share=True, # pueden compartir el link a sus amig@s para que interactuen con su chat!
        debug = False,
        )

Colab notebook detected. To show errors in colab notebook, set debug=True in launch()
* Running on public URL: https://8519dba04d0882d0e1.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


