## Actualizando la información de los LLMs

Una gran limitación de los  LLMS es que almacenan toda la información en sus parámetros que son ajustados en el momento de entrenamiento. Dentro de la memoria de ChatGPT hay almacenada una gran cantidad de datos de la realidad que:
* Se repitieron en los textos de entrenamiento de la etapa no supervisada (predicción del texto que sigue)

* Fueron parte de las respuestas escritas por humanos en la etapa supervisada

* Fueron etiquetadas por un humano como correctas (:thumbsup:) en la etapa de RLHF

Miren el siguiente ejemplo:




<img src="https://i.ibb.co/wp3vrv5/Screen-Shot-2023-09-17-at-17-03-57.png" width="500px" />




Pero ¿Qué pasa si necesitamos datos recientes?

<img src="https://i.ibb.co/rMj3ScT/Whats-App-Image-2023-09-13-at-13-36-03-1.jpg" width="500px" />



```
# Tiene formato de código
```

Desde la aparición de los LLMs cobraron gran importancia las herramientas capaces de proveer información textual en tiempo real, como las bases de datos vectoriales (que vamos a ver más adelante en el curso) y los motores de búsqueda consumidos a través de APIs como Bing y <a href="https://serpapi.com/">SERP API</a>, que utiliza web scraping de los resultados orgánicos de Google.

Existen aplicaciones para usuarios finales que ya permiten combinar la capacidad de razonamiento de los LLMs con estos grandes índices de información actualizada como https://www.bing.com/chat y https://www.perplexity.ai/

<img src="https://i.ibb.co/VQ27VQZ/Whats-App-Image-2023-09-13-at-13-36-03.jpg" width="500px" />


## Ejercicio

Les proponemos utilizar las APIs de SERP y OpenAI para responder preguntas de actualidad, como por ejemplo ¿Quién ganó las elecciones de Argentina 2023? Exploremos un sistema capaz de responder a cualquier pregunta de actualidad.

Para poder resolver este ejercicio vamos a utilizar dos sistemas externos: SERP API y OpenAI. Ambos tienen consumos de prueba que se pueden utilizar para explorar, pero cuando integramos este tipo de servicios a nuestras tenemos que considerar:

1) Los costos: https://serpapi.com/pricing // https://openai.com/pricing

2) Seguridad: ¡Cuidado! Las claves privadas son lo único que se necesita para acceder con una identidad. En los sistemas productivos las claves se encuentran en un archivo de configuración (.env) y JAMÁS se deben subir a los repositorios de código como git. Normalmente se excluye al .env del repositorio utilizando el archivo .gitignore


In [None]:
# Instalamos las librerías
!pip install google-search-results openai

Collecting google-search-results
  Downloading google_search_results-2.4.2.tar.gz (18 kB)
  Preparing metadata (setup.py) ... [?25l[?25hdone
Building wheels for collected packages: google-search-results
  Building wheel for google-search-results (setup.py) ... [?25l[?25hdone
  Created wheel for google-search-results: filename=google_search_results-2.4.2-py3-none-any.whl size=32010 sha256=9f8228b736d2f869918b1655e2f9878fb3992c875e7c8bb6849cf144ad77b4cb
  Stored in directory: /root/.cache/pip/wheels/0c/47/f5/89b7e770ab2996baf8c910e7353d6391e373075a0ac213519e
Successfully built google-search-results
Installing collected packages: google-search-results
Successfully installed google-search-results-2.4.2


In [None]:
# Paso 1. Registrarse a SERP API y Open AI para obetener las siguientes claves

from google.colab import userdata

SERP_API_KEY = userdata.get("SERP_API_KEY")
#OPENAI_ORGANIZATION = userdata.get("OPENAI_ORGANIZATION")
OPENAI_API_KEY = userdata.get("OPENAI_API_KEY")

In [None]:
from itertools import islice
from dataclasses import dataclass
from serpapi import GoogleSearch

@dataclass(frozen=True)
class SnippetCitation:
    Url: str
    Title: str
    Snippet: str

def serp_results(query: str, num=5, api_key=SERP_API_KEY):
  params = {
      "engine": "google",
      "q": query,
      "api_key": api_key,
      "num":num
  }
  search = GoogleSearch(params)
  res = search.get_dict()
  organic_results = res.get("organic_results", []) # Add this line to safely access the key
  return_results = []
  for result in organic_results:
      try:
        return_results.append(SnippetCitation(Url=result["link"], Title=result["title"], Snippet=result["snippet"]))
      except Exception as e:
          print(e)
  return return_results

In [None]:
serp_res = serp_results("¿Cual es el nombre del Papa?")
serp_res

[SnippetCitation(Url='https://es.wikipedia.org/wiki/Francisco_(papa)', Title='Francisco (papa) - Wikipedia, la enciclopedia libre', Snippet='Jorge Mario Bergoglio · Francisco · 17 de diciembre de 1936. Buenos Aires, Argentina · 21 de abril de 2025 (88 años) Domus Sanctae Marthae, Ciudad del Vaticano.'),
 SnippetCitation(Url='https://www.facebook.com/nmas.com.mx/videos/qui%C3%A9n-es-el-nuevo-papa/1825277991383738/', Title='El Vaticano anunció que el cardenal estadounidense Robert ...', Snippet='El Vaticano anunció que el cardenal estadounidense Robert Francis Prevost es el nuevo papa y su nombre será León XIV. Este es su perfil y obra. ...'),
 SnippetCitation(Url='https://es.wikipedia.org/wiki/Papa', Title='Papa - Wikipedia, la enciclopedia libre', Snippet='Conforme a la tradición católica, el papado tiene su origen en Pedro, apóstol de Jesús, que fue constituido como primer papa y a quien se le otorgó la dirección ...'),
 SnippetCitation(Url='https://www.nationalgeographicla.com/histor

# Paso 3

Utilizar GPT para responder a la pregunta.

Siguiendo la documentación de la API de OpenAI, escriban una función para generar texto simple


In [None]:
from openai import OpenAI
client = OpenAI(api_key=OPENAI_API_KEY)

In [None]:
  # Uses OPENAI_API_KEY environment variable

def chat_complete(
    syst: str | None,
    user: list[str] = [],
    assistant: list[str] = [],
    max_tokens: int = 1024,
    temperature: float = 0,
    model: str = "gpt-4o",
) -> str:
    # Initialize the OpenAI client
    messages: list[dict[str, str]] = []

    if syst is not None:
        messages.append({"role": "system", "content": syst})

    for i in range(len(user)):
        messages.append({"role": "user", "content": user[i]})
        if len(assistant) > i:
            messages.append({"role": "assistant", "content": assistant[i]})

    response = client.chat.completions.create(
        model=model,
        messages=messages,
        max_tokens=max_tokens,
        temperature=temperature,
    )

    return response.choices[0].message.content

In [None]:
chat_complete("Hola")

'¡Hola! ¿En qué puedo ayudarte hoy?'

# Paso 4

Pensemos un buen prompt que pueda tomar como contexto la información obtenida de SERP API

In [None]:

SYSTEM_PROMPT = """Tu objetivo es responder a la pregunta [PREGUNTA] utilizando este contexto [CONTEXTO].

Si la respuesta no se encuentra en el contexto, responde que no sabes. """


In [None]:
pregunta = "¿Cual es el nombre del Papa?"

In [None]:
SYSTEM_PROMPT = SYSTEM_PROMPT.replace("[PREGUNTA]", pregunta)
SYSTEM_PROMPT = SYSTEM_PROMPT.replace("[CONTEXTO]", str(serp_res))

In [None]:
chat_complete(SYSTEM_PROMPT)

'El nombre del Papa es León XIV, anteriormente conocido como el cardenal Robert Francis Prevost.'

# Paso 6

Darle una forma estructurada a las respuestas.

Ahora vamos a adaptar la función chat_complete para recibir como parámetro el schema


In [None]:
def limpiar_markdown(content: str):
    # Remove markdown code block markers
    content = content.strip()
    if content.startswith('```json'):
        content = content[7:]  # Remove ```json
    elif content.startswith('```'):
        content = content[3:]   # Remove ```
    if content.endswith('```'):
        content = content[:-3]  # Remove closing ```
    content = content.strip()
    return content

In [None]:
def chat_complete(
    syst: str | None,
    user: list[str] = [],
    assistant: list[str] = [],
    max_tokens: int = 1024,
    temperature: float = 0,
    model: str = "gpt-4o",
    schema: dict | None = None
) -> str:
    # Initialize the OpenAI client
    messages: list[dict[str, str]] = []

    if syst is not None:
        messages.append({"role": "system", "content": syst})

    for i in range(len(user)):
        messages.append({"role": "user", "content": user[i]})
        if len(assistant) > i:
            messages.append({"role": "assistant", "content": assistant[i]})

    # Build the request parameters
    request_params = {
        "model": model,
        "messages": messages,
        "max_tokens": max_tokens,
        "temperature": temperature,
    }
    if schema is not None:
        request_params["response_format"] = {
            "type": "json_schema",
            "json_schema": {
                "name": "structured_response",
                "schema": schema,
                "strict": True
            }
        }
    response = client.chat.completions.create(**request_params)
    content = response.choices[0].message.content
    content = limpiar_markdown(content)
    return content


In [None]:
SYSTEM_PROMPT = """Tu objetivo es responder a la pregunta [PREGUNTA] utilizando este contexto [CONTEXTO].

El formato de salida debe ser un array de json con todas las entidades mencionadas. Cada una representada como un único string del título """

In [None]:
pregunta = "Recomendaciones de series 2025"

In [None]:
serp_res = serp_results(pregunta)

In [None]:
SYSTEM_PROMPT = SYSTEM_PROMPT.replace("[PREGUNTA]", pregunta)
SYSTEM_PROMPT = SYSTEM_PROMPT.replace("[CONTEXTO]", str(serp_res))

In [None]:
# Ahora representemos en un diccionario un esquema con un array de string
RECOMMENDATIONS_SCHEMA = {
    "type": "ARRAY",
    "items": {
        "type": "STRING"
    }
}

In [None]:
json_list = chat_complete(SYSTEM_PROMPT)

In [None]:
import json

json.loads(json_list)

['Untitled Brad Ingelsby/HBO Drama Series',
 'Il figlio del secolo',
 'Andor - Temporada 2',
 'Colegio Abbot (Abbott Elementary) - Temporada',
 'The Pitt',
 'Si la vida te da mandarinas...',
 "Takopi's Original Sin",
 'Dexter']

# Paso 7. Bonus

Como extra, hagamos una función que nos indique dónde ver cada una de las series.

In [None]:
shows = json.loads(json_list)

In [None]:
def get_streaming_service(show:str):
  SYSTEM_PROMPT = """Tu objetivo es responder a la pregunta [PREGUNTA] utilizando este contexto [CONTEXTO]."""
  pregunta = f"¿Dónde puedo ver la serie {show}?"
  contexto = serp_results(pregunta)
  SYSTEM_PROMPT = SYSTEM_PROMPT.replace("[PREGUNTA]", pregunta)
  SYSTEM_PROMPT = SYSTEM_PROMPT.replace("[CONTEXTO]", str(contexto))
  streaming = chat_complete(SYSTEM_PROMPT)
  print(show,"-->" ,streaming)
  return (show, streaming)

In [None]:
results = []
# Hagamos sólo 5 para ahorrar costos
for show in shows[:5]:
  results.append(get_streaming_service(show))

Untitled Brad Ingelsby/HBO Drama Series --> Puedes ver la serie "Untitled Brad Ingelsby/HBO Drama Series", también conocida como "Task", en HBO Max.
Il figlio del secolo --> Puedes ver la serie "Il figlio del secolo" en las plataformas de streaming MUBI, MUBI Amazon Channel, SkyShowtime y NOW.
Andor - Temporada 2 --> Puedes ver la serie "Andor - Temporada 2" en Disney Plus.
Colegio Abbot (Abbott Elementary) - Temporada --> Puedes ver la serie "Colegio Abbot" (Abbott Elementary) en varias plataformas de streaming. Está disponible en Hulu, HBO Max, ABC.com, Prime Video y Apple TV.
The Pitt --> Puedes ver la serie "The Pitt" en HBO Max, Hulu, Prime Video y Apple TV.
