# Gratificaci√≥n instant√°nea

## ¬°Tu primer proyecto de LLM de Frontier!

Construyamos una soluci√≥n LLM √∫til en cuesti√≥n de minutos.

Al finalizar este curso, habr√°s creado una soluci√≥n de IA aut√≥noma de Agentic con 7 agentes que colaboran para resolver un problema comercial. ¬°Todo a su debido tiempo! Comenzaremos con algo m√°s peque√±o...

Nuestro objetivo es codificar un nuevo tipo de navegador web. Dale una URL y responder√° con un resumen. ¬°El Reader's Digest de Internet!

Antes de comenzar, deber√≠as haber completado la configuraci√≥n para [PC](../SETUP-PC.md) o [Mac](../SETUP-mac.md) y, con suerte, habr√°s iniciado este laboratorio de Jupyter desde el directorio ra√≠z del proyecto, con tu entorno activado.

## Si eres nuevo en Jupyter Lab

¬°Bienvenido al maravilloso mundo de la experimentaci√≥n en ciencia de datos! Una vez que hayas usado Jupyter Lab, te preguntar√°s c√≥mo pudiste vivir sin √©l. Simplemente haga clic en cada "celda" que contenga c√≥digo, como la celda inmediatamente debajo de este texto, y presione Shift+Return para ejecutar esa celda. Como desee, puede agregar una celda con el bot√≥n + en la barra de herramientas e imprimir valores de variables o probar variaciones.

He escrito un cuaderno llamado [Gu√≠a para Jupyter](Guide%20to%20Jupyter.ipynb) para ayudarlo a familiarizarse m√°s con Jupyter Labs, incluida la adici√≥n de comentarios de Markdown, el uso de `!` para ejecutar comandos de shell y `tqdm` para mostrar el progreso.

Si prefiere trabajar en IDE como VSCode o Pycharm, ambos funcionan muy bien con estos cuadernos de laboratorio tambi√©n.

## Si desea repasar su Python

He agregado un cuaderno llamado [Python intermedio](Intermediate%20Python.ipynb) para ayudarlo a ponerse al d√≠a. Pero no deber√≠as probarlo si ya tienes una buena idea de lo que hace este c√≥digo:
`yield from {book.get("author") for book in books if book.get("author")}`

## Estoy aqu√≠ para ayudarte

Si tienes alg√∫n problema, no dudes en ponerte en contacto conmigo.
Estoy disponible a trav√©s de la plataforma,o en https://www.linkedin.com/in/juan-gabriel-gomila-salas/ si quieres conectarte (¬°y me encanta conectarme!).

## M√°s resoluci√≥n de problemas

Consulta el cuaderno de [soluci√≥n de problemas](troubleshooting.ipynb) en esta carpeta para diagnosticar y solucionar problemas comunes.

## ¬°Si esto ya es pan comido!

Si ya te sientes c√≥modo con el material de hoy, no te desanimes; puedes avanzar r√°pidamente en los primeros laboratorios; profundizaremos mucho m√°s a medida que avancen las semanas.

## Valor comercial de estos ejercicios

Una √∫ltima reflexi√≥n. Aunque he dise√±ado estos cuadernos para que sean educativos, tambi√©n he intentado que sean divertidos. Haremos cosas divertidas, como que los estudiantes de LLM cuenten chistes y discutan entre ellos. Pero, fundamentalmente, mi objetivo es ense√±ar habilidades que se puedan aplicar en los negocios. Explicar√© las implicaciones comerciales a medida que avancemos y vale la pena tener esto en cuenta: a medida que adquiera experiencia con modelos y t√©cnicas, piense en formas en las que podr√≠a poner esto en pr√°ctica en el trabajo hoy. Comun√≠quese conmigo si desea hablar m√°s sobre esto o si tiene ideas para compartir conmigo.

In [1]:
# imports

import os
import requests
from dotenv import load_dotenv
from bs4 import BeautifulSoup
from IPython.display import Markdown, display
from openai import OpenAI

# Si recibe un error al ejecutar esta celda, dir√≠jase al cuaderno de soluci√≥n de problemas (troubleshooting.ipynb).

# Conexi√≥n a OpenAI

La siguiente celda es donde cargamos las variables de entorno en su archivo `.env` y nos conectamos a OpenAI.

## Soluci√≥n de problemas si tiene problemas:

Vaya al cuaderno [soluci√≥n de problemas](troubleshooting.ipynb) en esta carpeta para obtener el c√≥digo paso a paso para identificar la causa ra√≠z y solucionarlo.

Si realiza un cambio, intente reiniciar el "Kernel" (el proceso de Python que se encuentra detr√°s de este cuaderno) mediante el men√∫ Kernel >> Reiniciar Kernel y borrar los resultados de todas las celdas. Luego, intente con este cuaderno nuevamente, comenzando desde arriba.

O bien, ¬°cont√°cteme! Env√≠eme un mensaje a trav√©s del foro del curso y haremos que esto funcione.

¬øTiene alguna inquietud sobre los costos de la API? Vea mis notas en el README: los costos deber√≠an ser m√≠nimos y puede controlarlos en cada punto. Tambi√©n puede usar Ollama como una alternativa gratuita, que analizamos durante el d√≠a 2.

In [2]:
# Cargamos las variables del fichero .env

load_dotenv()
api_key = os.getenv('OPENAI_API_KEY')

# Check the key

if not api_key:
    print("No se encontr√≥ ninguna clave API: dir√≠jase al cuaderno de resoluci√≥n de problemas en esta carpeta para identificarla y solucionarla.")
elif not api_key.startswith("sk-proj-"):
    print("Se encontr√≥ una clave API, pero no inicia sk-proj-; verifique que est√© usando la clave correcta; consulte el cuaderno de resoluci√≥n de problemas")
elif api_key.strip() != api_key:
    print("Se encontr√≥ una clave API, pero parece que puede tener espacios o caracteres de tabulaci√≥n al principio o al final; elim√≠nelos; consulte el cuaderno de resoluci√≥n de problemas")
else:
    print("¬°Se encontr√≥ la clave API y hasta ahora parece buena!")


¬°Se encontr√≥ la clave API y hasta ahora parece buena!


In [3]:
openai = OpenAI()

# Si esto no funciona, prueba con el men√∫ Kernel >> Reiniciar Kernel y borrar las salidas de todas las celdas, luego ejecuta las celdas desde la parte superior de este cuaderno hacia abajo.
# Si TODAV√çA no funciona (¬°qu√© horror!), consulta el cuaderno de resoluci√≥n de problemas o prueba la siguiente l√≠nea:
# openai = OpenAI(api_key="your-key-here-starting-sk-proj-")

In [4]:
# Una clase para representar una p√°gina web
# Si no est√°s familiarizado con las clases, consulta el cuaderno "Python intermedio"

class Website:
    """
    Una clase de utilidad para representar un sitio web que hemos scrappeado
    """

    def __init__(self, url):
        """
        Crea este objeto de sitio web a partir de la URL indicada utilizando la biblioteca BeautifulSoup
        """
        self.url = url
        response = requests.get(url)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "No tiene t√≠tulo"
        for irrelevant in soup.body(["script", "style", "img", "input"]):
            irrelevant.decompose()
        self.text = soup.body.get_text(separator="\n", strip=True)

In [5]:
# Vamos a probar

frog = Website("https://cursos.frogamesformacion.com")
print(frog.title)
print(frog.text)

Frogames
Ir al contenido principal
Frogames
Men√∫ alternativo
Men√∫
Iniciar sesi√≥n
Ganadora del premio 'Ense√±anza online de datos y competencias digitales m√°s innovadora de Europa, 2023'
Pasi√≥n por
aprender
con los
mejores
En Frogames Formaci√≥n te ayudamos a convertirte en todo un experto en: Programaci√≥n de Videojuegos, Inteligencia Artificial, Machine Learning, Desarrollo de Apps, Data Science y mucho m√°s.
Aprende mientras te diviertes
Cursos, Rutas y Suscripciones
Certificados de finalizaci√≥n
Qu√© encontrar√°s
dentro
de Frogames
Cursos online y formaci√≥n de calidad para toda la fam√≠lia
Rutas tem√°ticas
Rutas organizadas para que aprendas paso a paso, subiendo cada escal√≥n e incrementando tus conocimientos adquiridos
Instructores Expertos
Con un equipo de profesionales y expertos en la materia que te acompa√±ar√° a lo largo de todo el aprendizaje en la plataforma
Certificados blockchain
T√≠tulos verificados por blockchain para cada habilidad que aprendas, listos para compa

## Tipos de indicaciones/prompts

Quiz√°s ya sepas esto, pero si no, te resultar√° muy familiar.

Los modelos como GPT4o han sido entrenados para recibir instrucciones de una manera particular.

Esperan recibir:

**Una indicaci√≥n del sistema** que les indique qu√© tarea est√°n realizando y qu√© tono deben usar

**Una indicaci√≥n del usuario**: el inicio de la conversaci√≥n al que deben responder

In [7]:
# Define nuestro mensaje de sistema: puedes experimentar con esto m√°s tarde, cambiando la √∫ltima oraci√≥n a "Responder en Markdown en espa√±ol".

system_prompt = "Eres un asistente que analiza el contenido de un sitio web \
y proporciona un breve resumen, ignorando el texto que podr√≠a estar relacionado con la navegaci√≥n. \
Responder en Markdown."

In [8]:
# Una funci√≥n que escribe un mensaje de usuario que solicita res√∫menes de sitios web:

def user_prompt_for(website):
    user_prompt = f"Est√°s viendo un sitio web titulado {website.title}"
    user_prompt += "\nEl contenido de este sitio web es el siguiente; \
    proporciona un breve resumen de este sitio web en formato Markdown. \
    Si incluye noticias, productos o anuncios, res√∫melos tambi√©n.\n\n"
    user_prompt += website.text
    return user_prompt

In [9]:
print(user_prompt_for(frog))

Est√°s viendo un sitio web titulado Frogames
El contenido de este sitio web es el siguiente;     proporciona un breve resumen de este sitio web en formato Markdown.     Si incluye noticias, productos o anuncios, res√∫melos tambi√©n.

Ir al contenido principal
Frogames
Men√∫ alternativo
Men√∫
Iniciar sesi√≥n
Ganadora del premio 'Ense√±anza online de datos y competencias digitales m√°s innovadora de Europa, 2023'
Pasi√≥n por
aprender
con los
mejores
En Frogames Formaci√≥n te ayudamos a convertirte en todo un experto en: Programaci√≥n de Videojuegos, Inteligencia Artificial, Machine Learning, Desarrollo de Apps, Data Science y mucho m√°s.
Aprende mientras te diviertes
Cursos, Rutas y Suscripciones
Certificados de finalizaci√≥n
Qu√© encontrar√°s
dentro
de Frogames
Cursos online y formaci√≥n de calidad para toda la fam√≠lia
Rutas tem√°ticas
Rutas organizadas para que aprendas paso a paso, subiendo cada escal√≥n e incrementando tus conocimientos adquiridos
Instructores Expertos
Con un equipo

## Mensajes

La API de OpenAI espera recibir mensajes en una estructura particular.
Muchas de las otras API comparten esta estructura:

```
[
    {"role": "system", "content": "el mensaje de sistema va aqu√≠"},
    {"role": "user", "content": "el mensaje de usuario va aqu√≠"}
]

In [10]:
# Puedes ver c√≥mo esta funci√≥n crea exactamente el formato anterior

def messages_for(website):
    return [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt_for(website)}
    ]

In [11]:
messages_for(frog)

[{'role': 'system',
  'content': 'Eres un asistente que analiza el contenido de un sitio web y proporciona un breve resumen, ignorando el texto que podr√≠a estar relacionado con la navegaci√≥n. Responder en Markdown.'},
 {'role': 'user',
  'content': "Est√°s viendo un sitio web titulado Frogames\nEl contenido de este sitio web es el siguiente;     proporciona un breve resumen de este sitio web en formato Markdown.     Si incluye noticias, productos o anuncios, res√∫melos tambi√©n.\n\nIr al contenido principal\nFrogames\nMen√∫ alternativo\nMen√∫\nIniciar sesi√≥n\nGanadora del premio 'Ense√±anza online de datos y competencias digitales m√°s innovadora de Europa, 2023'\nPasi√≥n por\naprender\ncon los\nmejores\nEn Frogames Formaci√≥n te ayudamos a convertirte en todo un experto en: Programaci√≥n de Videojuegos, Inteligencia Artificial, Machine Learning, Desarrollo de Apps, Data Science y mucho m√°s.\nAprende mientras te diviertes\nCursos, Rutas y Suscripciones\nCertificados de finalizaci√≥

## Es hora de unirlo todo: ¬°la API para OpenAI es muy simple!

In [12]:
# Y ahora: llama a la API de OpenAI. ¬°Te resultar√° muy familiar!

def summarize(url):
    website = Website(url)
    response = openai.chat.completions.create(
        model = "gpt-4o-mini",
        messages = messages_for(website)
    )
    return response.choices[0].message.content

In [13]:
summarize("https://cursos.frogamesformacion.com")

'# Resumen de Frogames\n\nFrogames es una plataforma de formaci√≥n online premiada en 2023 por su innovaci√≥n en la ense√±anza de datos y competencias digitales. Ofrece una amplia gama de cursos en √°reas como programaci√≥n de videojuegos, inteligencia artificial, machine learning, desarrollo de aplicaciones y data science. La plataforma se enfoca en una experiencia de aprendizaje divertida y accesible para toda la familia.\n\n## Caracter√≠sticas Clave\n- **Cursos Online de Calidad**: Amplia oferta de cursos tem√°ticos organizados para un aprendizaje efectivo y escalable.\n- **Instructores Expertos**: Un equipo de profesionales gu√≠a a los estudiantes durante su proceso educativo.\n- **Certificados Verificados**: Los certificados de finalizaci√≥n est√°n respaldados por tecnolog√≠a blockchain, ideales para compartir en redes sociales y mejorar el CV.\n- **Actualizaciones Constantes**: Nuevos contenidos se a√±aden cada semana y las rutas de aprendizaje se actualizan peri√≥dicamente.\n\n#

In [14]:
# Una funci√≥n para mostrar esto de forma clara en la salida de Jupyter, usando markdown

def display_summary(url):
    summary = summarize(url)
    display(Markdown(summary))

In [15]:
display_summary("https://cursos.frogamesformacion.com")

# Resumen del sitio web Frogames

Frogames es una plataforma de formaci√≥n online que se especializa en ense√±ar habilidades digitales y t√©cnicas, incluyendo programaci√≥n de videojuegos, inteligencia artificial, machine learning, desarrollo de aplicaciones y data science. La plataforma ha sido galardonada con el premio a la 'Ense√±anza online de datos y competencias digitales m√°s innovadora de Europa' en 2023.

## Caracter√≠sticas Principales:
- **Cursos Online**: Ofrecen cursos y rutas tem√°ticas organizadas para un aprendizaje progresivo.
- **Instructores Expertos**: Un equipo de profesionales acompa√±a a los estudiantes en su aprendizaje.
- **Certificados Blockchain**: Emisi√≥n de certificados verificados por blockchain que los estudiantes pueden compartir en sus redes sociales.
- **Contenido Actualizado**: Nuevos cursos y actualizaciones frecuentes.

## Cursos Destacados:
- **Machine Learning de la A a la Z**
- **Curso de desarrollo de videojuegos con Unity 2021**
- **Ingenier√≠a de LLM**
- **La Gu√≠a definitiva de ChatGPT** 

## Beneficios para Estudiantes:
- Acceso a m√°s de 500.000 estudiantes satisfechos que han desarrollado sus habilidades a trav√©s de la plataforma.
- Una comunidad activa que promueve el aprendizaje y el crecimiento personal.

## Oportunidades para Empresas:
Frogames tambi√©n ofrece formaci√≥n espec√≠fica para empresas, ayudando a los empleados a mejorar sus habilidades y competencias.

## Testimonios:
Los estudiantes destacan la calidad de los cursos, la experiencia de los instructores, y el ambiente comunitario que se respira en la plataforma.

## Prop√≥sito:
Frogames busca dar acceso a la educaci√≥n de calidad en √°reas de alta demanda, a precios accesibles, permitiendo que personas de diversas edades y or√≠genes puedan aprender y mejorar sus carreras.

## Llamado a la Acci√≥n:
Los nuevos usuarios pueden registrarse para acceder a un curso gratuito sobre trading algor√≠tmico en Python, ofreciendo una oportunidad para explorar la plataforma antes de comprometerse con una suscripci√≥n.

---

Este resumen proporciona una visi√≥n general de lo que ofrece Frogames, destacando su enfoque en la educaci√≥n digital innovadora y el soporte a estudiantes y empresas.

# Probemos con m√°s sitios web

Ten en cuenta que esto solo funcionar√° en sitios web que se puedan extraer con este enfoque simplista.

Los sitios web que se renderizan con Javascript, como las aplicaciones React, no se mostrar√°n. Consulta la carpeta de contribuciones de la comunidad para obtener una implementaci√≥n de Selenium que solucione este problema. Deber√°s leer sobre la instalaci√≥n de Selenium (¬°pregunta a ChatGPT!).

Adem√°s, los sitios web protegidos con CloudFront (y similares) pueden generar errores 403. Muchas gracias, Andy J, por se√±alar esto.

¬°Pero muchos sitios web funcionar√°n perfectamente!

In [16]:
display_summary("https://cnn.com")

# Resumen del sitio web de CNN

CNN es un portal de noticias que cubre eventos de actualidad a nivel mundial, con secciones dedicadas a pol√≠tica, negocios, salud, entretenimiento, ciencia, clima, deportes y m√°s. Adem√°s de art√≠culos escritos, el sitio ofrece contenido en video y transmisiones en vivo, permitiendo a los usuarios mantenerse informados sobre los eventos m√°s recientes y relevantes.

## Principales noticias y eventos destacados:
- **Liberaci√≥n de rehenes en Gaza**: Se informa sobre la reciente liberaci√≥n de tres rehenes israel√≠es.
- **Aumento de tarifas en EE. UU.**: El presidente Trump ha firmado nuevas tarifas extraordinarias sobre mercanc√≠as de M√©xico, Canad√° y China, lo que podr√≠a resultar en un aumento significativo de precios para los consumidores.
- **Accidente a√©reo en Filadelfia**: Un jet de medevac que transportaba a un ni√±o y a su madre se estrell√≥, resultando en la muerte de siete personas.

## Otras noticias relevantes:
- Un an√°lisis sobre la econom√≠a y pol√≠tica exterior de Trump, incluyendo sus √≥rdenes de ataques a√©reos en Somalia.
- La recuperaci√≥n de seis estadounidenses en Venezuela tras negociaciones con el gobierno de Maduro.
- La agresi√≥n en un mercado en Sud√°n que dej√≥ 54 muertos y numerosos heridos.

## Contenido adicional:
CNN tambi√©n presenta an√°lisis, comentarios en video y coberturas especiales sobre temas tanto globales como locales, incluyendo reportes de conflicto y desarrollos en ciencia y tecnolog√≠a. La p√°gina permite a los usuarios suscribirse a boletines de noticias personalizados y acceder a podcasts.

In [17]:
display_summary("https://openai.com")

# Resumen del sitio web "No tiene t√≠tulo"

El contenido del sitio web no proporciona informaci√≥n espec√≠fica ya que parece requerir que se habiliten JavaScript y cookies para su visualizaci√≥n completa. No hay noticias, productos o anuncios destacados visibles en la actualidad.

### Notas:
- La p√°gina parece depender de configuraciones del navegador para mostrar su contenido.
- No se puede acceder a informaci√≥n √∫til o relevante en este momento.

## Aplicaciones empresariales

En este ejercicio, experiment√≥ la llamada a la API de un modelo de frontera (un modelo l√≠der en la frontera de la IA) por primera vez. Esto se aplica ampliamente en todos los casos de uso de Gen AI y usaremos API como OpenAI en muchas etapas del curso, adem√°s de crear nuestros propios LLM.

M√°s espec√≠ficamente, hemos aplicado esto a Resumen: un caso de uso cl√°sico de Gen AI para hacer un resumen. Esto se puede aplicar a cualquier vertical empresarial: resumir las noticias, resumir el desempe√±o financiero, resumir un curr√≠culum en una carta de presentaci√≥n; las aplicaciones son ilimitadas. Considere c√≥mo podr√≠a aplicar Resumen en su negocio e intente crear un prototipo de soluci√≥n.

## Un ejercicio extra para quienes disfrutan del web scraping

Puedes notar que si intentas `display_summary("https://openai.com")` - ¬°no funciona! Esto se debe a que OpenAI tiene un sitio web sofisticado que usa Javascript. Hay muchas formas de evitar esto con las que algunos de ustedes pueden estar familiarizados. Por ejemplo, Selenium es un marco muy popular que ejecuta un navegador detr√°s de escena, renderiza la p√°gina y te permite consultarla. Si tienes experiencia con Selenium, Playwright o similar, no dudes en mejorar la clase Website para usarlos. En la carpeta de contribuciones de la comunidad, encontrar√°s una soluci√≥n de Selenium de ejemplo de un estudiante (¬°gracias!)

# Compartir tu c√≥digo

¬°Me encantar√≠a que compartieras tu c√≥digo despu√©s para que yo pueda compartirlo con otros! Notar√°s que algunos estudiantes ya han realizado cambios (incluida una implementaci√≥n de Selenium) que encontrar√°s en la carpeta community-contributions. Si deseas agregar tus cambios a esa carpeta, env√≠a una solicitud de incorporaci√≥n de cambios con tus nuevas versiones en esa carpeta y yo fusionar√© tus cambios.

Si no eres un experto en Git (¬°y yo no lo soy!), entonces GPT ha dado algunas instrucciones √∫tiles sobre c√≥mo enviar una solicitud de incorporaci√≥n de cambios. Es un proceso un poco complicado, pero una vez que lo hayas hecho una vez, estar√° bastante claro. Como consejo profesional: es mejor si borras las salidas de tus cuadernos Jupyter (Editar >> Limpiar las salidas de todas las celdas y luego Guardar) para tener cuadernos limpios.

Instrucciones de relaciones p√∫blicas cortes√≠a de un amigo de IA: https://chatgpt.com/share/670145d5-e8a8-8012-8f93-39ee4e248b4c