# Gratificación instantánea

## ¡Tu primer proyecto de LLM de Frontier!

Construyamos una solución LLM útil en cuestión de minutos.

Al finalizar este curso, habrás creado una solución de IA autónoma de Agentic con 7 agentes que colaboran para resolver un problema comercial. ¡Todo a su debido tiempo! Comenzaremos con algo más pequeño...

Nuestro objetivo es codificar un nuevo tipo de navegador web. Dale una URL y responderá con un resumen. ¡El Reader's Digest de Internet!

Antes de comenzar, deberías haber completado la configuración para [PC](../SETUP-PC.md) o [Mac](../SETUP-mac.md) y, con suerte, habrás iniciado este laboratorio de Jupyter desde el directorio raíz del proyecto, con tu entorno activado.

## Si eres nuevo en Jupyter Lab

¡Bienvenido al maravilloso mundo de la experimentación en ciencia de datos! Una vez que hayas usado Jupyter Lab, te preguntarás cómo pudiste vivir sin él. Simplemente haga clic en cada "celda" que contenga código, como la celda inmediatamente debajo de este texto, y presione Shift+Return para ejecutar esa celda. Como desee, puede agregar una celda con el botón + en la barra de herramientas e imprimir valores de variables o probar variaciones.

He escrito un cuaderno llamado [Guía para Jupyter](Guide%20to%20Jupyter.ipynb) para ayudarlo a familiarizarse más con Jupyter Labs, incluida la adición de comentarios de Markdown, el uso de `!` para ejecutar comandos de shell y `tqdm` para mostrar el progreso.

Si prefiere trabajar en IDE como VSCode o Pycharm, ambos funcionan muy bien con estos cuadernos de laboratorio también.

## Si desea repasar su Python

He agregado un cuaderno llamado [Python intermedio](Intermediate%20Python.ipynb) para ayudarlo a ponerse al día. Pero no deberías probarlo si ya tienes una buena idea de lo que hace este código:
`yield from {book.get("author") for book in books if book.get("author")}`

## Estoy aquí para ayudarte

Si tienes algún problema, no dudes en ponerte en contacto conmigo.
Estoy disponible a través de la plataforma,o en https://www.linkedin.com/in/juan-gabriel-gomila-salas/ si quieres conectarte (¡y me encanta conectarme!).

## Más resolución de problemas

Consulta el cuaderno de [solución de problemas](troubleshooting.ipynb) en esta carpeta para diagnosticar y solucionar problemas comunes.

## ¡Si esto ya es pan comido!

Si ya te sientes cómodo con el material de hoy, no te desanimes; puedes avanzar rápidamente en los primeros laboratorios; profundizaremos mucho más a medida que avancen las semanas.

## Valor comercial de estos ejercicios

Una última reflexión. Aunque he diseñado estos cuadernos para que sean educativos, también he intentado que sean divertidos. Haremos cosas divertidas, como que los estudiantes de LLM cuenten chistes y discutan entre ellos. Pero, fundamentalmente, mi objetivo es enseñar habilidades que se puedan aplicar en los negocios. Explicaré las implicaciones comerciales a medida que avancemos y vale la pena tener esto en cuenta: a medida que adquiera experiencia con modelos y técnicas, piense en formas en las que podría poner esto en práctica en el trabajo hoy. Comuníquese conmigo si desea hablar más sobre esto o si tiene ideas para compartir conmigo.

In [1]:
#Instalación de openai
pip install openai

Note: you may need to restart the kernel to use updated packages.


In [9]:
# imports

import os#Permite trab con fnes del SO y deja leer variables de entorno y manejar rutas y archivos
import requests#Sirve para hacer peticiones HTTP y obtener datos de webs o APIs
from dotenv import load_dotenv#Carga las variable definidas en un arch .env para q estén disponibles en el código
from bs4 import BeautifulSoup#Permite extraer y analizar info .html o .xml->usado para web scraping
from IPython.display import Markdown, display#Muestra txt con formato Markdown en entornos con Jupyter Notebook
from openai import OpenAI#Brinda la clase/cliente para conectarse y usar la API de openai

# Si recibe un error al ejecutar esta celda, diríjase al cuaderno de solución de problemas (troubleshooting.ipynb).

# Conexión a OpenAI

La siguiente celda es donde cargamos las variables de entorno en su archivo `.env` y nos conectamos a OpenAI.

## Solución de problemas si tiene problemas:

Vaya al cuaderno [solución de problemas](troubleshooting.ipynb) en esta carpeta para obtener el código paso a paso para identificar la causa raíz y solucionarlo.

Si realiza un cambio, intente reiniciar el "Kernel" (el proceso de Python que se encuentra detrás de este cuaderno) mediante el menú Kernel >> Reiniciar Kernel y borrar los resultados de todas las celdas. Luego, intente con este cuaderno nuevamente, comenzando desde arriba.

O bien, ¡contácteme! Envíeme un mensaje a través del foro del curso y haremos que esto funcione.

¿Tiene alguna inquietud sobre los costos de la API? Vea mis notas en el README: los costos deberían ser mínimos y puede controlarlos en cada punto. También puede usar Ollama como una alternativa gratuita, que analizamos durante el día 2.

In [10]:
# Cargamos las variables del fichero .env

load_dotenv()
api_key = os.getenv('OPENAI_API_KEY')

# Check the key

if not api_key:
    print("No se encontró ninguna clave API: diríjase al cuaderno de resolución de problemas en esta carpeta para identificarla y solucionarla.")
elif not api_key.startswith("sk-proj-"):
    print("Se encontró una clave API, pero no inicia sk-proj-; verifique que esté usando la clave correcta; consulte el cuaderno de resolución de problemas")
elif api_key.strip() != api_key:
    print("Se encontró una clave API, pero parece que puede tener espacios o caracteres de tabulación al principio o al final; elimínelos; consulte el cuaderno de resolución de problemas")
else:
    print("¡Se encontró la clave API y hasta ahora parece buena!")


¡Se encontró la clave API y hasta ahora parece buena!


In [11]:
openai = OpenAI()#Creamos el Objeto Cliente con OpenAI() y lo guardamos acá para dps usarlo

# Si esto no funciona, prueba con el menú Kernel >> Reiniciar Kernel y borrar las salidas de todas las celdas, luego ejecuta las celdas desde la parte superior de este cuaderno hacia abajo.
# Si TODAVÍA no funciona (¡qué horror!), consulta el cuaderno de resolución de problemas o prueba la siguiente línea:
# openai = OpenAI(api_key="your-key-here-starting-sk-proj-")

In [12]:
# Una clase para representar una página web
# Si no estás familiarizado con las clases, consulta el cuaderno "Python intermedio"

class Website:
    """
    Una clase de utilidad para representar un sitio web que hemos scrappeado
    """

    def __init__(self, url):
        """
        Crea este objeto de sitio web a partir de la URL indicada utilizando la biblioteca BeautifulSoup
        """
        self.url = url
        response = requests.get(url)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "No tiene título"
        for irrelevant in soup.body(["script", "style", "img", "input"]):
            irrelevant.decompose()
        self.text = soup.body.get_text(separator="\n", strip=True)

In [13]:
# Vamos a probar

frog = Website("https://cursos.frogamesformacion.com")
print(frog.title)
print(frog.text)

Frogames
Ir al contenido principal
Frogames
Menú alternativo
Menú
Iniciar sesión
Ganadora del premio 'Enseñanza online de datos y competencias digitales más innovadora de Europa, 2023'
Pasión por
aprender
con los
mejores
En Frogames Formación te ayudamos a convertirte en todo un experto en: Programación de Videojuegos, Inteligencia Artificial, Machine Learning, Desarrollo de Apps, Data Science y mucho más.
Aprende mientras te diviertes
Cursos, Rutas y Suscripciones
Certificados de finalización
Qué encontrarás
dentro
de Frogames
Cursos online y formación de calidad para toda la família
Rutas temáticas
Rutas organizadas para que aprendas paso a paso, subiendo cada escalón e incrementando tus conocimientos adquiridos
Instructores Expertos
Con un equipo de profesionales y expertos en la materia que te acompañará a lo largo de todo el aprendizaje en la plataforma
Certificados blockchain
Títulos verificados por blockchain para cada habilidad que aprendas, listos para compartir en tus redes s

## Tipos de indicaciones/prompts

Quizás ya sepas esto, pero si no, te resultará muy familiar.

Los modelos como GPT4o han sido entrenados para recibir instrucciones de una manera particular.

Esperan recibir:

**Una indicación del sistema** que les indique qué tarea están realizando y qué tono deben usar

**Una indicación del usuario**: el inicio de la conversación al que deben responder

In [14]:
# Define nuestro mensaje de sistema: puedes experimentar con esto más tarde, cambiando la última oración a "Responder en Markdown en español".

system_prompt = "Eres un asistente que analiza el contenido de un sitio web \
y proporciona un breve resumen, ignorando el texto que podría estar relacionado con la navegación. \
Responder en Markdown."

In [15]:
# Una función que escribe un mensaje de usuario que solicita resúmenes de sitios web:

def user_prompt_for(website):
    user_prompt = f"Estás viendo un sitio web titulado {website.title}"
    user_prompt += "\nEl contenido de este sitio web es el siguiente; \
    proporciona un breve resumen de este sitio web en formato Markdown. \
    Si incluye noticias, productos o anuncios, resúmelos también.\n\n"
    user_prompt += website.text
    return user_prompt

In [16]:
print(user_prompt_for(frog))

Estás viendo un sitio web titulado Frogames
El contenido de este sitio web es el siguiente;     proporciona un breve resumen de este sitio web en formato Markdown.     Si incluye noticias, productos o anuncios, resúmelos también.

Ir al contenido principal
Frogames
Menú alternativo
Menú
Iniciar sesión
Ganadora del premio 'Enseñanza online de datos y competencias digitales más innovadora de Europa, 2023'
Pasión por
aprender
con los
mejores
En Frogames Formación te ayudamos a convertirte en todo un experto en: Programación de Videojuegos, Inteligencia Artificial, Machine Learning, Desarrollo de Apps, Data Science y mucho más.
Aprende mientras te diviertes
Cursos, Rutas y Suscripciones
Certificados de finalización
Qué encontrarás
dentro
de Frogames
Cursos online y formación de calidad para toda la família
Rutas temáticas
Rutas organizadas para que aprendas paso a paso, subiendo cada escalón e incrementando tus conocimientos adquiridos
Instructores Expertos
Con un equipo de profesionales y

## Mensajes

La API de OpenAI espera recibir mensajes en una estructura particular.
Muchas de las otras API comparten esta estructura:

```
[
    {"role": "system", "content": "el mensaje de sistema va aquí"},
    {"role": "user", "content": "el mensaje de usuario va aquí"}
]

In [20]:
# Puedes ver cómo esta función crea exactamente el formato anterior

def messages_for(website):
    return [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt_for(website)}
    ]

In [21]:
messages_for(frog)

[{'role': 'system',
  'content': 'Eres un asistente que analiza el contenido de un sitio web y proporciona un breve resumen, ignorando el texto que podría estar relacionado con la navegación. Responder en Markdown.'},
 {'role': 'user',
  'content': "Estás viendo un sitio web titulado Frogames\nEl contenido de este sitio web es el siguiente;     proporciona un breve resumen de este sitio web en formato Markdown.     Si incluye noticias, productos o anuncios, resúmelos también.\n\nIr al contenido principal\nFrogames\nMenú alternativo\nMenú\nIniciar sesión\nGanadora del premio 'Enseñanza online de datos y competencias digitales más innovadora de Europa, 2023'\nPasión por\naprender\ncon los\nmejores\nEn Frogames Formación te ayudamos a convertirte en todo un experto en: Programación de Videojuegos, Inteligencia Artificial, Machine Learning, Desarrollo de Apps, Data Science y mucho más.\nAprende mientras te diviertes\nCursos, Rutas y Suscripciones\nCertificados de finalización\nQué encontra

## Es hora de unirlo todo: ¡la API para OpenAI es muy simple!

In [22]:
# Y ahora: llama a la API de OpenAI. ¡Te resultará muy familiar!

def summarize(url):
    website = Website(url)#Le pasamos la fn con el arg url
    #Atrib q alamacenará la rta-completion
    response = openai.chat.completions.create(
        model = "gpt-4o-mini",
        messages = messages_for(website)
    )
    return response.choices[0].message.content

In [23]:
summarize("https://cursos.frogamesformacion.com")

'# Resumen del Sitio Web Frogames\n\nFrogames es una plataforma educativa premiada por su innovación en enseñanza online, enfocada en la formación en áreas como programación de videojuegos, inteligencia artificial, machine learning, desarrollo de aplicaciones, y data science. \n\n## Características Principales\n\n- **Cursos Online**: Ofrece una variedad de cursos y rutas temáticas organizadas para un aprendizaje estructurado.\n- **Certificaciones**: Al finalizar un curso, los estudiantes reciben certificados verificados por blockchain, que pueden ser compartidos en redes sociales.\n- **Actualizaciones Constantes**: La plataforma añade nuevos cursos y actualiza contenidos semanalmente.\n- **Instructores Expertos**: Un equipo de más de 20 profesionales guía a los estudiantes a lo largo de su aprendizaje.\n- **Testimonios de Estudiantes**: Más de 500,000 estudiantes han expresado su satisfacción con la calidad de los cursos y el apoyo recibido.\n\n## Cursos Destacados\n\nEntre los cursos 

In [24]:
# Una función para mostrar esto de forma clara en la salida de Jupyter, usando markdown

def display_summary(url):
    summary = summarize(url)
    display(Markdown(summary))

In [25]:
display_summary("https://cursos.frogamesformacion.com")

# Resumen de Frogames

Frogames es una plataforma de formación online premiada, enfocada en enseñar habilidades en programación, inteligencia artificial, desarrollo de aplicaciones, y ciencias de datos, entre otros. Destaca por ofrecer un aprendizaje divertido y accesible, con un enfoque en la enseñanza de competencias digitales innovadoras.

## ¿Qué Ofrecen?

- **Cursos y Rutas de Aprendizaje:** Proporcionan cursos temáticos organizados para guiar a los estudiantes a través de un proceso de aprendizaje estructurado.
- **Instructores Expertos:** Un equipo de más de 20 profesionales acompaña a los alumnos durante su formación.
- **Certificados en Blockchain:** Al finalizar los cursos, los estudiantes obtienen certificados que pueden ser compartidos en redes sociales y mejoran su currículum.
- **Actualizaciones Constantes:** Nuevos cursos y actualizaciones semanales del contenido.

## Cursos Destacados

Algunos de los cursos más populares incluyen:
- **Curso Completo de Ingeniería de Agentes de IA**
- **Domina Android desde cero con Kotlin**
- **Fundamentos Avanzados de Matemáticas para Machine Learning**
- **Curso Completo de Python de la A a la Z**

## Testimonios

Frogames ha sido bien recibido por sus estudiantes, con testimonios que resaltan la calidad de la enseñanza, la comunidad de aprendizaje y las oportunidades de desarrollo personal y profesional.

## Formación para Empresas

Ofrecen programas de formación adaptados para empresas, ayudando a los empleados a mejorar sus competencias en áreas como Power BI y desarrollo de software.

## Oportunidades de Afiliados

Frogames también cuenta con un programa de afiliados que permite a los usuarios generar ingresos al promocionar la plataforma.

¡Comienza a aprender hoy mismo con Frogames y explora los cursos que ofrecen!

# Probemos con más sitios web

Ten en cuenta que esto solo funcionará en sitios web que se puedan extraer con este enfoque simplista.

Los sitios web que se renderizan con Javascript, como las aplicaciones React, no se mostrarán. Consulta la carpeta de contribuciones de la comunidad para obtener una implementación de Selenium que solucione este problema. Deberás leer sobre la instalación de Selenium (¡pregunta a ChatGPT!).

Además, los sitios web protegidos con CloudFront (y similares) pueden generar errores 403. Muchas gracias, Andy J, por señalar esto.

¡Pero muchos sitios web funcionarán perfectamente!

In [26]:
display_summary("https://cnn.com")

# Resumen del Sitio Web de CNN

CNN es una fuente de noticias confiable que proporciona cobertura actualizada sobre una variedad de temas, incluyendo:

## Principales Secciones
- **Noticias de EE. UU.**: Cobertura política, sucesos locales, y eventos actuales.
- **Noticias Internacionales**: Informes sobre políticas, economía y cultura de diferentes países.
- **Salud**: Información sobre bienestar, avances científicos y problemas de salud global.
- **Entretenimiento**: Actualizaciones sobre celebrities, cine, música y cultura pop.
- **Estilo de Vida**: Temas de moda, diseño, y viajes.
- **Tecnología**: Innovaciones y cambios significativos en el mundo tecnológico.

## Temáticas Actuales
- **Conflictos Internacionales**: Informes sobre la guerra entre Ucrania y Rusia y el conflicto entre Israel y Hamas.
- **Sucedidos Notables**: Noticias sobre figuras públicas como Donald Trump y su administración, así como casos judiciales actuales.

## Contenido Multimedia
- **Videos**: Cobertura en vivo y documentales sobre diversos eventos.
- **Artículos de Análisis**: Profundización en eventos recientes y su contexto.

## Otros Temas Relevantes
- **Deportes**: Actualizaciones sobre competiciones, atletas destacados y eventos deportivos.
- **Ciencia y Clima**: Investigación científica y problemas medioambientales relacionados con el cambio climático.

CNN destaca por su compromiso con la veracidad y la presentación objetiva de las noticias, sirviendo como un recurso valioso para mantenerse informado sobre eventos a nivel mundial.

In [27]:
display_summary("https://anthropic.com")

# Resumen del sitio web de Anthropic

El sitio web de Anthropic se centra en la inteligencia artificial, destacando su modelo más reciente, **Claude Opus 4.1**, que se presenta como la versión más inteligente y poderosa hasta la fecha. El sitio proporciona información sobre diversas opciones de productos, incluyendo diferentes planes de uso (Max, Team y Enterprise), y recursos educativos a través de **Anthropic Academy**.

## Contenido Clave

### Productos
- **Claude Opus 4.1**: El modelo más avanzado, optimizado para tareas complejas.
- **Claude Sonnet 4**: Otro modelo poderoso diseñado para mejorar la experiencia en programación y agentes de IA.

### Noticias y Anuncios
- **ISO 42001 Certificación**: Un anuncio reciente que resalta el compromiso de Anthropic con los estándares de seguridad.
- **Visiones sobre la seguridad de la IA**: Reflexiones sobre la relación entre humanos y máquinas, abogando por un desarrollo responsable de la IA.

### Áreas de Enfoque
- **Investigación & Desarrollo**: Análisis sobre el impacto social de la IA y la importancia de escalado responsable.
- **Soluciones por Sector**: Aplicaciones de Claude en diversas áreas como educación, servicios financieros y atención al cliente.

### Valores Centrales
- Énfasis en el **bienestar humano** como base de su tecnología y un compromiso con la **transparencia** y la **responsabilidad** en el desarrollo de IA.

Este sitio actúa como una plataforma integral para interactuar con sus productos, acceder a recursos de aprendizaje y mantenerse al tanto de sus iniciativas y desarrollos recientes en tecnología de IA.

## Aplicaciones empresariales

En este ejercicio, experimentó la llamada a la API de un modelo de frontera (un modelo líder en la frontera de la IA) por primera vez. Esto se aplica ampliamente en todos los casos de uso de Gen AI y usaremos API como OpenAI en muchas etapas del curso, además de crear nuestros propios LLM.

Más específicamente, hemos aplicado esto a Resumen: un caso de uso clásico de Gen AI para hacer un resumen. Esto se puede aplicar a cualquier vertical empresarial: resumir las noticias, resumir el desempeño financiero, resumir un currículum en una carta de presentación; las aplicaciones son ilimitadas. Considere cómo podría aplicar Resumen en su negocio e intente crear un prototipo de solución.

## Un ejercicio extra para quienes disfrutan del web scraping

Puedes notar que si intentas `display_summary("https://openai.com")` - ¡no funciona! Esto se debe a que OpenAI tiene un sitio web sofisticado que usa Javascript. Hay muchas formas de evitar esto con las que algunos de ustedes pueden estar familiarizados. Por ejemplo, Selenium es un marco muy popular que ejecuta un navegador detrás de escena, renderiza la página y te permite consultarla. Si tienes experiencia con Selenium, Playwright o similar, no dudes en mejorar la clase Website para usarlos. En la carpeta de contribuciones de la comunidad, encontrarás una solución de Selenium de ejemplo de un estudiante (¡gracias!)

# Compartir tu código

¡Me encantaría que compartieras tu código después para que yo pueda compartirlo con otros! Notarás que algunos estudiantes ya han realizado cambios (incluida una implementación de Selenium) que encontrarás en la carpeta community-contributions. Si deseas agregar tus cambios a esa carpeta, envía una solicitud de incorporación de cambios con tus nuevas versiones en esa carpeta y yo fusionaré tus cambios.

Si no eres un experto en Git (¡y yo no lo soy!), entonces GPT ha dado algunas instrucciones útiles sobre cómo enviar una solicitud de incorporación de cambios. Es un proceso un poco complicado, pero una vez que lo hayas hecho una vez, estará bastante claro. Como consejo profesional: es mejor si borras las salidas de tus cuadernos Jupyter (Editar >> Limpiar las salidas de todas las celdas y luego Guardar) para tener cuadernos limpios.

Instrucciones de relaciones públicas cortesía de un amigo de IA: https://chatgpt.com/share/670145d5-e8a8-8012-8f93-39ee4e248b4c