# TAREA DE EJERCICIO

Actualiza el proyecto del día 1 para resumir una página web y utilizar un modelo de código abierto que se ejecute localmente a través de Ollama en lugar de OpenAI

Podrás utilizar esta técnica para todos los proyectos posteriores si prefiere no utilizar API de pago (closed source).

**Beneficios:**
1. Sin cargos por API: código abierto
2. Los datos no salen de su ordenador

**Desventajas:**
1. Tiene mucha menos potencia (parámetros) que el modelo Frontier

## Resumen de la instalación de Ollama

¡Simplemente visita [ollama.com](https://ollama.com) e instálalo!

Una vez que hayas terminado, el servidor ollama ya debería estar ejecutándose localmente.
Si entras en:
[http://localhost:11434/](http://localhost:11434/)

Debería ver el mensaje `Ollama se está ejecutando`.

De lo contrario, abre una nueva Terminal (Mac) o Powershell (Windows) e introduce `ollama serve`.
Luego, intenta entrar em [http://localhost:11434/](http://localhost:11434/) nuevamente.

In [34]:
# imports

import requests
from bs4 import BeautifulSoup
from IPython.display import Markdown, display

In [35]:
# Constantes

OLLAMA_API = "http://132.248.32.20:8080/api/chat"
HEADERS = {"Content-Type": "application/json"}
MODEL = "llama3.2"

In [36]:
# Crea una lista de mensajes utilizando el mismo formato que usamos para OpenAI

messages = [
    {"role": "user", "content": "Describe algunas de las aplicaciones comerciales de la IA generativa."}
]
print (messages)

[{'role': 'user', 'content': 'Describe algunas de las aplicaciones comerciales de la IA generativa.'}]


In [37]:
payload = {
        "model": MODEL,
        "messages": messages,
        "stream": False
    }

In [None]:
response = requests.post(OLLAMA_API, json=payload, headers=HEADERS)
print(response.json()['message']['content'])

# Presentación del paquete ollama

Ahora haremos lo mismo, pero utilizando el elegante paquete de Python ollama en lugar de una llamada HTTP directa.

En esencia, se realiza la misma llamada que se indicó anteriormente al servidor ollama que se ejecuta en localhost:11434

In [None]:
import ollama
import os

response = ollama.chat(model=MODEL, messages=messages)
print(response['message']['content'])

# AHORA el ejercicio para ti

Toma el código del día 1 e incorpóralo aquí para crear un resumidor de sitios web que use Llama 3.2 ejecutándose localmente en lugar de OpenAI

In [40]:

import requests
from bs4 import BeautifulSoup
from IPython.display import Markdown, display



In [42]:
# Una clase para representar una página web
# Si no estás familiarizado con las clases, consulta el cuaderno "Python intermedio"

class Website:
    """
    Una clase de utilidad para representar un sitio web que hemos scrappeado
    """

    def __init__(self, url):
        """
        Crea este objeto de sitio web a partir de la URL indicada utilizando la biblioteca BeautifulSoup
        """
        self.url = url
        response = requests.get(url)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "No tiene título"
        for irrelevant in soup.body(["script", "style", "img", "input"]):
            irrelevant.decompose()
        self.text = soup.body.get_text(separator="\n", strip=True)

In [None]:
pagina = Website("https://cursos.frogamesformacion.com")
pagina = Website("https://ibt.unam.mx")
print(pagina.title)
print(pagina.text)

In [47]:
OLLAMA_API = "http://132.248.32.20:8080/api/chat"
HEADERS = {"Content-Type": "application/json"}
MODEL = "llama3.2"

In [48]:
def user_prompt_for(website):
    user_prompt = f"Estás viendo un sitio web titulado {website.title}"
    user_prompt += "\nEl contenido de este sitio web es el siguiente; \
    proporciona un breve resumen de este sitio web en formato Markdown. \
    Si incluye noticias, productos o anuncios, resúmelos también.\n\n"
    user_prompt += website.text
    return user_prompt

In [56]:
def messages_for(website,sys_prompt):
    return [
    {"role": "user", "content": sys_prompt+ user_prompt_for(website)}
]

In [None]:
sysPrompt= "Eres un asistente que analiza el contenido de un sitio web \
y proporciona un breve resumen, ignorando el texto que podría estar relacionado con la navegación. \
Responder en Markdown. Esto del siguiente texto :"

#print(user_prompt_for(pagina))
messages_for(pagina,sysPrompt)

In [67]:
def summarize(url):
    sysPrompt="Eres un asistente que analiza el contenido de un sitio web \
y proporciona un breve resumen, ignorando el texto que podría estar relacionado con la navegación. \
Responder en Markdown. Esto del siguiente texto :"
    pagina = Website(url)
    payload = {
        "model": MODEL,
        "messages": messages_for(pagina,sysPrompt),
        "stream": False
    }
    response = requests.post(OLLAMA_API, json=payload, headers=HEADERS)
    return response.json()['message']['content']

In [68]:
def display_summary(url):
    summary = summarize(url)
    display(Markdown(summary))

In [73]:
display_summary("https://www.jornada.com.mx")

**Resumen del sitio web La Jornada**

La Jornada es un sitio web que ofrece noticias, análisis y contenido editorial sobre temas políticos, sociales y económicos. El sitio web cumple 40 años de existencia y se caracteriza por su compromiso con la resistencia y solidaridad.

**Noticias destacadas:**

* Detención de Hugo Buentello, ex subdirector de Operaciones de Segalmex
* Análisis sobre los costos injustificables de la banca comercial
* Exhortación de Claudia Sheinbaum Pardo a reducir las tasas de interés para alinear con el Banco de México

**Anuncios y publicidad:**

* Anuncios de diferentes empresas y organizaciones
* Publicidad en secciones como "La Jornada Impresa", "Editorial" y "Opinión"
* Promociones y franchisias en la sección "Franquicias"

**Otras secciones del sitio web:**

* "Suplementos" con contenido adicional sobre temas específicos
* "Videos" con material audiovisual relacionado con el contenido del sitio
* "Galerías" con imágenes y fotos relacionadas con los artículos del sitio
* Sección de "Síguenos en nuestras redes" para seguir al sitio web en diferentes redes sociales

**Información general sobre el sitio web:**

* La Jornada es propiedad de DEMOS, Desarrollo de Medios, S.A. de C.V.
* El sitio web tiene derechos de autor y se rige por un código de ética.