In [1]:
import os 
import requests 
from dotenv import load_dotenv
from bs4 import BeautifulSoup 
from IPython.display import Markdown, display
from openai import OpenAI


In [2]:
headers = {
    "User-Agent": "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:142.0) Gecko/20100101 Firefox/142.0"
}

class Website:
    def __init__(self, url):
        self.url = url 
        response = requests.get(url, headers=headers)
        soup = BeautifulSoup(response.content, 'html.parser')
        self.title = soup.title.string if soup.title else "Not Title found"

        for irrelevant in soup.body(["script", "style", "img", "input"]):
            irrelevant.decompose() 
        self.text = soup.body.get_text(separator="\n", strip=True)
        

In [3]:
system_prompt = """
 You are a assistant that analyzes the contents of a website \ 
 and provide a short summary, ignoring text that might be navigation related.
 Respond in Markdown.

"""

def user_prompt_for(website):
    user_prompt = f"You are looking at a website titled {website.title}"
    user_prompt += """
        \n The content of this website is a follows; \
        please provide a short summary of this website in markdown. \
        If it includes news or announcements, then summarize these too. \n\n
        
    """

    user_prompt += website.text 
    return user_prompt

In [4]:
# Constants

OLLAMA_API = "http://localhost:11434/api/chat"
HEADERS = {"Content-Type": "application/json"}
MODEL = "llama3.2"

# Create a messages list using the same format that we used for OpenAI

def messages_for(website):
    return  [
        {"role": "system", "content": system_prompt},
        {"role": "user", "content": user_prompt_for(website)}
    ]





In [5]:

def sumarize(url):
    website = Website(url) 
    payload = {
        "model": MODEL,
        "messages": messages_for(website),
        "stream": False
    }
    response = requests.post(OLLAMA_API, json=payload, headers=HEADERS)
    return response.json()["message"]["content"]
    
    

In [6]:

# Let's just make sure the model is loaded

!ollama pull llama3.2

[?2026h[?25l[1Gpulling manifest ⠋ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠙ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠹ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠸ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠼ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠴ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠦ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠧ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠇ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠏ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠋ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest ⠙ [K[?25h[?2026l[?2026h[?25l[1Gpulling manifest [K
pulling dde5aa3fc5ff: 100% ▕██████████████████▏ 2.0 GB                         [K
pulling 966de95ca8a6: 100% ▕██████████████████▏ 1.4 KB                         [K
pulling fcc5a6bec9da: 100% ▕██████████████████▏ 7.7 KB                         [K
pulling a70ff7e570d9: 100% ▕██████████████████▏ 6.0 KB          

In [7]:
def display_summary(url):
    summary = sumarize(url)
    display(Markdown(summary))
    

In [8]:
display_summary("https://news.google.com/topics/CAAqLAgKIiZDQkFTRmdvSkwyMHZNR1ptZHpWbUVnVndkQzFDVWhvQ1FsSW9BQVAB?hl=pt-BR&gl=BR&ceid=BR%3Apt-419")

Aqui estão alguns dos principais lançamentos e notícias do mundo do entretenimento, tecnologia e esportes publicadas nos últimos dias:

**Jogos**

*   **The Rogue Prince of Persia**: Um jogo de aventura que é desafiador e divertido.
*   **Heroes of Loot 2**: Um jogo de ação em linha com um jogo de RPG.
*   **Fantasy Empires**: Um jogo estratégico que combina elementos de táticas em tempo real e RPGs.
*   **The Rogue Prince of Persia**: O jogo chega para PC, PS e Xbox.

**Tecnologia**

*   **Motorola Moto G05**: Um smartphone com bateria grande e câmera de 50 MP em oferta por menos de R$ 600.
*   **Samsung Galaxy S26 Pro**: Uma linha de telefones inteligentes que inclui o modelo com uma capacidade de armazenamento de até 512 GB.
*   **Realme C75**: Um celular 5G que aposta em resistência e longa bateria.

**Esportes**

*   **Fase da Lua**: Hoje é a data do aumento do satélite da lua, uma das primeiras missões mais complexas de manutenção.
*   **Clair Obscur: Expedition 33**: Jogo com uma franquia que terá continuação após o sucesso inicial.

**Economia e Negócios**

*   A liquidação da Amazon, TV TCL, Smart TV TCL, TCL revoluciona a experiência audiovisual com a nova TV C8K, entre outros estão na agenda.