In [None]:
from dataclasses import dataclass
from datetime import datetime
from typing import Optional
import requests
from bs4 import BeautifulSoup
import pandas as pd 
import time

In [96]:
url = 'https://cnnespanol.cnn.com/colombia'
response = requests.get(url)
soup = BeautifulSoup(response.content, 'html.parser')

titles = []
urls = []
contents = []
timestamps = []

for link in soup.find_all('a', class_='container__link', href=True):
    href = link.get('href', '')
    
    if '/2025/' not in href and '/2024/' not in href:
        continue
    
    if not href.startswith('http'):
        href = f"https://cnnespanol.cnn.com{href}"
    
    title_span = link.find('span', class_='container__headline-text')
    
    if title_span and href not in urls:
        titles.append(title_span.get_text(strip=True))
        urls.append(href)

print(f"Encontrados: {len(titles)} articulos")

for i, article_url in enumerate(urls, 1):
    print(f"[{i}/{len(urls)}] Descargando...")
    
    try:
        response = requests.get(article_url)
        article_soup = BeautifulSoup(response.content, 'html.parser')
        
        paragraphs = article_soup.find_all('p', class_='paragraph')
        content = "\n\n".join([p.get_text(strip=True) for p in paragraphs])
        contents.append(content)
        timestamps.append(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))
        
        time.sleep(0.5)
        
    except:
        contents.append("")
        timestamps.append(datetime.now().strftime("%Y-%m-%d %H:%M:%S"))

df = pd.DataFrame({
    'title': titles,
    'url': urls,
    'content': contents,
    'timestamp': timestamps,
})
df['content_length'] = df['content'].apply(len)
df = df[df['content_length'] > 0].reset_index(drop=True)

df

Encontrados: 44 articulos
[1/44] Descargando...
[2/44] Descargando...
[3/44] Descargando...
[4/44] Descargando...
[5/44] Descargando...
[6/44] Descargando...
[7/44] Descargando...
[8/44] Descargando...
[9/44] Descargando...
[10/44] Descargando...
[11/44] Descargando...
[12/44] Descargando...
[13/44] Descargando...
[14/44] Descargando...
[15/44] Descargando...
[16/44] Descargando...
[17/44] Descargando...
[18/44] Descargando...
[19/44] Descargando...
[20/44] Descargando...
[21/44] Descargando...
[22/44] Descargando...
[23/44] Descargando...
[24/44] Descargando...
[25/44] Descargando...
[26/44] Descargando...
[27/44] Descargando...
[28/44] Descargando...
[29/44] Descargando...
[30/44] Descargando...
[31/44] Descargando...
[32/44] Descargando...
[33/44] Descargando...
[34/44] Descargando...
[35/44] Descargando...
[36/44] Descargando...
[37/44] Descargando...
[38/44] Descargando...
[39/44] Descargando...
[40/44] Descargando...
[41/44] Descargando...
[42/44] Descargando...
[43/44] Descargan

Unnamed: 0,title,url,content,timestamp,content_length
0,El gran protagonismo del fútbol femenino en 20...,https://cnnespanol.cnn.com/2025/12/28/deportes...,No fue un 2025 más para el fútbol femenino. So...,2025-12-29 16:57:00,2131
1,"Es estadounidense e hija de inmigrantes, pero ...",https://cnnespanol.cnn.com/2025/12/27/latinoam...,"Alyssa Bolaños, de 34 años, siempre tuvo en me...",2025-12-29 16:57:01,6315
2,Petro declara la emergencia económica en Colom...,https://cnnespanol.cnn.com/2025/12/23/colombia...,El Gobierno de Colombia declaró este lunes el ...,2025-12-29 16:57:03,9137
3,"Disidencias de las FARC atacan Suárez, pueblo ...",https://cnnespanol.cnn.com/2025/12/21/latinoam...,Guerrilleros de una disidencia de la antigua g...,2025-12-29 16:57:04,1952
4,La guerrilla del ELN anuncia alto el fuego uni...,https://cnnespanol.cnn.com/2025/12/21/colombia...,La guerrilla del Ejército de Liberación Nacion...,2025-12-29 16:57:05,2166
5,Sube a 7 el número de muertos tras ataque cont...,https://cnnespanol.cnn.com/2025/12/18/colombia...,Siete soldados murieron y otros resultaron her...,2025-12-29 16:57:06,3200
6,El caso de las frambuesas envenenadas: hallan ...,https://cnnespanol.cnn.com/2025/12/18/colombia...,"El 4 de abril, tres amigas de entre 13 y 14 añ...",2025-12-29 16:57:07,7430
7,Disturbios en la final de la Copa BetPlay 2025...,https://cnnespanol.cnn.com/2025/12/18/deportes...,Atlético Nacional se coronó campeón de la Copa...,2025-12-29 16:57:08,2529
8,Junior de Barranquilla es el nuevo campeón del...,https://cnnespanol.cnn.com/2025/12/16/deportes...,Colombia tiene nuevo campeón. Junior de Barran...,2025-12-29 16:57:09,607
9,"¿Quién es Paloma Valencia, la discípula de Uri...",https://cnnespanol.cnn.com/2025/12/16/colombia...,Paloma Valencia quiere que se confirme que ell...,2025-12-29 16:57:16,5388
