<h4 style="text-align:center;">
  WEBSCRAPING DE LAS ÚLTIMAS NOTICIAS IMPORTANTES DE CADA DEPARTAMENTO DEL PERÚ
</h4>
<div align="center">
  <img src="https://play-lh.googleusercontent.com/qW1VrjZzFiGv0km2y_cpfPhu2EtVCqynKlBNs8vOidXF7TUdFGfjCrho1Do6RAir45s" alt="Alojamiento en Airbnb" width="300"/>
</div>

In [None]:
# --- Importación de librerías ---
import requests
from bs4 import BeautifulSoup
import pandas as pd
import urllib.parse
import time

# Lista de departamentos del Perú
departamentos = [
    "Amazonas", "Áncash", "Apurímac", "Arequipa", "Ayacucho", "Cajamarca",
    "Callao", "Cusco", "Huancavelica", "Huánuco", "Ica", "Junín", "La Libertad",
    "Lambayeque", "Lima", "Loreto", "Madre de Dios", "Moquegua", "Pasco",
    "Piura", "Puno", "San Martín", "Tacna", "Tumbes", "Ucayali"
]

# --- URL base para búsqueda en El Comercio ---
# La búsqueda es por palabra clave, filtrando por "todas las secciones" y orden descendente (más reciente primero)
base_url = "https://elcomercio.pe/buscar/{}/todas/descendiente/?query={}"

# --- Lista donde se almacenarán todas las noticias extraídas ---
noticias = []

# --- Bucle principal por cada departamento ---
for depto in departamentos:
    try:
    # Codificar el nombre del departamento para que sea compatible con URLs (manejo de tildes y espacios)
        depto_encoded = urllib.parse.quote(depto.lower())
        url = base_url.format(depto_encoded, depto_encoded)
        print(f"Extrayendo: {url}")
        response = requests.get(url, timeout=10)
        soup = BeautifulSoup(response.content, "html.parser")
        stories = soup.select('div.story-item__left')

        # --- Extraer la información de cada noticia ---
        for story in stories:
            # Título de la noticia y enlace
            title_tag = story.select_one("h2.story-item__content-title a")
            title = title_tag.get_text(strip=True) if title_tag else None
            link = "https://elcomercio.pe" + title_tag["href"] if title_tag else None

            # Resumen de la noticia (subtítulo o bajada)
            summary_tag = story.select_one("p.story-item__subtitle")
            summary = summary_tag.get_text(strip=True) if summary_tag else None

            # Sección o categoría de la noticia (por ejemplo: política, deportes, etc.)
            section_tag = story.select_one("a.story-item__section")
            section = section_tag.get_text(strip=True) if section_tag else None

            # Fecha de publicación
            date_tag = story.select_one("span.story-item__date-time")
            date = date_tag.get_text(strip=True) if date_tag else None

            # Agregar los datos de la noticia a la lista de resultados
            noticias.append({
                "Departamento": depto,
                "Título": title,
                "Resumen": summary,
                "Sección": section,
                "Fecha": date,
                "Enlace": link
            })

        time.sleep(2)  # Pausa para no sobrecargar el servidor
    except Exception as e:
        print(f"Error en {depto}: {e}")
        continue

# Convertir a DataFrame y guardar CSV
df = pd.DataFrame(noticias)
df.to_csv("noticias_departamentos_elcomercio.csv", index=False, encoding="utf-8-sig")
print("CSV guardado como 'noticias_departamentos_elcomercio.csv'")

Extrayendo: https://elcomercio.pe/buscar/amazonas/todas/descendiente/?query=amazonas
Extrayendo: https://elcomercio.pe/buscar/%C3%A1ncash/todas/descendiente/?query=%C3%A1ncash
Extrayendo: https://elcomercio.pe/buscar/apur%C3%ADmac/todas/descendiente/?query=apur%C3%ADmac
Extrayendo: https://elcomercio.pe/buscar/arequipa/todas/descendiente/?query=arequipa
Extrayendo: https://elcomercio.pe/buscar/ayacucho/todas/descendiente/?query=ayacucho
Extrayendo: https://elcomercio.pe/buscar/cajamarca/todas/descendiente/?query=cajamarca
Extrayendo: https://elcomercio.pe/buscar/callao/todas/descendiente/?query=callao
Extrayendo: https://elcomercio.pe/buscar/cusco/todas/descendiente/?query=cusco
Extrayendo: https://elcomercio.pe/buscar/huancavelica/todas/descendiente/?query=huancavelica
Extrayendo: https://elcomercio.pe/buscar/hu%C3%A1nuco/todas/descendiente/?query=hu%C3%A1nuco
Extrayendo: https://elcomercio.pe/buscar/ica/todas/descendiente/?query=ica
Extrayendo: https://elcomercio.pe/buscar/jun%C3%ADn