# Rumbo Colectivo

In [3]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

def obtener_publicaciones(url):
    """
    Función que recibe un enlace de un sitio web y devuelve un DataFrame con los títulos, enlaces y fechas
    de los artículos presentes en esa página.

    Args:
        url (str): La URL de la página de publicaciones a procesar.

    Returns:
        pd.DataFrame: Un DataFrame con las columnas 'Título', 'Enlace' y 'Fecha'.
    """
    # Realizamos la petición HTTP
    response = requests.get(url)
    
    # Creamos el objeto BeautifulSoup
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # Buscamos todos los artículos
    articles = soup.find_all('article')
    
    # Listas para almacenar los datos
    titles = []
    links = []
    dates = []
    
    # Extraemos la información de cada artículo
    for article in articles:
        # Extraemos el enlace
        link = article.find('a', href=True)['href']
        
        # Extraemos el título
        title = article.find('h2', class_='entry-title').get_text(strip=True)
        
        # Extraemos la fecha
        date = article.find('span', class_='published').get_text(strip=True)
        
        # Añadimos los datos a las listas
        titles.append(title)
        links.append(link)
        dates.append(date)
    
    # Creamos un DataFrame con los datos extraídos
    df = pd.DataFrame({
        'Título': titles,
        'Enlace': links,
        'Fecha': dates
    })
    
    return df

url = 'https://rumbocolectivo.cl/publicaciones/'
pub = obtener_publicaciones(url)

# Mostrar el DataFrame resultante
pub

Unnamed: 0,Título,Enlace,Fecha
0,Exitoso lanzamiento de libro sobre sistemas de...,https://rumbocolectivo.cl/blog/2024/12/04/exit...,"Dic 4, 2024"
1,Exitoso lanzamiento de libro sobre sistemas de...,https://rumbocolectivo.cl/blog/2024/12/04/exit...,"Dic 4, 2024"
2,Municipales y regionales: Rumbo Colectivo pres...,https://rumbocolectivo.cl/blog/2024/11/25/muni...,"Nov 25, 2024"
3,Rumbo Colectivo lidera coordinación de documen...,https://rumbocolectivo.cl/blog/2024/10/23/rumb...,"Oct 23, 2024"
4,Rumbo Colectivo y centros de estudio lanzan ma...,https://rumbocolectivo.cl/blog/2024/08/09/rumb...,"Ago 9, 2024"
5,Rumbo Colectivo lanzó documento de análisis “H...,https://rumbocolectivo.cl/blog/2024/06/18/rumb...,"Jun 18, 2024"
6,Sociedad Civil y Desafíos de la Convivencia So...,https://rumbocolectivo.cl/blog/2024/06/07/soci...,"Jun 7, 2024"
7,Estudio de Rumbo Colectivo: Gobierno ha cumpli...,https://rumbocolectivo.cl/blog/2024/05/26/rumb...,"May 26, 2024"
8,Rumbo Colectivo lanza su revista de pensamient...,https://rumbocolectivo.cl/blog/2024/03/28/rumb...,"Mar 28, 2024"
9,Especialistas presentan el libro ‘Green New De...,https://rumbocolectivo.cl/blog/2024/03/15/espe...,"Mar 15, 2024"


In [4]:
url = 'https://rumbocolectivo.cl/opinion/'
op = obtener_publicaciones(url)

# Mostrar el DataFrame resultante
op

Unnamed: 0,Título,Enlace,Fecha
0,La mesa chilena,https://rumbocolectivo.cl/blog/2024/12/30/la-m...,"Dic 30, 2024"
1,La mesa chilena,https://rumbocolectivo.cl/blog/2024/12/30/la-m...,"Dic 30, 2024"
2,Propuesta de reforma al sistema electoral y po...,https://rumbocolectivo.cl/blog/2024/12/20/prop...,"Dic 20, 2024"
3,¿Población gobernada? Los retos de las autorid...,https://rumbocolectivo.cl/blog/2024/11/26/pobl...,"Nov 26, 2024"
4,¿Es uno de los nuestros? El avance del etno-na...,https://rumbocolectivo.cl/blog/2024/11/12/es-u...,"Nov 12, 2024"
5,"Sin administración, no hay transformación",https://rumbocolectivo.cl/blog/2024/11/08/sin-...,"Nov 8, 2024"
6,Lo que pasó -y no pasó- en las elecciones loca...,https://rumbocolectivo.cl/blog/2024/10/28/lo-q...,"Oct 28, 2024"
7,El valor de un nuevo sistema de financiamiento...,https://rumbocolectivo.cl/blog/2024/10/14/el-v...,"Oct 14, 2024"
8,Una semana clave para la justicia fiscal,https://rumbocolectivo.cl/blog/2024/09/23/una-...,"Sep 23, 2024"
9,Elecciones municipales 2024: Los cuidados en e...,https://rumbocolectivo.cl/blog/2024/09/13/elec...,"Sep 13, 2024"


In [6]:
url = 'https://rumbocolectivo.cl/noticias/'
notic = obtener_publicaciones(url)

# Mostrar el DataFrame resultante
notic

Unnamed: 0,Título,Enlace,Fecha
0,La mesa chilena,https://rumbocolectivo.cl/blog/2024/12/30/la-m...,"Dic 30, 2024"
1,La mesa chilena,https://rumbocolectivo.cl/blog/2024/12/30/la-m...,"Dic 30, 2024"
2,Propuesta de reforma al sistema electoral y po...,https://rumbocolectivo.cl/blog/2024/12/20/prop...,"Dic 20, 2024"
3,Exitoso lanzamiento de libro sobre sistemas de...,https://rumbocolectivo.cl/blog/2024/12/04/exit...,"Dic 4, 2024"
4,Rumbo Colectivo presente en Colombia por lanza...,https://rumbocolectivo.cl/blog/2024/12/02/rumb...,"Dic 2, 2024"
5,Investigadoras de Rumbo Colectivo participaron...,https://rumbocolectivo.cl/blog/2024/11/29/inve...,"Nov 29, 2024"
6,Con éxito se realiza foro previo a lanzamiento...,https://rumbocolectivo.cl/blog/2024/11/28/con-...,"Nov 28, 2024"
7,¿Población gobernada? Los retos de las autorid...,https://rumbocolectivo.cl/blog/2024/11/26/pobl...,"Nov 26, 2024"
8,Municipales y regionales: Rumbo Colectivo pres...,https://rumbocolectivo.cl/blog/2024/11/25/muni...,"Nov 25, 2024"
9,Rumbo Colectivo obtiene certificado FECU Socia...,https://rumbocolectivo.cl/blog/2024/11/22/rumb...,"Nov 22, 2024"


# Concatenación

In [7]:
import pandas as pd

notic['Categoria'] = 'Noticias'
op['Categoria'] = 'Opinión'
pub['Categoria'] = 'Publicaciones'

# Concatenamos los tres DataFrames
rb = pd.concat([notic, op, pub], ignore_index=True)

rb

Unnamed: 0,Título,Enlace,Fecha,Categoria
0,La mesa chilena,https://rumbocolectivo.cl/blog/2024/12/30/la-m...,"Dic 30, 2024",Noticias
1,La mesa chilena,https://rumbocolectivo.cl/blog/2024/12/30/la-m...,"Dic 30, 2024",Noticias
2,Propuesta de reforma al sistema electoral y po...,https://rumbocolectivo.cl/blog/2024/12/20/prop...,"Dic 20, 2024",Noticias
3,Exitoso lanzamiento de libro sobre sistemas de...,https://rumbocolectivo.cl/blog/2024/12/04/exit...,"Dic 4, 2024",Noticias
4,Rumbo Colectivo presente en Colombia por lanza...,https://rumbocolectivo.cl/blog/2024/12/02/rumb...,"Dic 2, 2024",Noticias
...,...,...,...,...
121,4 Horizontes de Transformación para el Chile d...,https://rumbocolectivo.cl/blog/2021/12/09/4-ho...,"Dic 9, 2021",Publicaciones
122,Propuesta de Régimen Político Parlamentario,https://rumbocolectivo.cl/blog/2021/11/30/prop...,"Nov 30, 2021",Publicaciones
123,Propuesta Reactivación Económica y Gasto fisca...,https://rumbocolectivo.cl/blog/2021/11/12/reco...,"Nov 12, 2021",Publicaciones
124,Propuesta Reactivación Económica y Gasto fisca...,https://rumbocolectivo.cl/blog/2021/11/04/recu...,"Nov 4, 2021",Publicaciones


In [8]:
rb.to_excel("Rumbo_colectivo.xlsx", index=False)