# CED

## Noticias

In [2]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL de la página inicial
url = "https://ced.cl/nuevaweb/category/noticias/"

# Realizamos una solicitud HTTP a la página
response = requests.get(url)

# Parseamos el contenido HTML con BeautifulSoup
soup = BeautifulSoup(response.content, "html.parser")

# Crear lista para almacenar los artículos
articles = []

# Extraemos cada contenedor de artículo
for article_div in soup.find_all("div", class_="premium-blog-post-outer-container"):
    # Título del artículo
    title_tag = article_div.find("h2", class_="premium-blog-entry-title")
    if title_tag:
        title = title_tag.get_text(strip=True)
        link = title_tag.find("a")["href"]
    else:
        continue

    # Fecha del artículo
    date_tag = article_div.find("div", class_="premium-blog-post-time")
    if date_tag:
        date = date_tag.find("span").get_text(strip=True)
    else:
        date = None

    # Categoría del artículo (extraemos las categorías de los enlaces en el contenedor 'premium-blog-post-categories')
    categories_tag = article_div.find("div", class_="premium-blog-post-categories")
    categories = []
    if categories_tag:
        category_links = categories_tag.find_all("a")
        categories = [category.get_text(strip=True) for category in category_links]

    # Guardamos el artículo
    articles.append({
        "Title": title,
        "Link": link,
        "Date": date,
        "Categories": categories
    })

# Convertimos los resultados en un DataFrame de pandas
df = pd.DataFrame(articles)

# Mostrar el DataFrame
df

Unnamed: 0,Title,Link,Date,Categories
0,"Felicitamos a nuestro investigador, Tomás Ilab...",https://ced.cl/nuevaweb/2025/01/10/felicitamos...,"enero 10, 2025","[Actualidad, Noticias]"
1,Felicitamos a Tania Busch integrante de nuestr...,https://ced.cl/nuevaweb/2025/01/08/felicitamos...,"enero 8, 2025","[Actualidad, Noticias]"
2,Informe de Asuntos Públicos | ¿De qué forma no...,https://ced.cl/nuevaweb/2025/01/08/informe-de-...,"enero 8, 2025","[Actualidad, Banner, Destacados, Informes, Not..."
3,Claudio Pérez habló con Radio U de Chile: «Des...,https://ced.cl/nuevaweb/2024/12/27/claudio-per...,"diciembre 27, 2024","[Actualidad, CED en Prensa, Destacados, Notici..."
4,"Subsecretario de Justicia, Ernesto Muñoz Lamar...",https://ced.cl/nuevaweb/2024/12/17/subsecretar...,"diciembre 17, 2024","[Actualidad, Destacados, Diálogo Público Priva..."
5,"Entrevista Heinrich von Baer, Académico y Ex R...",https://ced.cl/nuevaweb/2024/12/17/entrevista-...,"diciembre 17, 2024","[Actualidad, General, Multimedia, Noticias, Su..."


In [3]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL base de la página
base_url = "https://ced.cl/nuevaweb/category/noticias/"

# Lista para almacenar todos los artículos
all_articles = []

# Empezamos desde la primera página
current_url = base_url
page_number = 1  # Contador de páginas
extracted_count = 0  # Contador de artículos extraídos

while current_url:
    # Imprimir en qué página estamos y cuántos artículos llevamos extraídos
    print(f"Extrayendo artículos de la página {page_number}... | Artículos extraídos: {extracted_count}")

    # Realizamos la solicitud HTTP a la página actual
    response = requests.get(current_url)

    # Parseamos el contenido HTML con BeautifulSoup
    soup = BeautifulSoup(response.content, "html.parser")

    # Extraemos cada contenedor de artículo
    for article_div in soup.find_all("div", class_="premium-blog-post-outer-container"):
        # Título del artículo
        title_tag = article_div.find("h2", class_="premium-blog-entry-title")
        if title_tag:
            title = title_tag.get_text(strip=True)
            link = title_tag.find("a")["href"]
        else:
            continue

        # Fecha del artículo
        date_tag = article_div.find("div", class_="premium-blog-post-time")
        if date_tag:
            date = date_tag.find("span").get_text(strip=True)
        else:
            date = None

        # Categoría del artículo
        categories_tag = article_div.find("div", class_="premium-blog-post-categories")
        categories = []
        if categories_tag:
            category_links = categories_tag.find_all("a")
            categories = [category.get_text(strip=True) for category in category_links]

        # Guardamos el artículo
        all_articles.append({
            "Title": title,
            "Link": link,
            "Date": date,
            "Categories": categories
        })
        
        # Incrementamos el contador de artículos extraídos
        extracted_count += 1

    # Buscamos el enlace a la siguiente página
    next_page_tag = soup.find("a", class_="next page-numbers")
    if next_page_tag:
        # Si existe, obtenemos el enlace y lo asignamos a current_url para continuar iterando
        current_url = next_page_tag["href"]
        page_number += 1  # Incrementamos el contador de páginas
    else:
        # Si no existe, terminamos la iteración
        current_url = None

# Convertimos todos los resultados en un DataFrame de pandas
df = pd.DataFrame(all_articles)

# Mostrar el DataFrame
df

Extrayendo artículos de la página 1... | Artículos extraídos: 0
Extrayendo artículos de la página 2... | Artículos extraídos: 6
Extrayendo artículos de la página 3... | Artículos extraídos: 12
Extrayendo artículos de la página 4... | Artículos extraídos: 18
Extrayendo artículos de la página 5... | Artículos extraídos: 24
Extrayendo artículos de la página 6... | Artículos extraídos: 30
Extrayendo artículos de la página 7... | Artículos extraídos: 36
Extrayendo artículos de la página 8... | Artículos extraídos: 42
Extrayendo artículos de la página 9... | Artículos extraídos: 48
Extrayendo artículos de la página 10... | Artículos extraídos: 54
Extrayendo artículos de la página 11... | Artículos extraídos: 60
Extrayendo artículos de la página 12... | Artículos extraídos: 66
Extrayendo artículos de la página 13... | Artículos extraídos: 72
Extrayendo artículos de la página 14... | Artículos extraídos: 78
Extrayendo artículos de la página 15... | Artículos extraídos: 84
Extrayendo artículos 

Unnamed: 0,Title,Link,Date,Categories
0,"Felicitamos a nuestro investigador, Tomás Ilab...",https://ced.cl/nuevaweb/2025/01/10/felicitamos...,"enero 10, 2025","[Actualidad, Noticias]"
1,Felicitamos a Tania Busch integrante de nuestr...,https://ced.cl/nuevaweb/2025/01/08/felicitamos...,"enero 8, 2025","[Actualidad, Noticias]"
2,Informe de Asuntos Públicos | ¿De qué forma no...,https://ced.cl/nuevaweb/2025/01/08/informe-de-...,"enero 8, 2025","[Actualidad, Banner, Destacados, Informes, Not..."
3,Claudio Pérez habló con Radio U de Chile: «Des...,https://ced.cl/nuevaweb/2024/12/27/claudio-per...,"diciembre 27, 2024","[Actualidad, CED en Prensa, Destacados, Notici..."
4,"Subsecretario de Justicia, Ernesto Muñoz Lamar...",https://ced.cl/nuevaweb/2024/12/17/subsecretar...,"diciembre 17, 2024","[Actualidad, Destacados, Diálogo Público Priva..."
...,...,...,...,...
163,"Ministra del Interior Carolina Tohá, participó...",https://ced.cl/nuevaweb/2023/04/19/ministra-de...,"abril 19, 2023","[Actualidad, Destacados, Diálogo Público Priva..."
164,Claudio Pérez participó en una nueva versión d...,https://ced.cl/nuevaweb/2023/04/18/claudio-per...,"abril 18, 2023","[Actualidad, CED en Prensa, Destacados, Notici..."
165,Investigador del CED expuso en la subcomisión ...,https://ced.cl/nuevaweb/2023/04/17/investigado...,"abril 17, 2023","[Actualidad, Destacados, Noticias, Noticias CE..."
166,Comisión Laboral del CED presenta propuesta de...,https://ced.cl/nuevaweb/2023/04/13/comision-la...,"abril 13, 2023","[Actualidad, Destacados, Noticias, Noticias CE..."


Llega hasta la 29, deberia ser 52, probemos selenium

In [12]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
import pandas as pd
import time
from bs4 import BeautifulSoup

# Crear el driver
def create_driver(headless=False):
    options = Options()
    if headless:
        options.add_argument("--headless")
    driver = webdriver.Chrome(options=options)
    return driver

# Configurar el controlador de Selenium
driver = create_driver()

# URL base de la página
base_url = "https://ced.cl/nuevaweb/category/noticias/"

# Lista para almacenar todos los artículos
all_articles = []

# Empezamos desde la primera página
current_url = base_url
page_number = 1  # Contador de páginas
extracted_count = 0  # Contador de artículos extraídos

while True:
    # Imprimir en qué página estamos y cuántos artículos llevamos extraídos
    print(f"Extrayendo artículos de la página {page_number}... | Artículos extraídos: {extracted_count}")

    # Abrimos la página con Selenium
    driver.get(current_url)
    time.sleep(1)  # Esperamos para asegurar que la página cargue completamente

    # Realizamos desplazamiento hacia abajo para cargar contenido dinámico
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(1)  # Esperamos que el contenido cargue después del desplazamiento

    # Parseamos el contenido HTML con BeautifulSoup
    soup = BeautifulSoup(driver.page_source, "html.parser")

    # Extraemos cada contenedor de artículo
    for article_div in soup.find_all("div", class_="premium-blog-post-outer-container"):
        # Título del artículo
        title_tag = article_div.find("h2", class_="premium-blog-entry-title")
        if title_tag:
            title = title_tag.get_text(strip=True)
            link = title_tag.find("a")["href"]
        else:
            continue

        # Fecha del artículo
        date_tag = article_div.find("div", class_="premium-blog-post-time")
        if date_tag:
            date = date_tag.find("span").get_text(strip=True)
        else:
            date = None

        # Categoría del artículo
        categories_tag = article_div.find("div", class_="premium-blog-post-categories")
        categories = []
        if categories_tag:
            category_links = categories_tag.find_all("a")
            categories = [category.get_text(strip=True) for category in category_links]

        # Guardamos el artículo
        all_articles.append({
            "Title": title,
            "Link": link,
            "Date": date,
            "Categories": categories
        })
        
        # Incrementamos el contador de artículos extraídos
        extracted_count += 1

    # Intentamos encontrar el botón de siguiente página
    try:
        next_button = driver.find_element(By.CLASS_NAME, "next")
        # Verificamos si el botón tiene un enlace válido
        next_button_href = next_button.get_attribute("href")
        if next_button_href:
            # Usamos el enlace del botón para seguir a la siguiente página
            current_url = next_button_href
            page_number += 1  # Incrementamos el contador de páginas
            time.sleep(1)  # Esperamos para que la siguiente página cargue
        else:
            print("No más páginas disponibles.")
            break  # Si no hay enlace en el botón, terminamos el scraping
    except Exception as e:
        print("No se pudo encontrar el botón de siguiente página o ya no hay más páginas.")
        break  # En caso de error, terminamos el scraping

# Convertimos todos los resultados en un DataFrame de pandas
df = pd.DataFrame(all_articles)

# Mostrar el DataFrame
df

# Cerramos el navegador al final del proceso
driver.quit()


Extrayendo artículos de la página 1... | Artículos extraídos: 0
Extrayendo artículos de la página 2... | Artículos extraídos: 6
Extrayendo artículos de la página 3... | Artículos extraídos: 12
Extrayendo artículos de la página 4... | Artículos extraídos: 18
Extrayendo artículos de la página 5... | Artículos extraídos: 24
Extrayendo artículos de la página 6... | Artículos extraídos: 30
Extrayendo artículos de la página 7... | Artículos extraídos: 36
Extrayendo artículos de la página 8... | Artículos extraídos: 42
Extrayendo artículos de la página 9... | Artículos extraídos: 48
Extrayendo artículos de la página 10... | Artículos extraídos: 54
Extrayendo artículos de la página 11... | Artículos extraídos: 60
Extrayendo artículos de la página 12... | Artículos extraídos: 66
Extrayendo artículos de la página 13... | Artículos extraídos: 72
Extrayendo artículos de la página 14... | Artículos extraídos: 78
Extrayendo artículos de la página 15... | Artículos extraídos: 84
Extrayendo artículos 

In [13]:
df

Unnamed: 0,Title,Link,Date,Categories
0,"Felicitamos a nuestro investigador, Tomás Ilab...",https://ced.cl/nuevaweb/2025/01/10/felicitamos...,"enero 10, 2025","[Actualidad, Noticias]"
1,Felicitamos a Tania Busch integrante de nuestr...,https://ced.cl/nuevaweb/2025/01/08/felicitamos...,"enero 8, 2025","[Actualidad, Noticias]"
2,Informe de Asuntos Públicos | ¿De qué forma no...,https://ced.cl/nuevaweb/2025/01/08/informe-de-...,"enero 8, 2025","[Actualidad, Banner, Destacados, Informes, Not..."
3,Claudio Pérez habló con Radio U de Chile: «Des...,https://ced.cl/nuevaweb/2024/12/27/claudio-per...,"diciembre 27, 2024","[Actualidad, CED en Prensa, Destacados, Notici..."
4,"Subsecretario de Justicia, Ernesto Muñoz Lamar...",https://ced.cl/nuevaweb/2024/12/17/subsecretar...,"diciembre 17, 2024","[Actualidad, Destacados, Diálogo Público Priva..."
...,...,...,...,...
163,"Ministra del Interior Carolina Tohá, participó...",https://ced.cl/nuevaweb/2023/04/19/ministra-de...,"abril 19, 2023","[Actualidad, Destacados, Diálogo Público Priva..."
164,Claudio Pérez participó en una nueva versión d...,https://ced.cl/nuevaweb/2023/04/18/claudio-per...,"abril 18, 2023","[Actualidad, CED en Prensa, Destacados, Notici..."
165,Investigador del CED expuso en la subcomisión ...,https://ced.cl/nuevaweb/2023/04/17/investigado...,"abril 17, 2023","[Actualidad, Destacados, Noticias, Noticias CE..."
166,Comisión Laboral del CED presenta propuesta de...,https://ced.cl/nuevaweb/2023/04/13/comision-la...,"abril 13, 2023","[Actualidad, Destacados, Noticias, Noticias CE..."


In [14]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options
import pandas as pd
import time
from bs4 import BeautifulSoup

# Crear el driver
def create_driver(headless=False):
    options = Options()
    if headless:
        options.add_argument("--headless")
    driver = webdriver.Chrome(options=options)
    return driver

# Configurar el controlador de Selenium
driver = create_driver()

# URL base de la página
base_url = "https://ced.cl/nuevaweb/category/noticias/"

# Lista para almacenar todos los artículos
all_articles = []

# Empezamos desde la primera página
page_number = 1  # Contador de páginas
extracted_count = 0  # Contador de artículos extraídos

# Abrimos la página inicial
driver.get(base_url)
time.sleep(1)  # Esperamos para asegurar que la página cargue completamente

# Iteramos hasta la página 52
while page_number <= 52:
    # Imprimir en qué página estamos y cuántos artículos llevamos extraídos
    print(f"Extrayendo artículos de la página {page_number}... | Artículos extraídos: {extracted_count}")

    # Realizamos desplazamiento hacia abajo para cargar contenido dinámico
    driver.execute_script("window.scrollTo(0, document.body.scrollHeight);")
    time.sleep(2)  # Esperamos que el contenido cargue después del desplazamiento

    # Parseamos el contenido HTML con BeautifulSoup
    soup = BeautifulSoup(driver.page_source, "html.parser")

    # Extraemos cada contenedor de artículo
    for article_div in soup.find_all("div", class_="premium-blog-post-outer-container"):
        # Título del artículo
        title_tag = article_div.find("h2", class_="premium-blog-entry-title")
        if title_tag:
            title = title_tag.get_text(strip=True)
            link = title_tag.find("a")["href"]
        else:
            continue

        # Fecha del artículo
        date_tag = article_div.find("div", class_="premium-blog-post-time")
        if date_tag:
            date = date_tag.find("span").get_text(strip=True)
        else:
            date = None

        # Categoría del artículo
        categories_tag = article_div.find("div", class_="premium-blog-post-categories")
        categories = []
        if categories_tag:
            category_links = categories_tag.find_all("a")
            categories = [category.get_text(strip=True) for category in category_links]

        # Guardamos el artículo
        all_articles.append({
            "Title": title,
            "Link": link,
            "Date": date,
            "Categories": categories
        })
        
        # Incrementamos el contador de artículos extraídos
        extracted_count += 1

    # Intentamos hacer clic en el botón de "Siguiente" para ir a la siguiente página
    try:
        next_button = driver.find_element(By.CLASS_NAME, "next")
        # Verificamos si el botón "Siguiente" está disponible
        if next_button.is_enabled():
            # Hacemos clic en el botón "Siguiente"
            next_button.click()
            page_number += 1  # Incrementamos el contador de páginas
            time.sleep(2)  # Esperamos que la siguiente página cargue
        else:
            print("No más páginas disponibles.")
            break  # Si el botón no está habilitado, terminamos el scraping
    except Exception as e:
        print("No se pudo encontrar el botón de siguiente página o ya no hay más páginas.")
        break  # En caso de error, terminamos el scraping

# Convertimos todos los resultados en un DataFrame de pandas
df2 = pd.DataFrame(all_articles)

# Mostrar el DataFrame
df2

# Cerramos el navegador al final del proceso
driver.quit()

Extrayendo artículos de la página 1... | Artículos extraídos: 0
Extrayendo artículos de la página 2... | Artículos extraídos: 6
Extrayendo artículos de la página 3... | Artículos extraídos: 12
Extrayendo artículos de la página 4... | Artículos extraídos: 18
Extrayendo artículos de la página 5... | Artículos extraídos: 24
Extrayendo artículos de la página 6... | Artículos extraídos: 30
Extrayendo artículos de la página 7... | Artículos extraídos: 36
Extrayendo artículos de la página 8... | Artículos extraídos: 42
Extrayendo artículos de la página 9... | Artículos extraídos: 48
Extrayendo artículos de la página 10... | Artículos extraídos: 54
Extrayendo artículos de la página 11... | Artículos extraídos: 60
Extrayendo artículos de la página 12... | Artículos extraídos: 66
Extrayendo artículos de la página 13... | Artículos extraídos: 72
Extrayendo artículos de la página 14... | Artículos extraídos: 78
Extrayendo artículos de la página 15... | Artículos extraídos: 84
Extrayendo artículos 

In [15]:
df2

Unnamed: 0,Title,Link,Date,Categories
0,"Felicitamos a nuestro investigador, Tomás Ilab...",https://ced.cl/nuevaweb/2025/01/10/felicitamos...,"enero 10, 2025","[Actualidad, Noticias]"
1,Felicitamos a Tania Busch integrante de nuestr...,https://ced.cl/nuevaweb/2025/01/08/felicitamos...,"enero 8, 2025","[Actualidad, Noticias]"
2,Informe de Asuntos Públicos | ¿De qué forma no...,https://ced.cl/nuevaweb/2025/01/08/informe-de-...,"enero 8, 2025","[Actualidad, Banner, Destacados, Informes, Not..."
3,Claudio Pérez habló con Radio U de Chile: «Des...,https://ced.cl/nuevaweb/2024/12/27/claudio-per...,"diciembre 27, 2024","[Actualidad, CED en Prensa, Destacados, Notici..."
4,"Subsecretario de Justicia, Ernesto Muñoz Lamar...",https://ced.cl/nuevaweb/2024/12/17/subsecretar...,"diciembre 17, 2024","[Actualidad, Destacados, Diálogo Público Priva..."
...,...,...,...,...
307,Subsecretaria de Previsión Social comparte los...,https://ced.cl/nuevaweb/2019/04/29/sub-prevenc...,"abril 29, 2019","[Actualidad, Destacados, Noticias, Políticas P..."
308,Panel de discusión sobre desigualdades en Educ...,https://ced.cl/nuevaweb/2019/04/11/panel-desig...,"abril 11, 2019","[Actualidad, Destacados, Noticias, Políticas P..."
309,En abril vuelve el Ciclo de Charlas CED sobre ...,https://ced.cl/nuevaweb/2019/03/28/abril-vuelv...,"marzo 28, 2019","[Actualidad, Destacados, Noticias, Políticas P..."
310,Exitoso lanzamiento de nuevo libro CED,https://ced.cl/nuevaweb/2019/02/26/ced-intelec...,"febrero 26, 2019","[Actualidad, Destacados, Noticias, Políticas P..."


## Opinión

In [5]:
import requests
from bs4 import BeautifulSoup
import pandas as pd

# URL base de la página
base_url = "https://ced.cl/nuevaweb/opinion-3/"

# Lista para almacenar todos los artículos
all_articles = []

# Empezamos desde la primera página
current_url = base_url
page_number = 1  # Contador de páginas
extracted_count = 0  # Contador de artículos extraídos

while current_url:
    # Imprimir en qué página estamos y cuántos artículos llevamos extraídos
    print(f"Extrayendo artículos de la página {page_number}... | Artículos extraídos: {extracted_count}")

    # Realizamos la solicitud HTTP a la página actual
    response = requests.get(current_url)

    # Parseamos el contenido HTML con BeautifulSoup
    soup = BeautifulSoup(response.content, "html.parser")

    # Extraemos cada contenedor de artículo
    for article_div in soup.find_all("div", class_="premium-blog-post-outer-container"):
        # Título del artículo
        title_tag = article_div.find("h2", class_="premium-blog-entry-title")
        if title_tag:
            title = title_tag.get_text(strip=True)
            link = title_tag.find("a")["href"]
        else:
            continue

        # Fecha del artículo
        date_tag = article_div.find("div", class_="premium-blog-post-time")
        if date_tag:
            date = date_tag.find("span").get_text(strip=True)
        else:
            date = None

        # Categoría del artículo
        categories_tag = article_div.find("div", class_="premium-blog-post-categories")
        categories = []
        if categories_tag:
            category_links = categories_tag.find_all("a")
            categories = [category.get_text(strip=True) for category in category_links]

        # Guardamos el artículo
        all_articles.append({
            "Title": title,
            "Link": link,
            "Date": date,
            "Categories": categories
        })
        
        # Incrementamos el contador de artículos extraídos
        extracted_count += 1

    # Buscamos el enlace a la siguiente página
    next_page_tag = soup.find("a", class_="next page-numbers")
    if next_page_tag:
        # Si existe, obtenemos el enlace y lo asignamos a current_url para continuar iterando
        current_url = next_page_tag["href"]
        page_number += 1  # Incrementamos el contador de páginas
    else:
        # Si no existe, terminamos la iteración
        current_url = None

# Convertimos todos los resultados en un DataFrame de pandas
op = pd.DataFrame(all_articles)

# Mostrar el DataFrame
op

Extrayendo artículos de la página 1... | Artículos extraídos: 0
Extrayendo artículos de la página 2... | Artículos extraídos: 6
Extrayendo artículos de la página 3... | Artículos extraídos: 12
Extrayendo artículos de la página 4... | Artículos extraídos: 18
Extrayendo artículos de la página 5... | Artículos extraídos: 24
Extrayendo artículos de la página 6... | Artículos extraídos: 30
Extrayendo artículos de la página 7... | Artículos extraídos: 36
Extrayendo artículos de la página 8... | Artículos extraídos: 42
Extrayendo artículos de la página 9... | Artículos extraídos: 48


Unnamed: 0,Title,Link,Date,Categories
0,La segregación como elección,https://ced.cl/nuevaweb/2024/12/02/la-segregac...,"diciembre 2, 2024","[Actualidad, Banner, CED en Prensa, Noticias, ..."
1,La sustentabilidad empieza por casa,https://ced.cl/nuevaweb/2024/11/13/la-sustenta...,"noviembre 13, 2024","[Actualidad, CED en Prensa, Noticias, Opinión,..."
2,Ricardo Buendía y nuevas tendencias en el dere...,https://ced.cl/nuevaweb/2024/10/23/ricardo-bue...,"octubre 23, 2024","[Actualidad, CED en Prensa, Noticias, Noticias..."
3,Los desafíos poco difundidos del hidrógeno verde,https://ced.cl/nuevaweb/2024/10/04/los-desafio...,"octubre 4, 2024","[Actualidad, CED en Prensa, Noticias, Opinión,..."
4,Nombramiento de jueces: un cambio necesario pa...,https://ced.cl/nuevaweb/2024/08/30/nombramient...,"agosto 30, 2024","[Actualidad, CED en Prensa, Destacados, Notici..."
5,Nombramiento en el Servel,https://ced.cl/nuevaweb/2024/07/11/nombramient...,"julio 11, 2024","[Actualidad, CED en Prensa, Noticias, Opinión,..."
6,Certeza electoral y calidad de la democracia,https://ced.cl/nuevaweb/2024/04/08/certeza-ele...,"abril 8, 2024","[Actualidad, CED en Prensa, Noticias, Opinión,..."
7,Accountability judicial,https://ced.cl/nuevaweb/2024/03/26/accountabil...,"marzo 26, 2024","[Actualidad, CED en Prensa, Noticias, Opinión,..."
8,políticos TikTok,https://ced.cl/nuevaweb/2024/01/03/politicos-t...,"enero 3, 2024","[Actualidad, CED en Prensa, Noticias, Opinión,..."
9,Solución política,https://ced.cl/nuevaweb/2023/10/16/solucion-po...,"octubre 16, 2023","[Actualidad, Noticias, Opinión, Políticas Públ..."


# Concatenación

In [18]:
df_concatenado = pd.concat([df2, op], ignore_index=True)
df_concatenado

Unnamed: 0,Title,Link,Date,Categories
0,"Felicitamos a nuestro investigador, Tomás Ilab...",https://ced.cl/nuevaweb/2025/01/10/felicitamos...,"enero 10, 2025","[Actualidad, Noticias]"
1,Felicitamos a Tania Busch integrante de nuestr...,https://ced.cl/nuevaweb/2025/01/08/felicitamos...,"enero 8, 2025","[Actualidad, Noticias]"
2,Informe de Asuntos Públicos | ¿De qué forma no...,https://ced.cl/nuevaweb/2025/01/08/informe-de-...,"enero 8, 2025","[Actualidad, Banner, Destacados, Informes, Not..."
3,Claudio Pérez habló con Radio U de Chile: «Des...,https://ced.cl/nuevaweb/2024/12/27/claudio-per...,"diciembre 27, 2024","[Actualidad, CED en Prensa, Destacados, Notici..."
4,"Subsecretario de Justicia, Ernesto Muñoz Lamar...",https://ced.cl/nuevaweb/2024/12/17/subsecretar...,"diciembre 17, 2024","[Actualidad, Destacados, Diálogo Público Priva..."
...,...,...,...,...
361,Dignidad Humana y Nueva Constitución,https://ced.cl/nuevaweb/2022/02/10/la-jugada-d...,"febrero 10, 2022","[CED en Prensa, Opinión]"
362,La jugada de Sichel,https://ced.cl/nuevaweb/2022/02/10/la-jugada-d...,"febrero 10, 2022","[CED en Prensa, Opinión]"
363,Escupir al cielo,https://ced.cl/nuevaweb/2021/09/22/escupir-al-...,"septiembre 22, 2021","[CED en Prensa, Opinión]"
364,Ilusiones tecnológicas y optimismo democrático,https://ced.cl/nuevaweb/2020/03/26/ilusiones-t...,"marzo 26, 2020","[CED en Prensa, Opinión]"


In [20]:
df_concatenado.to_excel("CED.xlsx", index=False)