In [None]:
import datetime
import requests
from bs4 import BeautifulSoup
import pandas as pd

# Set the URL base for the month of January 2019
url_base = 'https://eldeber.com.bo/ultimas-noticias/'

# Define the start and end dates of the month you want to scrape
fecha_inicio = datetime.date(2020, 1, 1)
fecha_fin = datetime.date(2021, 12, 31)

# Initialize an empty list to store the results
results = []

# Loop through each day of the month and scrape the corresponding page
for fecha in range((fecha_fin - fecha_inicio).days + 1):
    fecha_actual = fecha_inicio + datetime.timedelta(days=fecha)
    url_actual = url_base + fecha_actual.strftime('%d-%m-%Y')
    response = requests.get(url_actual)
    soup = BeautifulSoup(response.content, 'html5lib')
    # Find the section of the page containing the economy news
    economy_section = soup.find('div', id='__next')
    # Find all the news articles in the economy section
    articles = economy_section.find_all('a',class_="jsx-742874305 nota-link")
    articles_body = economy_section.find_all('div',class_="jsx-742874305 text") 

# Creamos una lista vacía para almacenar los diccionarios de datos
data = []

# Loop through each article and append its data to the data list
for article, article_body in zip(articles, articles_body):
    # Obtener la información de la noticia desde el artículo
    codigo = article['href'].split('_')[-1]
    fecha = fecha_actual.strftime('%Y-%m-%d')
    titular = article.text.strip().split(':')[0]
    
    # Obtener la información del detalle y el texto desde el artículo_body
    detalle = article_body.find('h2').text.strip()
    texto = article_body.find('p').text.strip()
    
    # Crear un diccionario con la información de la noticia y agregarlo a la lista de datos
    data.append({
        'codigo': codigo,
        'fecha': fecha,
        'titular': titular,
        'detalle': detalle,
        'texto': texto
    })

# Crear un dataframe de pandas a partir de la lista de datos
df = pd.DataFrame(data)

# Reordenar las columnas según lo necesario
df = df[['codigo', 'fecha', 'titular', 'detalle', 'texto']]
df.to_csv('tu_archivo.csv', index=False)
df

Unnamed: 0,codigo,fecha,titular,detalle,texto
0,261988,2021-12-31,Gobernación trabaja con maquinarias en los pun...,Gobernación trabaja con maquinarias en los pun...,El Searpi tiene desplazado su personal para pa...
1,261989,2021-12-31,"Año Nuevo con la Filarmónica de Viena, bajo la...","Año Nuevo con la Filarmónica de Viena, bajo la...",El tradicional Concierto de Año Nuevo de la Fi...
2,261953,2021-12-31,Los rituales menos conocidos para recibir al A...,Los rituales menos conocidos para recibir al A...,Hay distintas costumbres y cábalas que se cele...
3,261957,2021-12-31,"Quién fue San Silvestre, el último ""santo"" del...","Quién fue San Silvestre, el último ""santo"" del...",El 31 de diciembre se celebra el día de este s...
4,261973,2021-12-31,Año Nuevo,Año Nuevo: así recibe el mundo el 2022 pese al...,Algunos países establecieron restricciones por...
5,261985,2021-12-31,"El conflicto sirio dejó 3.882 muertos en 2021,...","El conflicto sirio dejó 3.882 muertos en 2021,...","Este año, 3.882 personas, 1.558 de ellas civil..."
6,261986,2021-12-31,Oriente Petrolero podrá contar desde el lunes ...,Oriente Petrolero podrá contar desde el lunes ...,Son los extranjeros que el equipo refinero tie...
7,261981,2021-12-31,El mundo celebra el Año Nuevo,El mundo celebra el Año Nuevo: Asia y Oceanía ...,Los ciudadanos de la nación insular de Kiribat...
8,261982,2021-12-31,"Robot humanoide de Tesla podría ""desarrollar p...","Robot humanoide de Tesla podría ""desarrollar p...","Elon Musk aseguró que el Tesla Bot, programado..."
9,261980,2021-12-31,10 partidos presentaron adecuación de estatuto...,10 partidos presentaron adecuación de estatuto...,El MAS es el único que cumplió con todos los r...


In [None]:
print(f'Se obtuvieron {len(df)} resultados')


Se obtuvieron 23 resultados
