In [4]:
import requests
from bs4 import BeautifulSoup

def get_news_from_g1():
    # URL do site G1
    url = 'https://g1.globo.com/'

    try:
        # Realiza a requisição ao site com um User-Agent para simular um navegador
        headers = {'User-Agent': 'Mozilla/5.0'}
        response = requests.get(url, headers=headers)
        
        # Verifica se a requisição foi bem sucedida
        response.raise_for_status()

        # Parse do conteúdo HTML
        soup = BeautifulSoup(response.content, 'html.parser')
        
        # Encontra notícias
        noticias = soup.find_all('div', class_='feed-post-body', limit=100)
        arr_noticias = []

        for noticia in noticias:
            # Extrai o título
            titulo = noticia.find('a', class_='feed-post-link')
            titulo_text = titulo.get_text(strip=True) if titulo else 'Título não encontrado'
            link = titulo['href'] if titulo else 'Link não encontrado'
            
            # Extrai a data de publicação
            data_publicacao = noticia.find('span', class_='feed-post-datetime')
            data_text = data_publicacao.get_text(strip=True) if data_publicacao else 'Data de publicação não encontrada'

            # Adiciona um dicionário com as informações da notícia na lista
            arr_noticias.append({
                'resumo': titulo_text,
                'link': link,
                'data_publicacao': data_text
            })

        return arr_noticias

    except requests.HTTPError as http_err:
        print(f"HTTP error occurred: {http_err}")
    except Exception as err:
        print(f"An error occurred: {err}")

# Executa a função e imprime o resultado
noticias = get_news_from_g1()
for noticia in noticias:
    print(noticia)


{'resumo': 'Além da redação, candidatos respondem a 90 questões; SIGA', 'link': 'https://g1.globo.com/educacao/enem/2023/ao-vivo/enem-2023-gabarito-extraoficial-e-correcao-das-questoes-prova.ghtml', 'data_publicacao': 'Há 52 minutos'}
{'resumo': 'Lula indica que Enem pode deixar de ter taxa de inscrição', 'link': 'https://g1.globo.com/politica/noticia/2023/11/05/lula-visita-o-inep-no-primeiro-dia-do-enem.ghtml', 'data_publicacao': 'Há 18 minutos'}
{'resumo': 'Pioneira da televisão brasileira, atriz Lolita Rodrigues morre aos 94 anos', 'link': 'https://g1.globo.com/pb/paraiba/noticia/2023/11/05/atriz-lolita-rodrigues-morre-em-joao-pessoa-aos-94-anos.ghtml', 'data_publicacao': 'Há 57 minutos'}
{'resumo': "Em 2000, Lolita cantou o hino da TV no 'Programa do Jô' ao lado de Hebe e Nair", 'link': 'https://g1.globo.com/globonews/jornal-globonews/video/lolita-rodrigues-canta-hino-da-tv-brasileira-no-programa-do-jo-12088512.ghtml', 'data_publicacao': 'Há 2 horas'}
{'resumo': 'Como cantora, Loli