In [None]:
import requests  # Para fazer requisições HTTP (web scraping)
from bs4 import BeautifulSoup  # Para analisar o HTML (web scraping)
import pandas as pd  # Para manipular dados em formato de tabela (opcional, mas útil)
import re  # Para trabalhar com expressões regulares (limpeza de texto)

In [None]:
noticias_simuladas = [
    {"titulo": "Notícia A: Fato importante 1", "data": "2025-05-15", "texto": "Ocorreu um evento significativo hoje."},
    {"titulo": "Notícia B: Alegação sobre evento 1", "data": "2025-05-14", "texto": "Há rumores de que o evento significativo teve uma causa específica."},
    {"titulo": "Notícia C: Desmentido sobre alegação", "data": "2025-05-15", "texto": "Fontes oficiais desmentiram a alegação sobre a causa do evento significativo."},
    {"titulo": "Outra Notícia: Assunto diferente", "data": "2025-05-13", "texto": "Esta notícia não está relacionada ao evento anterior."},
]

df_noticias = pd.DataFrame(noticias_simuladas) # Converter para DataFrame para facilitar a busca (opcional)
print(df_noticias)

                                 titulo        data  \
0          Notícia A: Fato importante 1  2025-05-15   
1    Notícia B: Alegação sobre evento 1  2025-05-14   
2  Notícia C: Desmentido sobre alegação  2025-05-15   
3      Outra Notícia: Assunto diferente  2025-05-13   

                                               texto  
0              Ocorreu um evento significativo hoje.  
1  Há rumores de que o evento significativo teve ...  
2  Fontes oficiais desmentiram a alegação sobre a...  
3  Esta notícia não está relacionada ao evento an...  


In [None]:
html_simulado = """
<div>
  <article>
    <h2>Notícia D: Impacto econômico</h2>
    <p class="data">2025-05-15</p>
    <p>O novo plano econômico gerou grande impacto.</p>
  </article>
  <article>
    <h2>Notícia E: Reação ao plano</h2>
    <p class="data">2025-05-14</p>
    <p>Diversos setores expressaram suas opiniões sobre o plano econômico.</p>
  </article>
</div>
"""

soup = BeautifulSoup(html_simulado, 'html.parser')
noticias_scrapeadas = []
for article in soup.find_all('article'):
    titulo = article.find('h2').text
    data = article.find('p', class_='data').text
    texto = article.find_all('p')[1].text # Assumindo que o texto está no segundo <p>
    noticias_scrapeadas.append({"titulo": titulo, "data": data, "texto": texto})

df_noticias = pd.DataFrame(noticias_scrapeadas)
print(df_noticias)

                         titulo        data  \
0  Notícia D: Impacto econômico  2025-05-15   
1    Notícia E: Reação ao plano  2025-05-14   

                                               texto  
0       O novo plano econômico gerou grande impacto.  
1  Diversos setores expressaram suas opiniões sob...  


In [None]:
def buscar_noticias(pergunta, dataframe_noticias):
    """
    Busca notícias relevantes com base em palavras-chave na pergunta do usuário.
    """
    pergunta = pergunta.lower()
    resultados = []
    for index, row in dataframe_noticias.iterrows():
        titulo_lower = row['titulo'].lower()
        texto_lower = row['texto'].lower()
        if any(palavra in titulo_lower or palavra in texto_lower for palavra in pergunta.split()):
            resultados.append(row)
    return pd.DataFrame(resultados)

# Exemplo de uso da função de busca
pergunta_usuario = "evento significativo"
resultados_busca = buscar_noticias(pergunta_usuario, df_noticias)
print(f"\nResultados da busca para '{pergunta_usuario}':\n{resultados_busca}")

pergunta_usuario_2 = "plano econômico"
resultados_busca_2 = buscar_noticias(pergunta_usuario_2, df_noticias)
print(f"\nResultados da busca para '{pergunta_usuario_2}':\n{resultados_busca_2}")


Resultados da busca para 'evento significativo':
Empty DataFrame
Columns: []
Index: []

Resultados da busca para 'plano econômico':
                         titulo        data  \
0  Notícia D: Impacto econômico  2025-05-15   
1    Notícia E: Reação ao plano  2025-05-14   

                                               texto  
0       O novo plano econômico gerou grande impacto.  
1  Diversos setores expressaram suas opiniões sob...  


In [None]:
def exibir_resultados(df_resultados):
    """
    Exibe os resultados da busca de forma simples.
    """
    if not df_resultados.empty:
        print("\n--- Resultados da Busca ---")
        for index, row in df_resultados.iterrows():
            print(f"\n**Título:** {row['titulo']}")
            print(f"**Data:** {row['data']}")
            print(f"**Trecho:** {row['texto'][:100]}...") # Exibe apenas os primeiros 100 caracteres
    else:
        print("\nNenhum resultado encontrado para a sua busca.")

# Exibir os resultados das buscas anteriores
exibir_resultados(resultados_busca)
exibir_resultados(resultados_busca_2)


Nenhum resultado encontrado para a sua busca.

--- Resultados da Busca ---

**Título:** Notícia D: Impacto econômico
**Data:** 2025-05-15
**Trecho:** O novo plano econômico gerou grande impacto....

**Título:** Notícia E: Reação ao plano
**Data:** 2025-05-14
**Trecho:** Diversos setores expressaram suas opiniões sobre o plano econômico....


In [None]:
import requests
from bs4 import BeautifulSoup
import pandas as pd
import re

# --- Simulação de Dados de Notícias ---
noticias_simuladas = [
    {"titulo": "Notícia A: Fato importante 1", "data": "2025-05-15", "texto": "Ocorreu um evento significativo hoje."},
    {"titulo": "Notícia B: Alegação sobre evento 1", "data": "2025-05-14", "texto": "Há rumores de que o evento significativo teve uma causa específica."},
    {"titulo": "Notícia C: Desmentido sobre alegação", "data": "2025-05-15", "texto": "Fontes oficiais desmentiram a alegação sobre a causa do evento significativo."},
    {"titulo": "Outra Notícia: Assunto diferente", "data": "2025-05-13", "texto": "Esta notícia não está relacionada ao evento anterior."},
    # Adicionando uma notícia relevante para a busca de política
    {"titulo": "Cenário Político Brasileiro: Dados Relevantes", "data": "2025-05-15", "texto": "Os dados políticos mais relevantes divulgados hoje no Brasil mostram um aumento na aprovação do governo e debates sobre novas reformas."}
]

# Criando o DataFrame a partir da lista de dicionários
df_noticias = pd.DataFrame(noticias_simuladas)
print("--- Banco de Notícias Simulado ---")
print(df_noticias)

# --- Função de Busca Básica ---
def buscar_noticias(pergunta, dataframe_noticias):
    """
    Busca notícias relevantes com base em palavras-chave na pergunta do usuário.
    """
    pergunta = pergunta.lower()
    resultados = []
    for index, row in dataframe_noticias.iterrows():
        titulo_lower = row['titulo'].lower()
        texto_lower = row['texto'].lower()
        if any(palavra in titulo_lower or palavra in texto_lower for palavra in pergunta.split()):
            resultados.append(row)
    return pd.DataFrame(resultados)

# --- Função para Exibir Resultados da Busca ---
def exibir_resultados(df_resultados):
    """
    Exibe os resultados da busca de forma simples.
    """
    if not df_resultados.empty:
        print("\n--- Resultados da Busca ---")
        for index, row in df_resultados.iterrows():
            print(f"\n**Título:** {row['titulo']}")
            print(f"**Data:** {row['data']}")
            print(f"**Trecho:** {row['texto'][:100]}...")
    else:
        print("\nNenhum resultado encontrado para a sua busca.")

# --- Simulação da Pergunta do Usuário e Busca ---
pergunta_usuario_simulada = "dados políticos mais relevantes hoje no brasil"
resultados_busca = buscar_noticias(pergunta_usuario_simulada, df_noticias)

print(f"\n--- Resultados da Busca para: '{pergunta_usuario_simulada}' ---")
print(resultados_busca)

# Exibindo os resultados de forma mais formatada
exibir_resultados(resultados_busca)

--- Banco de Notícias Simulado ---
                                          titulo        data  \
0                   Notícia A: Fato importante 1  2025-05-15   
1             Notícia B: Alegação sobre evento 1  2025-05-14   
2           Notícia C: Desmentido sobre alegação  2025-05-15   
3               Outra Notícia: Assunto diferente  2025-05-13   
4  Cenário Político Brasileiro: Dados Relevantes  2025-05-15   

                                               texto  
0              Ocorreu um evento significativo hoje.  
1  Há rumores de que o evento significativo teve ...  
2  Fontes oficiais desmentiram a alegação sobre a...  
3  Esta notícia não está relacionada ao evento an...  
4  Os dados políticos mais relevantes divulgados ...  

--- Resultados da Busca para: 'dados políticos mais relevantes hoje no brasil' ---
                                          titulo        data  \
0                   Notícia A: Fato importante 1  2025-05-15   
1             Notícia B: Alegação sobr