# Identificação de Entidades em Notícias com LLM

Uma consultoria lhe contratou para automatizar a descoberta de pessoas mencionadas em notícias de jornal. Com base no Exercício 7, escolha 3 notícias e monte uma aplicação com um prompt para o LLM identificar menções a diferentes entidades em cada notícia (como pessoas, órgãos públicos, empresas…). Implemente um notebook para testar o código usando a API do Gemini. Descreva o prompt, seus resultados e avalie se a resposta do modelo atende às expectativas da consultoria.

In [1]:
# Importar bibliotecas necessárias para o projeto
import google.generativeai as genai
import os
from dotenv import load_dotenv

# Carregar variáveis de ambiente do arquivo .env
load_dotenv()

# Configurar a API do Gemini com a chave das variáveis de ambiente
genai.configure(api_key=os.getenv('GOOGLE_API_KEY'))
model = genai.GenerativeModel('gemini-pro')

In [2]:
# Definir as notícias de exemplo para extração de entidades
news_articles = [
    """
    O presidente Luiz Inácio Lula da Silva anunciou nesta segunda-feira um novo pacote de investimentos 
    em infraestrutura. Durante reunião no Palácio do Planalto com o ministro Fernando Haddad, da Fazenda, 
    e representantes do BNDES, foram discutidos projetos que somam R$ 30 bilhões para o setor de transportes.
    """,
    
    """
    A Petrobras, sob comando de Jean Paul Prates, divulgou hoje seus resultados financeiros do primeiro 
    trimestre. A empresa registrou lucro de R$ 38 bilhões, superando as expectativas do mercado. O 
    diretor financeiro, Sergio Caetano Leite, destacou o papel da companhia no desenvolvimento do país.
    """,
    
    """
    O Supremo Tribunal Federal, presidido por Roberto Barroso, decidiu por unanimidade manter a decisão 
    que obriga o Congresso Nacional a dar transparência às emendas do orçamento secreto. O ministro 
    Alexandre de Moraes foi o relator do processo, que teve apoio da Procuradoria-Geral da República.
    """
]

In [3]:
# Definir o template do prompt para extração de entidades
entity_extraction_prompt = """
Analise a notícia abaixo e identifique todas as entidades mencionadas, classificando-as nas seguintes categorias:
1. Pessoas (nomes completos e cargos)
2. Organizações (empresas, órgãos públicos, instituições)
3. Valores monetários
4. Locais

Notícia:
{news}

Por favor, formate a resposta em tópicos claros e organizados por categoria.
"""

# Função para extrair entidades de uma notícia
def extract_entities(news_text):
    """
    Extrai entidades de uma notícia usando a API do Gemini
    
    Argumentos:
        news_text (str): O texto da notícia
        
    Retorna:
        str: Resposta formatada com as entidades identificadas
    """
    prompt = entity_extraction_prompt.format(news=news_text)
    response = model.generate_content(prompt)
    return response.text

In [4]:
# Processar e analisar a primeira notícia
print("Análise da Notícia 1:")
print("-" * 50)
result = extract_entities(news_articles[0])
print(result)
print("-" * 50)

Análise da Notícia 1:
--------------------------------------------------
**1. Pessoas (nomes completos e cargos)**

* Luiz Inácio Lula da Silva (presidente)
* Fernando Haddad (ministro da Fazenda)

**2. Organizações (empresas, órgãos públicos, instituições)**

* BNDES (Banco Nacional de Desenvolvimento Econômico e Social)
* Ministério da Fazenda
* Palácio do Planalto

**3. Valores monetários**

* R$ 30 bilhões

**4. Locais**

* Palácio do Planalto
--------------------------------------------------


In [5]:
# Processar e analisar a segunda notícia
print("Análise da Notícia 2:")
print("-" * 50)
result = extract_entities(news_articles[1])
print(result)
print("-" * 50)

Análise da Notícia 2:
--------------------------------------------------
**1. Pessoas**
- Jean Paul Prates (Presidente da Petrobras)
- Sergio Caetano Leite (Diretor Financeiro da Petrobras)

**2. Organizações**
- Petrobras

**3. Valores Monetários**
- R$ 38 bilhões

**4. Locais**
- Não há locais mencionados na notícia.
--------------------------------------------------


In [6]:
# Processar e analisar a terceira notícia
print("Análise da Notícia 3:")
print("-" * 50)
result = extract_entities(news_articles[2])
print(result)
print("-" * 50)

Análise da Notícia 3:
--------------------------------------------------
**1. Pessoas (nomes completos e cargos):**

* Roberto Barroso (Presidente do Supremo Tribunal Federal)
* Alexandre de Moraes (Relator do processo no Supremo Tribunal Federal)

**2. Organizações:**

* Supremo Tribunal Federal
* Congresso Nacional
* Procuradoria-Geral da República

**3. Valores monetários:**

* Não mencionados na notícia

**4. Locais:**

* Não mencionados na notícia
--------------------------------------------------


In [7]:
# Processar todas as notícias em sequência
def process_all_articles(articles):
    """
    Processa múltiplas notícias e extrai entidades de cada uma
    
    Argumentos:
        articles (list): Lista de notícias para processar
    """
    for i, article in enumerate(articles, 1):
        try:
            # Imprimir cabeçalho para a notícia atual
            print(f"\n{'='*60}")
            print(f"Análise da Notícia {i}".center(60))
            print(f"{'='*60}\n")
            
            # Mostrar prévia da notícia sendo processada
            preview = article[:100] + "..." if len(article) > 100 else article
            print("Prévia da Notícia:")
            print(f"{preview}\n")
            print("-" * 60)
            
            # Extrair e exibir entidades identificadas
            print("Entidades Extraídas:")
            result = extract_entities(article)
            print(result)
            
            # Imprimir separador entre notícias
            print(f"\n{'='*60}")
            
        except Exception as e:
            print(f"Erro ao processar notícia {i}: {str(e)}")
            continue

# Executar processamento em lote para todas as notícias
process_all_articles(news_articles)


                    Análise da Notícia 1                    

Prévia da Notícia:

    O presidente Luiz Inácio Lula da Silva anunciou nesta segunda-feira um novo pacote de investime...

------------------------------------------------------------
Entidades Extraídas:
**1. Pessoas**

* Luiz Inácio Lula da Silva (Presidente)
* Fernando Haddad (Ministro da Fazenda)

**2. Organizações**

* BNDES (Banco Nacional de Desenvolvimento Econômico e Social)
* Palácio do Planalto

**3. Valores Monetários**

* R$ 30 bilhões

**4. Locais**

* Não mencionados na notícia fornecida


                    Análise da Notícia 2                    

Prévia da Notícia:

    A Petrobras, sob comando de Jean Paul Prates, divulgou hoje seus resultados financeiros do prim...

------------------------------------------------------------
Entidades Extraídas:
**1. Pessoas (nomes completos e cargos)**
- Jean Paul Prates (CEO da Petrobras)
- Sergio Caetano Leite (Diretor Financeiro da Petrobras)

**2. Organizações (e