In [1]:
import sqlite3
import os

try:
  import google.colab
  IN_COLAB = True
except:
  IN_COLAB = False

if IN_COLAB:
    from google.colab import drive
    drive.mount('/content/drive')
    os.chdir('/content/drive/MyDrive/falando_nela_v2/src')
    print("Current working directory (Colab):", os.getcwd())
else:
  print("Current working directory (not Colab):", os.getcwd())
DB_PATH = "../data/DiscursosSenadores.sqlite"
conn = sqlite3.connect(DB_PATH)

Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Current working directory (Colab): /content/drive/MyDrive/falando_nela_v2/src


In [2]:
import pandas as pd
JSON_PATH = "complementacao_llm_2_normalized.json"
with open(JSON_PATH, encoding='utf-8') as f:
    df_normalized = pd.read_json(f, orient="records", dtype=str)


In [3]:
len(df_normalized)

12755

In [None]:
df_normalized.columns

Index(['CodigoPronunciamento', 'MencionaConstituicao', 'NormConclusao',
       'NormTrecho', 'AvalConclusao', 'AvalTrecho'],
      dtype='object')

In [4]:
from openai import OpenAI
api_key = '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'
client = OpenAI(api_key=api_key)
# Instalações necessárias (para Colab)
!pip install bertopic umap-learn hdbscan tiktoken openai nltk

# IMPORTAÇÕES
import os
import numpy as np
import pandas as pd
from tqdm import tqdm

from sklearn.preprocessing import normalize
from sklearn.feature_extraction.text import CountVectorizer

import nltk
from nltk.corpus import stopwords
nltk.download('stopwords')
stopwords_pt = stopwords.words("portuguese")

import umap
import hdbscan
import tiktoken
from bertopic import BERTopic
from bertopic.representation import OpenAI
from sklearn.preprocessing import normalize






[nltk_data] Downloading package stopwords to /root/nltk_data...
[nltk_data]   Package stopwords is already up-to-date!


In [5]:
summarization_prompt_conclusao = """
Você está analisando clusters que expressam **conclusões políticas ou normativas** — o que o discurso propõe fazer ou mudar com base nos argumentos anteriores.

Palavras-chave do cluster:
[KEYWORDS]

Amostra representativa:
[DOCUMENTS]

Indique o **objetivo ou proposta** que emerge do cluster:
topic: <tópico>

🔹 Use linguagem expressiva.
🔹 Seja específico e escreva em português. Não é necessário escrever uma frase completa, do tipo 'este tópico diz que...'.

Exemplos de saída:
['Reforma política através de Assembleia Constituinte exclusiva']
['Regulamentação e financiamento da saúde pública através da Emenda Constitucional nº 29']
['Fim do foro privilegiado']
"""


In [6]:
!pip install faiss-cpu

import os
import faiss
import pickle
import numpy as np
from tqdm import tqdm
from bertopic import BERTopic
from sklearn.preprocessing import normalize

# Função para salvar embeddings em FAISS
def salvar_embeddings_faiss(embeddings, codigos, nome_base):
    dimension = len(embeddings[0])
    index = faiss.IndexFlatL2(dimension)
    index.add(np.array(embeddings).astype('float32'))

    faiss.write_index(index, f"../data/modelos_bertopic/{nome_base}_faiss_complementacao.index")

    with open(f"../data/modelos_bertopic/{nome_base}_metadados_complementacao.pkl", "wb") as f:
        pickle.dump(codigos, f)

    print(f"[✔] Embeddings salvos em FAISS para {nome_base}")

# Função para carregar embeddings do FAISS (se existir)
def carregar_embeddings_faiss(nome_base):
    index_path = f"../data/modelos_bertopic/{nome_base}_faiss_complementacao.index"
    meta_path = f"../data/modelos_bertopic/{nome_base}_metadados_complementacao.pkl"

    if os.path.exists(index_path) and os.path.exists(meta_path):
        index = faiss.read_index(index_path)
        with open(meta_path, "rb") as f:
            codigos = pickle.load(f)
        embeddings = index.reconstruct_n(0, index.ntotal)
        print(f"[🔁] Embeddings carregados de FAISS para {nome_base}")
        return normalize(np.array(embeddings)), codigos
    else:
        return None, None

# Função para gerar embeddings com OpenAI
def gerar_embeddings_openai(textos, client, model="text-embedding-3-large"):
    embeddings = []
    for texto in tqdm(textos, desc="Gerando embeddings"):
        try:
            response = client.embeddings.create(input=texto, model=model)
            embeddings.append(response.data[0].embedding)
        except Exception as e:
            print(f"Erro ao gerar embedding: {e}")
            embeddings.append([0.0] * 1536)
    return normalize(np.array(embeddings))





In [12]:
# Listagem das colunas
colunas_para_modelar = [
    'NormConclusao',
    'AvalConclusao'
]

In [None]:
#Fazendo embeddings complementação

import os
# Listagem das colunas
colunas_para_modelar = [
    'NormConclusao',
    'AvalConclusao'
]

# Criação das pastas
os.makedirs("../data/modelos_bertopic", exist_ok=True)
os.makedirs("../data/topicos_gerados/v_2", exist_ok=True)

dfs_topicos_gerais = {}

for coluna in colunas_para_modelar:
    print(f"\n🔍 Modelando tópicos para: {coluna}")

    df_filtrado = df_normalized[df_normalized[coluna].notna() & df_normalized[coluna].str.strip().astype(bool)]
    textos = df_filtrado[coluna].tolist()
    codigos = df_filtrado["CodigoPronunciamento"].tolist()

    # Tenta carregar os embeddings do FAISS
    embeddings_normalizados, codigos_salvos = carregar_embeddings_faiss(coluna)

    # Se não houver, gera e salva
    if embeddings_normalizados is None:
        embeddings_normalizados = gerar_embeddings_openai(textos, client)
        salvar_embeddings_faiss(embeddings_normalizados, codigos, nome_base=coluna)
    else:
        # Verifica se os códigos são compatíveis
        if codigos != codigos_salvos:
            print(f"[⚠️] Atenção: os códigos atuais diferem dos salvos! Recalculando.")
            embeddings_normalizados = gerar_embeddings_openai(textos, client)
            salvar_embeddings_faiss(embeddings_normalizados, codigos, nome_base=coluna)





🔍 Modelando tópicos para: NormConclusao


Gerando embeddings: 100%|██████████| 11617/11617 [1:03:16<00:00,  3.06it/s]


[✔] Embeddings salvos em FAISS para NormConclusao

🔍 Modelando tópicos para: AvalConclusao


Gerando embeddings: 100%|██████████| 11615/11615 [1:06:14<00:00,  2.92it/s]


[✔] Embeddings salvos em FAISS para AvalConclusao


In [7]:
tokenizer = tiktoken.encoding_for_model("gpt-4o-2024-08-06")

# Criar modelo UMAP customizado
umap_model = umap.UMAP(
    n_neighbors=10,
    n_components=5,
    min_dist=0.0,
    metric="cosine",
    random_state=42
)

# Criar modelo HDBSCAN customizado
hdbscan_model = hdbscan.HDBSCAN(
    min_cluster_size=5,
    metric="euclidean",
    cluster_selection_method="eom",
    prediction_data=True
)

# Criar vetor de contagem com todas as stopwords
vectorizer_model = CountVectorizer(stop_words=stopwords_pt)

In [15]:
# prompt: Eu quero que você incorpore a coluna DataPronunciamento do arquivo /content/drive/MyDrive/falando_nela_v2/data/tabela_final.xlsx ao dataframe df_filtrado, fazendo a correspondência de CodigoPronunciamento

import pandas as pd
# Carrega o arquivo Excel com a coluna DataPronunciamento
df_data_pronunciamento = pd.read_excel('/content/drive/MyDrive/falando_nela_v2/data/tabela_final.xlsx', usecols=['CodigoPronunciamento', 'DataPronunciamento'])

# Converte a coluna 'CodigoPronunciamento' para string em ambos os DataFrames
df_data_pronunciamento['CodigoPronunciamento'] = df_data_pronunciamento['CodigoPronunciamento'].astype(str)
df_normalized['CodigoPronunciamento'] = df_normalized['CodigoPronunciamento'].astype(str)

# Realiza o merge dos dataframes
df_filtrado = pd.merge(df_normalized, df_data_pronunciamento, on='CodigoPronunciamento', how='left')


In [10]:
df_filtrado.head()

Unnamed: 0,CodigoPronunciamento,MencionaConstituicao,NormConclusao,NormTrecho,AvalConclusao,AvalTrecho,DataPronunciamento
0,366329,False,,,,,2007-02-07
1,366331,True,"Por causa disso, o orador critica a prática do...",Enquanto abre mão de uma receita que não lhe p...,"Por causa disso, o orador defende a necessidad...",O espírito da Constituição foi exatamente aume...,2007-02-07
2,366333,True,"Por causa disso, o orador propõe uma emenda co...","Tenho hoje um projeto, uma emenda constitucion...","Por causa disso, o orador defende a implementa...",Implícito: O discurso critica o atual sistema ...,2007-02-07
3,366336,False,,,,,2007-02-07
4,366394,False,,,,,2007-02-08


In [16]:
import os

# Diretório base
base_dir = "../data/topicos_gerados/v_12"
os.makedirs(base_dir, exist_ok=True)
os.makedirs("../data/modelos_bertopic", exist_ok=True)

# Lista de anos disponíveis no DataFrame
df_filtrado["DataPronunciamento"] = pd.to_datetime(df_filtrado["DataPronunciamento"], errors="coerce")
anos = sorted(df_filtrado["DataPronunciamento"].dt.year.dropna().unique())

dfs_topicos = {}

for ano in anos:
    for coluna in colunas_para_modelar:
        print(f"\n🔍 Modelando tópicos para: {coluna} no ano {ano}")

        df_ano_coluna = df_filtrado[
            (df_filtrado["DataPronunciamento"].dt.year == ano) &
            df_filtrado[coluna].notna() &
            df_filtrado[coluna].str.strip().astype(bool)
        ]

        textos = df_ano_coluna[coluna].tolist()
        codigos = df_ano_coluna["CodigoPronunciamento"].tolist()

        if not textos:
            print(f"[⚠️] Nenhum texto para {coluna} em {ano}. Pulando.")
            continue


        # Embeddings
        nome_base = f"{coluna}_{ano}"
        embeddings_normalizados, codigos_salvos = carregar_embeddings_faiss(nome_base)

        if embeddings_normalizados is None or codigos != codigos_salvos:
            if codigos != codigos_salvos:
                print(f"[⚠️] Recalculando embeddings (mismatch de códigos)")
            embeddings_normalizados = gerar_embeddings_openai(textos, client)
            salvar_embeddings_faiss(embeddings_normalizados, codigos, nome_base=nome_base)

        # Escolha da representação por tipo
        if coluna in ['NormConclusao', 'AvalConclusao']:
            representation_model = OpenAI(
                client=client,
                model="gpt-4o-2024-08-06",
                prompt=summarization_prompt_conclusao,
                delay_in_seconds=2,
                chat=True,
                nr_docs=8,
                doc_length=200,
                tokenizer=tokenizer
            )

        modelo_topicos = BERTopic(
            embedding_model=None,
            umap_model=umap_model,
            hdbscan_model=hdbscan_model,
            vectorizer_model=vectorizer_model,
            representation_model=representation_model,
            language="multilingual",
            verbose=True
        )

        topics, probs = modelo_topicos.fit_transform(textos, embeddings=embeddings_normalizados)

        df_topicos = modelo_topicos.get_document_info(textos)
        df_topicos["CodigoPronunciamento"] = codigos
        df_topicos["Ano"] = ano

        dfs_topicos[f"{coluna}_{ano}_topicos"] = df_topicos

        caminho_csv = f"{base_dir}/{coluna}_{ano}_topicos_complementacao.csv"
        os.makedirs(os.path.dirname(caminho_csv), exist_ok=True)
        df_topicos.to_csv(caminho_csv, index=False)

        print(modelo_topicos.get_topic_info().head())

2025-04-10 19:03:54,021 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm



🔍 Modelando tópicos para: NormConclusao no ano 2007
[🔁] Embeddings carregados de FAISS para NormConclusao_2007


2025-04-10 19:03:57,016 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:03:57,017 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:03:57,052 - BERTopic - Cluster - Completed ✓
2025-04-10 19:03:57,057 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 39/39 [01:57<00:00,  3.02s/it]
2025-04-10 19:05:54,963 - BERTopic - Representation - Completed ✓
2025-04-10 19:05:55,227 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


   Topic  Count                                               Name  \
0     -1    114  -1_['Fortalecimento das ações governamentais e...   
1      0     56  0_['Revisão do pacto federativo para redistrib...   
2      1     29  1_['Fim do voto secreto para aumentar a transp...   
3      2     28  2_['Revisão constitucional para limitar o uso ...   
4      3     25  3_['Regulamentação e financiamento da saúde pú...   

                                      Representation  \
0  [['Fortalecimento das ações governamentais e l...   
1  [['Revisão do pacto federativo para redistribu...   
2  [['Fim do voto secreto para aumentar a transpa...   
3  [['Revisão constitucional para limitar o uso d...   
4  [['Regulamentação e financiamento da saúde púb...   

                                 Representative_Docs  
0  [Por causa disso, o orador destaca a importânc...  
1  [Por causa disso, o orador defende a revisão d...  
2  [Por causa disso, o orador defende a necessida...  
3  [Por causa disso, o

2025-04-10 19:05:58,222 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:05:58,226 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:05:58,273 - BERTopic - Cluster - Completed ✓
2025-04-10 19:05:58,279 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 43/43 [02:01<00:00,  2.83s/it]
2025-04-10 19:08:00,418 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    113  -1_['Reformulação das políticas habitacionais ...   
1      0     42  0_['Revisão do pacto federativo para redistrib...   
2      1     40  1_['Transferência de terras da União para esta...   
3      2     38  2_['Extinção da CPMF para aliviar a carga trib...   
4      3     25  3_['Melhoria da educação através de financiame...   

                                      Representation  \
0  [['Reformulação das políticas habitacionais pa...   
1  [['Revisão do pacto federativo para redistribu...   
2  [['Transferência de terras da União para estad...   
3  [['Extinção da CPMF para aliviar a carga tribu...   
4  [['Melhoria da educação através de financiamen...   

                                 Representative_Docs  
0  [Por causa disso, o orador expressa descontent...  
1  [Por causa disso, o orador apoia propostas com...  
2  [Por causa disso, o orador sugere que a políti...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 765/765 [04:17<00:00,  2.97it/s]
2025-04-10 19:12:18,811 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2008


2025-04-10 19:12:22,346 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:12:22,347 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:12:22,381 - BERTopic - Cluster - Completed ✓
2025-04-10 19:12:22,386 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 46/46 [02:11<00:00,  2.86s/it]
2025-04-10 19:14:34,344 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    144  -1_['Restrição do uso de medidas provisórias e...   
1      0     44  0_['Demarcação contínua das terras indígenas R...   
2      1     39  1_['Limitação do uso de medidas provisórias pe...   
3      2     32  2_['Revisão e reajuste das aposentadorias e be...   
4      3     32  3_['Limitação do uso de medidas provisórias pe...   

                                      Representation  \
0  [['Restrição do uso de medidas provisórias e r...   
1  [['Demarcação contínua das terras indígenas Ra...   
2  [['Limitação do uso de medidas provisórias pel...   
3  [['Revisão e reajuste das aposentadorias e ben...   
4  [['Limitação do uso de medidas provisórias pel...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a falta de ...  
1  [Por causa disso, o orador defende a homologaç...  
2  [Por causa disso, o orador critica o uso exces...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 769/769 [03:56<00:00,  3.26it/s]
2025-04-10 19:18:31,301 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2008


2025-04-10 19:18:36,217 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:18:36,219 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:18:36,249 - BERTopic - Cluster - Completed ✓
2025-04-10 19:18:36,254 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 41/41 [02:00<00:00,  2.94s/it]
2025-04-10 19:20:37,068 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    127  -1_['Fortalecimento do papel do Congresso Naci...   
1      0     69  0_['Reforma previdenciária justa através do re...   
2      1     42  1_['Celebração e valorização da Constituição d...   
3      2     29  2_['Limitar o uso de medidas provisórias pelo ...   
4      3     26  3_['Reforma política abrangente para fortalece...   

                                      Representation  \
0  [['Fortalecimento do papel do Congresso Nacion...   
1  [['Reforma previdenciária justa através do rea...   
2  [['Celebração e valorização da Constituição de...   
3  [['Limitar o uso de medidas provisórias pelo G...   
4  [['Reforma política abrangente para fortalecer...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a atuação d...  
1  [Por causa disso, o orador defende a aprovação...  
2  [Por causa disso, o orador celebra a Constitui...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 758/758 [05:11<00:00,  2.43it/s]
2025-04-10 19:25:49,655 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2009


2025-04-10 19:25:54,736 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:25:54,737 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:25:54,769 - BERTopic - Cluster - Completed ✓
2025-04-10 19:25:54,775 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 51/51 [02:32<00:00,  2.99s/it]
2025-04-10 19:28:27,728 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    113  -1_['Revisão legislativa e fortalecimento da c...   
1      0     27  0_['Respeitar a soberania brasileira na decisã...   
2      1     26  1_['Fortalecimento das instituições democrátic...   
3      2     25  2_['Aumento da transparência e conformidade do...   
4      3     22  3_['Reavaliação da demarcação de terras indíge...   

                                      Representation  \
0  [['Revisão legislativa e fortalecimento da con...   
1  [['Respeitar a soberania brasileira na decisão...   
2  [['Fortalecimento das instituições democrática...   
3  [['Aumento da transparência e conformidade dos...   
4  [['Reavaliação da demarcação de terras indígen...   

                                 Representative_Docs  
0  [Por causa disso, o orador propõe um projeto d...  
1  [Por causa disso, o orador defende que a decis...  
2  [Por causa disso, o orador destaca a importânc...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 760/760 [04:11<00:00,  3.03it/s]
2025-04-10 19:32:39,443 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2009


2025-04-10 19:32:42,932 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:32:42,933 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:32:42,968 - BERTopic - Cluster - Completed ✓
2025-04-10 19:32:42,974 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 40/40 [01:51<00:00,  2.80s/it]
2025-04-10 19:34:35,121 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     96  -1_['Estabelecimento de normas rigorosas para ...   
1      0     63  0_['Revisão do pacto federativo para distribui...   
2      1     47  1_['Reforma da legislação para justiça social ...   
3      2     41  2_['Reforma administrativa e implementação de ...   
4      3     25  3_['Regulamentação e financiamento da saúde pú...   

                                      Representation  \
0  [['Estabelecimento de normas rigorosas para po...   
1  [['Revisão do pacto federativo para distribuiç...   
2  [['Reforma da legislação para justiça social e...   
3  [['Reforma administrativa e implementação de m...   
4  [['Regulamentação e financiamento da saúde púb...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica o projeto d...  
1  [Por causa disso, o orador critica a atual dis...  
2  [Por causa disso, o orador reforça a importânc...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 583/583 [03:14<00:00,  3.00it/s]
2025-04-10 19:37:50,200 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2010


2025-04-10 19:37:52,501 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:37:52,505 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:37:52,539 - BERTopic - Cluster - Completed ✓
2025-04-10 19:37:52,544 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 36/36 [01:47<00:00,  2.99s/it]
2025-04-10 19:39:40,368 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     70  -1_['Revisão da legislação trabalhista e aumen...   
1      0     53  0_['Defesa da democracia e das liberdades cons...   
2      1     34  1_['Fortalecimento da educação de qualidade e ...   
3      2     25  2_['Promoção da igualdade de gênero e racial a...   
4      3     22  3_['Regulamentação e financiamento da saúde pú...   

                                      Representation  \
0  [['Revisão da legislação trabalhista e aumento...   
1  [['Defesa da democracia e das liberdades const...   
2  [['Fortalecimento da educação de qualidade e c...   
3  [['Promoção da igualdade de gênero e racial at...   
4  [['Regulamentação e financiamento da saúde púb...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a falta de ...  
1  [Por causa disso, o orador defende a importânc...  
2  [Por causa disso, o orador propõe a inclusão d...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 582/582 [03:23<00:00,  2.86it/s]
2025-04-10 19:43:04,068 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2010


2025-04-10 19:43:06,419 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:43:06,420 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:43:06,448 - BERTopic - Cluster - Completed ✓
2025-04-10 19:43:06,454 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 35/35 [01:43<00:00,  2.97s/it]
2025-04-10 19:44:50,608 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     95  -1_['Promoção da justiça social e sustentabili...   
1      0     47  0_['Combate à corrupção e fortalecimento da in...   
2      1     33  1_['Redefinição da distribuição dos royalties ...   
3      2     28  2_['Melhoria da educação através de políticas ...   
4      3     28  3_['Revisão das normas ambientais e da polític...   

                                      Representation  \
0  [['Promoção da justiça social e sustentabilida...   
1  [['Combate à corrupção e fortalecimento da int...   
2  [['Redefinição da distribuição dos royalties d...   
3  [['Melhoria da educação através de políticas p...   
4  [['Revisão das normas ambientais e da política...   

                                 Representative_Docs  
0  [Por causa disso, o orador apoia a Campanha da...  
1  [Por causa disso, o orador critica o uso da má...  
2  [Por causa disso, o orador apoia a Emenda Ibse...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 781/781 [04:55<00:00,  2.64it/s]
2025-04-10 19:49:47,066 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2011


2025-04-10 19:49:51,661 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:49:51,667 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:49:51,727 - BERTopic - Cluster - Completed ✓
2025-04-10 19:49:51,736 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 44/44 [02:11<00:00,  3.00s/it]
2025-04-10 19:52:03,889 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     90  -1_['Cumprimento e implementação de legislaçõe...   
1      0     42  0_['Redistribuição equitativa dos royalties do...   
2      1     36  1_['Reforço da transparência e fiscalização na...   
3      2     35  2_['Proteção e ampliação das liberdades consti...   
4      3     32  3_['Regulamentação urgente da Emenda Constituc...   

                                      Representation  \
0  [['Cumprimento e implementação de legislações ...   
1  [['Redistribuição equitativa dos royalties do ...   
2  [['Reforço da transparência e fiscalização na ...   
3  [['Proteção e ampliação das liberdades constit...   
4  [['Regulamentação urgente da Emenda Constituci...   

                                 Representative_Docs  
0  [Por causa disso, o orador apoia a regulamenta...  
1  [Por causa disso, o orador apoia a aprovação d...  
2  [Por causa disso, o orador enfatiza a importân...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 778/778 [04:20<00:00,  2.98it/s]
2025-04-10 19:56:25,315 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2011


2025-04-10 19:56:29,152 - BERTopic - Dimensionality - Completed ✓
2025-04-10 19:56:29,153 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 19:56:29,194 - BERTopic - Cluster - Completed ✓
2025-04-10 19:56:29,200 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 47/47 [02:06<00:00,  2.69s/it]
2025-04-10 19:58:35,981 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    143  -1_['Financiamento adequado e regulamentação p...   
1      0     44  0_['Redistribuição justa dos royalties do petr...   
2      1     33  1_['Implementação da Lei da Ficha Limpa para p...   
3      2     24  2_['Revisão e aprovação do novo Código Florest...   
4      3     21  3_['Promoção de lideranças políticas éticas e ...   

                                      Representation  \
0  [['Financiamento adequado e regulamentação par...   
1  [['Redistribuição justa dos royalties do petró...   
2  [['Implementação da Lei da Ficha Limpa para pr...   
3  [['Revisão e aprovação do novo Código Floresta...   
4  [['Promoção de lideranças políticas éticas e d...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a gestão do...  
1  [Por causa disso, o orador sugere que a propos...  
2  [Por causa disso, o orador defende a aplicação...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 681/681 [03:38<00:00,  3.12it/s]
2025-04-10 20:02:14,589 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2012


2025-04-10 20:02:17,531 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:02:17,533 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:02:17,564 - BERTopic - Cluster - Completed ✓
2025-04-10 20:02:17,569 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 44/44 [02:03<00:00,  2.80s/it]
2025-04-10 20:04:20,861 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    106  -1_['Fortalecimento das políticas públicas e p...   
1      0     29  0_['Implementação de políticas públicas para d...   
2      1     26  1_['Redistribuição equitativa dos royalties do...   
3      2     24  2_['Limitar o uso excessivo de medidas provisó...   
4      3     23  3_['Revisão do pacto federativo para garantir ...   

                                      Representation  \
0  [['Fortalecimento das políticas públicas e pro...   
1  [['Implementação de políticas públicas para de...   
2  [['Redistribuição equitativa dos royalties do ...   
3  [['Limitar o uso excessivo de medidas provisór...   
4  [['Revisão do pacto federativo para garantir d...   

                                 Representative_Docs  
0  [Por causa disso, o orador destaca a importânc...  
1  [Por causa disso, o orador defende que o novo ...  
2  [Por causa disso, o orador defende a redistrib...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 682/682 [03:55<00:00,  2.89it/s]
2025-04-10 20:08:17,167 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2012


2025-04-10 20:08:20,162 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:08:20,163 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:08:20,198 - BERTopic - Cluster - Completed ✓
2025-04-10 20:08:20,204 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 42/42 [02:00<00:00,  2.86s/it]
2025-04-10 20:10:20,501 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    124  -1_['Educação em cidadania e ética no currícul...   
1      0     36  0_['Revisão do pacto federativo para fortalece...   
2      1     34  1_['Redistribuição equitativa dos royalties do...   
3      2     25  2_['Reforma política abrangente para fortalece...   
4      3     22  3_['Reforma do Código Penal Brasileiro para in...   

                                      Representation  \
0  [['Educação em cidadania e ética no currículo ...   
1  [['Revisão do pacto federativo para fortalecer...   
2  [['Redistribuição equitativa dos royalties do ...   
3  [['Reforma política abrangente para fortalecer...   
4  [['Reforma do Código Penal Brasileiro para inc...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a inação do...  
1  [Por causa disso, o orador apoia a reforma do ...  
2  [Por causa disso, o orador apoia a aprovação d...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 1095/1095 [06:26<00:00,  2.83it/s]
2025-04-10 20:16:47,856 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2013


2025-04-10 20:16:55,735 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:16:55,736 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:16:55,790 - BERTopic - Cluster - Completed ✓
2025-04-10 20:16:55,795 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 62/62 [02:53<00:00,  2.79s/it]
2025-04-10 20:19:49,319 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    130  -1_['Fortalecimento da autonomia e das competê...   
1      0     78  0_['Revisão do pacto federativo para uma distr...   
2      1     61  1_['Fim do voto secreto no legislativo para au...   
3      2     43  2_['Implementação inclusiva e financiamento ro...   
4      3     39  3_['Revisão do processo de demarcação de terra...   

                                      Representation  \
0  [['Fortalecimento da autonomia e das competênc...   
1  [['Revisão do pacto federativo para uma distri...   
2  [['Fim do voto secreto no legislativo para aum...   
3  [['Implementação inclusiva e financiamento rob...   
4  [['Revisão do processo de demarcação de terras...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende que o Congr...  
1  [Por causa disso, o orador destaca a necessida...  
2  [Por causa disso, o orador apoia a Emenda Cons...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 1103/1103 [06:21<00:00,  2.89it/s]
2025-04-10 20:26:11,081 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2013


2025-04-10 20:26:18,992 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:26:18,997 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:26:19,047 - BERTopic - Cluster - Completed ✓
2025-04-10 20:26:19,051 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 65/65 [02:58<00:00,  2.75s/it]
2025-04-10 20:29:17,889 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    172  -1_['Aprovação de reformas legislativas e cons...   
1      0     47  0_['Promoção do desenvolvimento regional e eco...   
2      1     46  1_['Revisão e fortalecimento do Pacto Federati...   
3      2     35  2_['Mudança no processo de demarcação de terra...   
4      3     30  3_['Valorização contínua da Constituição de 19...   

                                      Representation  \
0  [['Aprovação de reformas legislativas e consti...   
1  [['Promoção do desenvolvimento regional e econ...   
2  [['Revisão e fortalecimento do Pacto Federativ...   
3  [['Mudança no processo de demarcação de terras...   
4  [['Valorização contínua da Constituição de 198...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende a necessida...  
1  [Por causa disso, o orador apoia o Projeto de ...  
2  [Por causa disso, o orador critica a atual dis...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 418/418 [02:30<00:00,  2.77it/s]
2025-04-10 20:31:49,344 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2014


2025-04-10 20:31:50,860 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:31:50,862 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:31:50,885 - BERTopic - Cluster - Completed ✓
2025-04-10 20:31:50,891 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 29/29 [01:22<00:00,  2.84s/it]
2025-04-10 20:33:13,364 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     59  -1_['Autonomia e fortalecimento das funções fi...   
1      0     34  0_['Universalização do acesso à saúde e educaç...   
2      1     28  1_['Reforma tributária e regularização de ince...   
3      2     28  2_['Respeito às garantias constitucionais ao l...   
4      3     28  3_['Instalação de uma CPI para investigar irre...   

                                      Representation  \
0  [['Autonomia e fortalecimento das funções fisc...   
1  [['Universalização do acesso à saúde e educaçã...   
2  [['Reforma tributária e regularização de incen...   
3  [['Respeito às garantias constitucionais ao le...   
4  [['Instalação de uma CPI para investigar irreg...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende a inclusão ...  
1  [Por causa disso, o orador defende a continuid...  
2  [Por causa disso, o orador defende a necessida...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 417/417 [02:33<00:00,  2.71it/s]
2025-04-10 20:35:47,585 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2014


2025-04-10 20:35:49,638 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:35:49,643 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:35:49,678 - BERTopic - Cluster - Completed ✓
2025-04-10 20:35:49,687 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 26/26 [01:19<00:00,  3.05s/it]
2025-04-10 20:37:09,188 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     78  -1_['Reforma política para garantir igualdade ...   
1      0     31  0_['Defesa da instauração de CPIs independente...   
2      1     28  1_['Reestruturação das políticas públicas e ge...   
3      2     22  2_['Ampliação e consolidação da participação s...   
4      3     20  3_['Continuidade e ampliação de políticas soci...   

                                      Representation  \
0  [['Reforma política para garantir igualdade de...   
1  [['Defesa da instauração de CPIs independentes...   
2  [['Reestruturação das políticas públicas e ges...   
3  [['Ampliação e consolidação da participação so...   
4  [['Continuidade e ampliação de políticas socia...   

                                 Representative_Docs  
0  [Por causa disso, o orador apoia o Projeto de ...  
1  [Por causa disso, o orador critica a tentativa...  
2  [Por causa disso, o orador expressa sua frustr...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 702/702 [04:11<00:00,  2.79it/s]
2025-04-10 20:41:21,283 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2015


2025-04-10 20:41:24,388 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:41:24,390 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:41:24,421 - BERTopic - Cluster - Completed ✓
2025-04-10 20:41:24,427 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 39/39 [01:47<00:00,  2.76s/it]
2025-04-10 20:43:12,134 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    107  -1_['Abertura de processo de impeachment contr...   
1      0     57  0_['Revisão do Pacto Federativo para aumentar ...   
2      1     37  1_['Defesa da legalidade e legitimidade no pro...   
3      2     30  2_['Preservação e fortalecimento da normalidad...   
4      3     28  3_['Proteção dos direitos indígenas e oposição...   

                                      Representation  \
0  [['Abertura de processo de impeachment contra ...   
1  [['Revisão do Pacto Federativo para aumentar a...   
2  [['Defesa da legalidade e legitimidade no proc...   
3  [['Preservação e fortalecimento da normalidade...   
4  [['Proteção dos direitos indígenas e oposição ...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a proposta ...  
1  [Por causa disso, o orador defende a necessida...  
2  [Por causa disso, o orador defende que o impea...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 702/702 [03:53<00:00,  3.01it/s]
2025-04-10 20:47:05,650 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2015


2025-04-10 20:47:08,683 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:47:08,686 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:47:08,718 - BERTopic - Cluster - Completed ✓
2025-04-10 20:47:08,725 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 35/35 [01:36<00:00,  2.77s/it]
2025-04-10 20:48:45,877 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    139  -1_['Promoção de justiça social e eficiência g...   
1      0     56  0_['Fim do financiamento empresarial de campan...   
2      1     52  1_['Defesa da democracia e legalidade contra i...   
3      2     40  2_['Oposição à regulamentação da terceirização...   
4      3     36  3_['Diálogo nacional e medidas políticas para ...   

                                      Representation  \
0  [['Promoção de justiça social e eficiência gov...   
1  [['Fim do financiamento empresarial de campanh...   
2  [['Defesa da democracia e legalidade contra im...   
3  [['Oposição à regulamentação da terceirização ...   
4  [['Diálogo nacional e medidas políticas para e...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a falta de ...  
1  [Por causa disso, o orador apoia a reforma pol...  
2  [Por causa disso, o orador considera que o imp...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 1126/1126 [06:31<00:00,  2.87it/s]
2025-04-10 20:55:18,270 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2016


2025-04-10 20:55:25,727 - BERTopic - Dimensionality - Completed ✓
2025-04-10 20:55:25,733 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 20:55:25,802 - BERTopic - Cluster - Completed ✓
2025-04-10 20:55:25,812 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 51/51 [02:19<00:00,  2.74s/it]
2025-04-10 20:57:46,006 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    260  -1_['Debate sobre a legalidade e constituciona...   
1      0     66  0_['Crítica e oposição à implementação de um t...   
2      1     47  1_['Preservação e proteção de direitos constit...   
3      2     46  2_['Seguimento estrito do rito constitucional ...   
4      3     41  3_['Impeachment da Presidente Dilma Rousseff p...   

                                      Representation  \
0  [['Debate sobre a legalidade e constitucionali...   
1  [['Crítica e oposição à implementação de um te...   
2  [['Preservação e proteção de direitos constitu...   
3  [['Seguimento estrito do rito constitucional n...   
4  [['Impeachment da Presidente Dilma Rousseff po...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende que o proce...  
1  [Por causa disso, o orador critica a PEC 55, q...  
2  [Por causa disso, o orador destaca a importânc...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 1120/1120 [06:44<00:00,  2.77it/s]
2025-04-10 21:04:31,295 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2016


2025-04-10 21:04:39,389 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:04:39,390 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:04:39,437 - BERTopic - Cluster - Completed ✓
2025-04-10 21:04:39,443 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 60/60 [02:50<00:00,  2.85s/it]
2025-04-10 21:07:30,594 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    295  -1_['Crítica ao impeachment considerado golpe ...   
1      0     40  0_['Impeachment da Presidente Dilma Rousseff d...   
2      1     37  1_['Apoio à PEC do Teto de Gastos como medida ...   
3      2     33  2_['Oposição à PEC 241/55 e defesa dos direito...   
4      3     28  3_['Impeachment como meio de restaurar governa...   

                                      Representation  \
0  [['Crítica ao impeachment considerado golpe pa...   
1  [['Impeachment da Presidente Dilma Rousseff de...   
2  [['Apoio à PEC do Teto de Gastos como medida p...   
3  [['Oposição à PEC 241/55 e defesa dos direitos...   
4  [['Impeachment como meio de restaurar governab...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica o processo ...  
1  [Por causa disso, o orador apoia o processo de...  
2  [Por causa disso, o orador apoia a PEC 241, qu...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 629/629 [03:21<00:00,  3.12it/s]
2025-04-10 21:10:53,003 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2017


2025-04-10 21:10:55,572 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:10:55,573 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:10:55,605 - BERTopic - Cluster - Completed ✓
2025-04-10 21:10:55,610 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 35/35 [01:37<00:00,  2.79s/it]
2025-04-10 21:12:33,374 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     79  -1_['Defesa dos direitos previdenciários e tra...   
1      0     65  0_['Aprovação de PEC para permitir eleições di...   
2      1     36  1_['Defesa dos direitos sociais garantidos pel...   
3      2     30  2_['Defesa da autonomia do Senado em questões ...   
4      3     30  3_['Extinção do foro privilegiado para promove...   

                                      Representation  \
0  [['Defesa dos direitos previdenciários e traba...   
1  [['Aprovação de PEC para permitir eleições dir...   
2  [['Defesa dos direitos sociais garantidos pela...   
3  [['Defesa da autonomia do Senado em questões e...   
4  [['Extinção do foro privilegiado para promover...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica as medidas ...  
1  [Por causa disso, o orador defende que a PEC d...  
2  [Por causa disso, o orador critica as reformas...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 629/629 [03:46<00:00,  2.78it/s]
2025-04-10 21:16:19,982 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2017


2025-04-10 21:16:22,556 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:16:22,557 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:16:22,586 - BERTopic - Cluster - Completed ✓
2025-04-10 21:16:22,590 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 33/33 [01:31<00:00,  2.78s/it]
2025-04-10 21:17:54,618 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    120  -1_['Resistência às reformas previdenciária e ...   
1      0     55  0_['Realização de eleições diretas como soluçã...   
2      1     36  1_['Rejeição da reforma trabalhista e proteção...   
3      2     35  2_['Revisão das decisões do Supremo Tribunal F...   
4      3     29  3_['Reforma política abrangente e transparente...   

                                      Representation  \
0  [['Resistência às reformas previdenciária e tr...   
1  [['Realização de eleições diretas como solução...   
2  [['Rejeição da reforma trabalhista e proteção ...   
3  [['Revisão das decisões do Supremo Tribunal Fe...   
4  [['Reforma política abrangente e transparente ...   

                                 Representative_Docs  
0  [Por causa disso, o orador se opõe veementemen...  
1  [Por causa disso, o orador critica a atual est...  
2  [Por causa disso, o orador se opõe ao Projeto ...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 537/537 [03:30<00:00,  2.55it/s]
2025-04-10 21:21:25,265 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2018


2025-04-10 21:21:28,064 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:21:28,066 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:21:28,096 - BERTopic - Cluster - Completed ✓
2025-04-10 21:21:28,101 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 27/27 [01:14<00:00,  2.76s/it]
2025-04-10 21:22:42,753 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     69  -1_['Revisão do papel e decisões do Supremo Tr...   
1      0     70  0_['Fortalecimento da democracia através da de...   
2      1     53  1_['Suspensão do Decreto Presidencial nº 9.394...   
3      2     33  2_['Adoção do voto aberto para as eleições dos...   
4      3     29  3_['Determinação do Supremo Tribunal Federal s...   

                                      Representation  \
0  [['Revisão do papel e decisões do Supremo Trib...   
1  [['Fortalecimento da democracia através da def...   
2  [['Suspensão do Decreto Presidencial nº 9.394 ...   
3  [['Adoção do voto aberto para as eleições dos ...   
4  [['Determinação do Supremo Tribunal Federal so...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a atuação d...  
1  [Por causa disso, o orador destaca a importânc...  
2  [Por causa disso, o orador argumenta que o Dec...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 537/537 [03:03<00:00,  2.92it/s]
2025-04-10 21:25:46,782 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2018


2025-04-10 21:25:49,852 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:25:49,857 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:25:49,896 - BERTopic - Cluster - Completed ✓
2025-04-10 21:25:49,905 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 31/31 [01:24<00:00,  2.71s/it]
2025-04-10 21:27:14,200 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    100  -1_['Resistência contra políticas governamenta...   
1      0     41  0_['Revisão da decisão do STF sobre prisão em ...   
2      1     27  1_['Defesa da democracia e dos direitos consti...   
3      2     21  2_['Promoção contínua da igualdade de gênero e...   
4      3     20  3_['Libertação do ex-presidente Lula como defe...   

                                      Representation  \
0  [['Resistência contra políticas governamentais...   
1  [['Revisão da decisão do STF sobre prisão em s...   
2  [['Defesa da democracia e dos direitos constit...   
3  [['Promoção contínua da igualdade de gênero e ...   
4  [['Libertação do ex-presidente Lula como defes...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica o projeto d...  
1  [Por causa disso, o orador considera que a não...  
2  [Por causa disso, o orador alerta para o risco...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 643/643 [03:25<00:00,  3.13it/s]
2025-04-10 21:30:39,986 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2019


2025-04-10 21:30:42,607 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:30:42,608 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:30:42,635 - BERTopic - Cluster - Completed ✓
2025-04-10 21:30:42,639 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 37/37 [01:40<00:00,  2.71s/it]
2025-04-10 21:32:23,143 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    135  -1_['Respeito aos princípios da Constituição d...   
1      0     30  0_['Reformulação do pacto federativo para melh...   
2      1     29  1_['Instalação da CPI da Lava Toga para invest...   
3      2     28  2_['Rejeição à reforma da previdência e defesa...   
4      3     28  3_['Garantia do direito à educação e saúde de ...   

                                      Representation  \
0  [['Respeito aos princípios da Constituição de ...   
1  [['Reformulação do pacto federativo para melho...   
2  [['Instalação da CPI da Lava Toga para investi...   
3  [['Rejeição à reforma da previdência e defesa ...   
4  [['Garantia do direito à educação e saúde de q...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende que a refor...  
1  [Por causa disso, o orador defende a aprovação...  
2  [Por causa disso, o orador defende a instalaçã...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 645/645 [03:42<00:00,  2.90it/s]
2025-04-10 21:36:06,216 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2019


2025-04-10 21:36:08,868 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:36:08,869 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:36:08,899 - BERTopic - Cluster - Completed ✓
2025-04-10 21:36:08,904 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 40/40 [01:51<00:00,  2.79s/it]
2025-04-10 21:38:00,896 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    103  -1_['Aprovação de projetos de lei para promove...   
1      0     41  0_['Oposição à reforma da previdência proposta...   
2      1     39  1_['Implementação da prisão após condenação em...   
3      2     31  2_['Desenvolvimento sustentável e preservação ...   
4      3     30  3_['Reforma justa e equilibrada da previdência...   

                                      Representation  \
0  [['Aprovação de projetos de lei para promover ...   
1  [['Oposição à reforma da previdência proposta ...   
2  [['Implementação da prisão após condenação em ...   
3  [['Desenvolvimento sustentável e preservação d...   
4  [['Reforma justa e equilibrada da previdência ...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica o modelo ec...  
1  [Por causa disso, o orador se opõe à reforma d...  
2  [Por causa disso, o orador defende a aprovação...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 169/169 [00:56<00:00,  3.02it/s]
2025-04-10 21:38:57,225 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2020


2025-04-10 21:38:57,650 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:38:57,651 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:38:57,663 - BERTopic - Cluster - Completed ✓
2025-04-10 21:38:57,668 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 11/11 [00:29<00:00,  2.72s/it]
2025-04-10 21:39:27,635 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     26  -1_['Preservação das normas constitucionais na...   
1      0     24  0_['Debate sobre a reeleição dos membros do Co...   
2      1     24  1_['Impeachment de Jair Bolsonaro por violação...   
3      2     20  2_['Reforma tributária progressiva e taxação d...   
4      3     17  3_['Fortalecimento da separação dos poderes e ...   

                                      Representation  \
0  [['Preservação das normas constitucionais nas ...   
1  [['Debate sobre a reeleição dos membros do Con...   
2  [['Impeachment de Jair Bolsonaro por violação ...   
3  [['Reforma tributária progressiva e taxação da...   
4  [['Fortalecimento da separação dos poderes e r...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende que a execu...  
1  [Por causa disso, o orador critica a possibili...  
2  [Por causa disso, o orador apoia a abertura de...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 168/168 [00:52<00:00,  3.22it/s]
2025-04-10 21:40:19,986 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2020


2025-04-10 21:40:20,551 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:40:20,556 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:40:20,571 - BERTopic - Cluster - Completed ✓
2025-04-10 21:40:20,577 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 7/7 [00:18<00:00,  2.58s/it]
2025-04-10 21:40:38,710 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     16  -1_['Defesa e fortalecimento do SUS e da democ...   
1      0     59  0_['Limitação do ativismo judicial do Supremo ...   
2      1     30  1_['Reforma tributária e administrativa para p...   
3      2     23  2_['Tornar o Fundeb permanente e aumentar a co...   
4      3     19  3_['Impeachment do Presidente Jair Bolsonaro p...   

                                      Representation  \
0  [['Defesa e fortalecimento do SUS e da democra...   
1  [['Limitação do ativismo judicial do Supremo T...   
2  [['Reforma tributária e administrativa para pr...   
3  [['Tornar o Fundeb permanente e aumentar a con...   
4  [['Impeachment do Presidente Jair Bolsonaro pa...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a inação do...  
1  [Por causa disso, o orador defende que o Senad...  
2  [Por causa disso, o orador apoia a continuidad...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 474/474 [04:30<00:00,  1.75it/s]
2025-04-10 21:45:09,373 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2021


2025-04-10 21:45:11,049 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:45:11,050 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:45:11,076 - BERTopic - Cluster - Completed ✓
2025-04-10 21:45:11,082 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 32/32 [01:27<00:00,  2.72s/it]
2025-04-10 21:46:38,346 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     88  -1_['Fortalecimento da segurança pública e gar...   
1      0     49  0_['Defesa e fortalecimento da democracia e Co...   
2      1     25  1_['Rejeição ou adequação das Medidas Provisór...   
3      2     22  2_['Instalação de uma Comissão Parlamentar de ...   
4      3     22  3_['Aprovação de projetos de lei em conformida...   

                                      Representation  \
0  [['Fortalecimento da segurança pública e garan...   
1  [['Defesa e fortalecimento da democracia e Con...   
2  [['Rejeição ou adequação das Medidas Provisóri...   
3  [['Instalação de uma Comissão Parlamentar de I...   
4  [['Aprovação de projetos de lei em conformidad...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende que a educa...  
1  [Por causa disso, o orador destaca a importânc...  
2  [Por causa disso, o orador defende a manutençã...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 473/473 [02:27<00:00,  3.21it/s]
2025-04-10 21:49:06,025 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2021


2025-04-10 21:49:07,736 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:49:07,737 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:49:07,763 - BERTopic - Cluster - Completed ✓
2025-04-10 21:49:07,768 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 29/29 [01:15<00:00,  2.60s/it]
2025-04-10 21:50:23,356 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     81  -1_['Garantia da continuidade e regulamentação...   
1      0     28  0_['Investimentos e políticas para garantir se...   
2      1     25  1_['Instalação e continuidade da CPI da Pandem...   
3      2     23  2_['Revisão do teto de gastos para proteger di...   
4      3     22  3_['Fortalecimento da democracia e da harmonia...   

                                      Representation  \
0  [['Garantia da continuidade e regulamentação d...   
1  [['Investimentos e políticas para garantir seg...   
2  [['Instalação e continuidade da CPI da Pandemi...   
3  [['Revisão do teto de gastos para proteger dir...   
4  [['Fortalecimento da democracia e da harmonia ...   

                                 Representative_Docs  
0  [Por causa disso, o orador apoia a aprovação d...  
1  [Por causa disso, o orador critica a proposta ...  
2  [Por causa disso, o orador argumenta que a CPI...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 535/535 [02:59<00:00,  2.98it/s]
2025-04-10 21:53:23,545 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2022


2025-04-10 21:53:26,168 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:53:26,169 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:53:26,200 - BERTopic - Cluster - Completed ✓
2025-04-10 21:53:26,205 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 30/30 [01:21<00:00,  2.71s/it]
2025-04-10 21:54:47,810 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    151  -1_['Apoio a legislações que reforcem a segura...   
1      0     35  0_['Reforma tributária para combustíveis, prom...   
2      1     28  1_['Reforço à independência e equilíbrio entre...   
3      2     27  2_['Valorização e apoio financeiro aos agentes...   
4      3     22  3_['Aprovação de projetos de lei que reconhece...   

                                      Representation  \
0  [['Apoio a legislações que reforcem a seguranç...   
1  [['Reforma tributária para combustíveis, promo...   
2  [['Reforço à independência e equilíbrio entre ...   
3  [['Valorização e apoio financeiro aos agentes ...   
4  [['Aprovação de projetos de lei que reconhecem...   

                                 Representative_Docs  
0  [Por causa disso, o orador apoia a aprovação d...  
1  [Por causa disso, o orador apoia a implementaç...  
2  [Por causa disso, o orador defende que os Sena...  
3  [Por causa disso, a

Gerando embeddings: 100%|██████████| 528/528 [03:00<00:00,  2.92it/s]
2025-04-10 21:57:48,919 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2022


2025-04-10 21:57:50,882 - BERTopic - Dimensionality - Completed ✓
2025-04-10 21:57:50,883 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 21:57:50,911 - BERTopic - Cluster - Completed ✓
2025-04-10 21:57:50,916 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 31/31 [01:28<00:00,  2.86s/it]
2025-04-10 21:59:19,712 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    103  -1_['Propostas legislativas para garantir dire...   
1      0     40  0_['Promoção da educação cívica e fortalecimen...   
2      1     28  1_['Adoção de políticas legislativas para prot...   
3      2     27  2_['Aprovação de Propostas de Emenda à Constit...   
4      3     24  3_['Aprovação de medidas legislativas para aum...   

                                      Representation  \
0  [['Propostas legislativas para garantir direit...   
1  [['Promoção da educação cívica e fortaleciment...   
2  [['Adoção de políticas legislativas para prote...   
3  [['Aprovação de Propostas de Emenda à Constitu...   
4  [['Aprovação de medidas legislativas para aume...   

                                 Representative_Docs  
0  [Por causa disso, o orador considera que a apr...  
1  [Por causa disso, o orador reforça a importânc...  
2  [Por causa disso, o orador apoia iniciativas c...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 562/562 [03:17<00:00,  2.85it/s]
2025-04-10 22:02:37,115 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2023


2025-04-10 22:02:39,261 - BERTopic - Dimensionality - Completed ✓
2025-04-10 22:02:39,262 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 22:02:39,289 - BERTopic - Cluster - Completed ✓
2025-04-10 22:02:39,296 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 32/32 [01:37<00:00,  3.06s/it]
2025-04-10 22:04:17,296 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     97  -1_['Reafirmação das prerrogativas legislativa...   
1      0     48  0_['Implementação efetiva dos direitos constit...   
2      1     40  1_['Estabelecimento do marco temporal para a d...   
3      2     36  2_['Limitação das decisões monocráticas no STF...   
4      3     27  3_['Investigar e responsabilizar legalmente os...   

                                      Representation  \
0  [['Reafirmação das prerrogativas legislativas ...   
1  [['Implementação efetiva dos direitos constitu...   
2  [['Estabelecimento do marco temporal para a de...   
3  [['Limitação das decisões monocráticas no STF ...   
4  [['Investigar e responsabilizar legalmente os ...   

                                 Representative_Docs  
0  [Por causa disso, o orador defende que o Congr...  
1  [Por causa disso, o orador destaca a importânc...  
2  [Por causa disso, o orador defende a aprovação...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 562/562 [03:08<00:00,  2.99it/s]
2025-04-10 22:07:25,756 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2023


2025-04-10 22:07:28,138 - BERTopic - Dimensionality - Completed ✓
2025-04-10 22:07:28,144 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 22:07:28,177 - BERTopic - Cluster - Completed ✓
2025-04-10 22:07:28,181 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 22/22 [01:02<00:00,  2.86s/it]
2025-04-10 22:08:31,278 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1     55  -1_['Apoio a projetos de lei para justiça soci...   
1      0    105  0_['Proteção da democracia e restauração da or...   
2      1     55  1_['Limitação de poderes e mandatos dos Minist...   
3      2     52  2_['Reação do Senado Federal contra decisões d...   
4      3     50  3_['Estabelecimento do marco temporal para dem...   

                                      Representation  \
0  [['Apoio a projetos de lei para justiça social...   
1  [['Proteção da democracia e restauração da ord...   
2  [['Limitação de poderes e mandatos dos Ministr...   
3  [['Reação do Senado Federal contra decisões do...   
4  [['Estabelecimento do marco temporal para dema...   

                                 Representative_Docs  
0  [Por causa disso, o orador apoia a aprovação d...  
1  [Por causa disso, o orador expressa sua indign...  
2  [Por causa disso, o orador critica a atuação d...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 489/489 [02:40<00:00,  3.05it/s]
2025-04-10 22:11:11,876 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para NormConclusao_2024


2025-04-10 22:11:13,705 - BERTopic - Dimensionality - Completed ✓
2025-04-10 22:11:13,706 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 22:11:13,731 - BERTopic - Cluster - Completed ✓
2025-04-10 22:11:13,737 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 30/30 [01:27<00:00,  2.90s/it]
2025-04-10 22:12:41,003 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    118  -1_['Ação senatorial para impeachment de minis...   
1      0     46  0_['Criminalização constitucional da posse e d...   
2      1     26  1_['Análise de pedidos de impeachment de minis...   
3      2     20  2_['Revisão e respeito às emendas parlamentare...   
4      3     18  3_['Garantia da liberdade de expressão e prote...   

                                      Representation  \
0  [['Ação senatorial para impeachment de ministr...   
1  [['Criminalização constitucional da posse e do...   
2  [['Análise de pedidos de impeachment de minist...   
3  [['Revisão e respeito às emendas parlamentares...   
4  [['Garantia da liberdade de expressão e proteç...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a atuação d...  
1  [Por causa disso, o orador destaca a importânc...  
2  [Por causa disso, o orador defende a necessida...  
3  [Por causa disso, o

Gerando embeddings: 100%|██████████| 491/491 [02:52<00:00,  2.85it/s]
2025-04-10 22:15:33,508 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm


[✔] Embeddings salvos em FAISS para AvalConclusao_2024


2025-04-10 22:15:35,321 - BERTopic - Dimensionality - Completed ✓
2025-04-10 22:15:35,322 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 22:15:35,346 - BERTopic - Cluster - Completed ✓
2025-04-10 22:15:35,351 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 25/25 [01:09<00:00,  2.79s/it]
2025-04-10 22:16:45,155 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1    101  -1_['Limitar o ativismo judicial e proteger a ...   
1      0     47  0_['Fortalecimento das instituições democrátic...   
2      1     39  1_['Apoio à PEC 45 para fortalecer a legislaçã...   
3      2     31  2_['Limitação das decisões monocráticas do STF...   
4      3     29  3_['Reforma tributária com foco em justiça fis...   

                                      Representation  \
0  [['Limitar o ativismo judicial e proteger a se...   
1  [['Fortalecimento das instituições democrática...   
2  [['Apoio à PEC 45 para fortalecer a legislação...   
3  [['Limitação das decisões monocráticas do STF ...   
4  [['Reforma tributária com foco em justiça fisc...   

                                 Representative_Docs  
0  [Por causa disso, o orador expressa preocupaçã...  
1  [Por causa disso, o orador defende a restauraç...  
2  [Por causa disso, o orador apoia a proposta de...  
3  [Por causa disso, o

Agora, para o corpus todo

In [19]:
# Listagem das colunas
colunas_para_modelar = [
    'NormConclusao',
    'AvalConclusao'
]

# Criação das pastas
os.makedirs("../data/modelos_bertopic", exist_ok=True)
os.makedirs("../data/topicos_gerados/v_12", exist_ok=True)

dfs_topicos = {}

for coluna in colunas_para_modelar:
    print(f"\n🔍 Modelando tópicos para: {coluna}")

    df_filtrado = df_normalized[df_normalized[coluna].notna() & df_normalized[coluna].str.strip().astype(bool)]
    textos = df_filtrado[coluna].tolist()
    codigos = df_filtrado["CodigoPronunciamento"].tolist()

    # Tenta carregar os embeddings do FAISS
    embeddings_normalizados, codigos_salvos = carregar_embeddings_faiss(coluna)

    # Se não houver, gera e salva
    if embeddings_normalizados is None:
        embeddings_normalizados = gerar_embeddings_openai(textos, client)
        salvar_embeddings_faiss(embeddings_normalizados, codigos, nome_base=coluna)
    else:
        # Verifica se os códigos são compatíveis
        if codigos != codigos_salvos:
            print(f"[⚠️] Atenção: os códigos atuais diferem dos salvos! Recalculando.")
            embeddings_normalizados = gerar_embeddings_openai(textos, client)
            salvar_embeddings_faiss(embeddings_normalizados, codigos, nome_base=coluna)

    if coluna in ['NormConclusao', 'AvalConclusao']:
        representation_model = OpenAI(
            client=client,
            model="gpt-4o-2024-08-06",
            prompt=summarization_prompt_conclusao,
            delay_in_seconds=2,
            chat=True,
            nr_docs=8,
            doc_length=200,
            tokenizer=tokenizer
        )

    # Criação do modelo
    modelo_topicos = BERTopic(
        embedding_model=None,
        umap_model=umap_model,
        hdbscan_model=hdbscan_model,
        vectorizer_model=vectorizer_model,
        representation_model=representation_model,
        language="multilingual",
        verbose=True
    )

    topics, probs = modelo_topicos.fit_transform(textos, embeddings=embeddings_normalizados)

    df_topicos = modelo_topicos.get_document_info(textos)
    df_topicos["CodigoPronunciamento"] = codigos

    dfs_topicos[f"{coluna}_topicos"] = df_topicos
    df_topicos.to_csv(f"../data/topicos_gerados/v_12/{coluna}_topicos_corpus_todo.csv", index=False)

    print(modelo_topicos.get_topic_info().head())





🔍 Modelando tópicos para: NormConclusao
[🔁] Embeddings carregados de FAISS para NormConclusao


2025-04-10 22:25:26,912 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm
2025-04-10 22:26:11,653 - BERTopic - Dimensionality - Completed ✓
2025-04-10 22:26:11,658 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 22:26:12,463 - BERTopic - Cluster - Completed ✓
2025-04-10 22:26:12,474 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 463/463 [22:12<00:00,  2.88s/it]
2025-04-10 22:48:28,565 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1   2812  -1_['Respeito ao processo constitucional e equ...   
1      0    158  0_['Redistribuição equitativa dos royalties do...   
2      1    119  1_['Revisão do Pacto Federativo para assegurar...   
3      2    100  2_['Reconhecimento e celebração da Constituiçã...   
4      3     93  3_['Regulamentação e financiamento da saúde pú...   

                                      Representation  \
0  [['Respeito ao processo constitucional e equil...   
1  [['Redistribuição equitativa dos royalties do ...   
2  [['Revisão do Pacto Federativo para assegurar ...   
3  [['Reconhecimento e celebração da Constituição...   
4  [['Regulamentação e financiamento da saúde púb...   

                                 Representative_Docs  
0  [Por causa disso, o orador argumenta que o pro...  
1  [Por causa disso, o orador sugere que a distri...  
2  [Por causa disso, o orador defende a necessida...  
3  [Por causa disso, o

2025-04-10 22:48:33,714 - BERTopic - Dimensionality - Fitting the dimensionality reduction algorithm
2025-04-10 22:48:51,123 - BERTopic - Dimensionality - Completed ✓
2025-04-10 22:48:51,129 - BERTopic - Cluster - Start clustering the reduced embeddings
2025-04-10 22:48:52,227 - BERTopic - Cluster - Completed ✓
2025-04-10 22:48:52,240 - BERTopic - Representation - Fine-tuning topics using representation models.
100%|██████████| 436/436 [20:50<00:00,  2.87s/it]
2025-04-10 23:09:45,268 - BERTopic - Representation - Completed ✓


   Topic  Count                                               Name  \
0     -1   3191  -1_['Cumprimento efetivo da Constituição de 19...   
1      0    170  0_['Valorização e melhoria da segurança públic...   
2      1    130  1_['Revisão da política externa brasileira par...   
3      2    120  2_['Rejeição à PEC 55/241 por limitar investim...   
4      3    116  3_['Revisão do pacto federativo para garantir ...   

                                      Representation  \
0  [['Cumprimento efetivo da Constituição de 1988...   
1  [['Valorização e melhoria da segurança pública...   
2  [['Revisão da política externa brasileira para...   
3  [['Rejeição à PEC 55/241 por limitar investime...   
4  [['Revisão do pacto federativo para garantir m...   

                                 Representative_Docs  
0  [Por causa disso, o orador critica a falta de ...  
1  [Por causa disso, o orador acredita que a valo...  
2  [Por causa disso, o orador critica a postura d...  
3  [Por causa disso, o