# üß† Mem√≥ria C√≠vica - Teste de Viabilidade T√©cnica

Este notebook valida se os dados abertos da C√¢mara dos Deputados s√£o suficientes para construir o MVP do projeto.

**Objetivo:** Conseguir montar uma tabela com:
- Nome da proposi√ß√£o
- Data da vota√ß√£o
- Placar (SIM/N√ÉO)
- Lista de deputados com seus votos

Se conseguirmos isso, o projeto √© **100% vi√°vel**.

## 1. Setup e Imports

In [18]:
# Instalar depend√™ncias (execute apenas uma vez)
# !pip install pandas requests tqdm

In [19]:
import os

import pandas as pd
import requests

# Configura√ß√µes de exibi√ß√£o
pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', 100)
pd.set_option('display.width', None)

# Diret√≥rio para cache dos dados
DATA_DIR = './dados_camara'
os.makedirs(DATA_DIR, exist_ok=True)

print("‚úÖ Setup completo!")

‚úÖ Setup completo!


## 2. Download dos Dados

Vamos baixar os arquivos CSV de 2024 (ano completo) para ter dados suficientes para an√°lise.

**Arquivos necess√°rios:**
- `votacoes-2024.csv` - Metadados das vota√ß√µes
- `votacoesVotos-2024.csv` - Votos individuais de cada deputado
- `votacoesProposicoes-2024.csv` - Link entre vota√ß√µes e proposi√ß√µes
- `proposicoes-2024.csv` - Detalhes das proposi√ß√µes (PLs, etc.)
- `deputados.csv` - Dados dos parlamentares

In [20]:
# URLs base dos arquivos
BASE_URL = "https://dadosabertos.camara.leg.br/arquivos"

ARQUIVOS = {
    'votacoes': f"{BASE_URL}/votacoes/csv/votacoes-2024.csv",
    'votos': f"{BASE_URL}/votacoesVotos/csv/votacoesVotos-2024.csv",
    'votacoes_proposicoes': f"{BASE_URL}/votacoesProposicoes/csv/votacoesProposicoes-2024.csv",
    'proposicoes': f"{BASE_URL}/proposicoes/csv/proposicoes-2024.csv",
    'deputados': f"{BASE_URL}/deputados/csv/deputados.csv",
    'orientacoes': f"{BASE_URL}/votacoesOrientacoes/csv/votacoesOrientacoes-2024.csv",
}

def baixar_arquivo(nome, url):
    """Baixa arquivo se n√£o existir no cache local."""
    filepath = os.path.join(DATA_DIR, f"{nome}.csv")

    if os.path.exists(filepath):
        print(f"üìÅ {nome}: usando cache local")
        return filepath

    print(f"‚¨áÔ∏è  {nome}: baixando...")
    try:
        response = requests.get(url, timeout=60)
        response.raise_for_status()

        with open(filepath, 'wb') as f:
            f.write(response.content)

        size_mb = len(response.content) / (1024 * 1024)
        print(f"   ‚úÖ {size_mb:.2f} MB baixados")
        return filepath
    except Exception as e:
        print(f"   ‚ùå Erro: {e}")
        return None

# Baixar todos os arquivos
print("=" * 50)
print("BAIXANDO DADOS DA C√ÇMARA DOS DEPUTADOS (2024)")
print("=" * 50)

arquivos_locais = {}
for nome, url in ARQUIVOS.items():
    arquivos_locais[nome] = baixar_arquivo(nome, url)

print("\n‚úÖ Download conclu√≠do!")

BAIXANDO DADOS DA C√ÇMARA DOS DEPUTADOS (2024)
üìÅ votacoes: usando cache local
üìÅ votos: usando cache local
üìÅ votacoes_proposicoes: usando cache local
üìÅ proposicoes: usando cache local
üìÅ deputados: usando cache local
üìÅ orientacoes: usando cache local

‚úÖ Download conclu√≠do!


## 3. Carregar e Explorar os Dados

In [21]:
# Carregar DataFrames
print("Carregando dados...\n")

# Usar caminhos diretos para evitar problemas com downloads falhados
df_votacoes = pd.read_csv(os.path.join(DATA_DIR, 'votacoes.csv'), sep=';', encoding='utf-8')
df_votos = pd.read_csv(os.path.join(DATA_DIR, 'votos.csv'), sep=';', encoding='utf-8')
df_votacoes_proposicoes = pd.read_csv(os.path.join(DATA_DIR, 'votacoes_proposicoes.csv'), sep=';', encoding='utf-8')
df_proposicoes = pd.read_csv(os.path.join(DATA_DIR, 'proposicoes.csv'), sep=';', encoding='utf-8')
df_deputados = pd.read_csv(os.path.join(DATA_DIR, 'deputados.csv'), sep=';', encoding='utf-8')
df_orientacoes = pd.read_csv(os.path.join(DATA_DIR, 'orientacoes.csv'), sep=';', encoding='utf-8')

print("üìä RESUMO DOS DADOS CARREGADOS:")
print(f"   ‚Ä¢ Vota√ß√µes: {len(df_votacoes):,} registros")
print(f"   ‚Ä¢ Votos individuais: {len(df_votos):,} registros")
print(f"   ‚Ä¢ Vota√ß√µes-Proposi√ß√µes: {len(df_votacoes_proposicoes):,} registros")
print(f"   ‚Ä¢ Proposi√ß√µes: {len(df_proposicoes):,} registros")
print(f"   ‚Ä¢ Deputados: {len(df_deputados):,} registros")
print(f"   ‚Ä¢ Orienta√ß√µes de bancada: {len(df_orientacoes):,} registros")

Carregando dados...

üìä RESUMO DOS DADOS CARREGADOS:
   ‚Ä¢ Vota√ß√µes: 10,371 registros
   ‚Ä¢ Votos individuais: 116,400 registros
   ‚Ä¢ Vota√ß√µes-Proposi√ß√µes: 7,430 registros
   ‚Ä¢ Proposi√ß√µes: 61,508 registros
   ‚Ä¢ Deputados: 7,876 registros
   ‚Ä¢ Orienta√ß√µes de bancada: 4,361 registros


  df_proposicoes = pd.read_csv(os.path.join(DATA_DIR, 'proposicoes.csv'), sep=';', encoding='utf-8')


### 3.1 Estrutura: Vota√ß√µes

In [22]:
print("üó≥Ô∏è ESTRUTURA - VOTA√á√ïES")
print("Colunas dispon√≠veis:")
print(df_votacoes.columns.tolist())
print("\nExemplo de registro:")
df_votacoes.head(2)

üó≥Ô∏è ESTRUTURA - VOTA√á√ïES
Colunas dispon√≠veis:
['id', 'uri', 'data', 'dataHoraRegistro', 'idOrgao', 'uriOrgao', 'siglaOrgao', 'idEvento', 'uriEvento', 'aprovacao', 'votosSim', 'votosNao', 'votosOutros', 'descricao', 'ultimaAberturaVotacao_dataHoraRegistro', 'ultimaAberturaVotacao_descricao', 'ultimaApresentacaoProposicao_dataHoraRegistro', 'ultimaApresentacaoProposicao_descricao', 'ultimaApresentacaoProposicao_idProposicao', 'ultimaApresentacaoProposicao_uriProposicao']

Exemplo de registro:


Unnamed: 0,id,uri,data,dataHoraRegistro,idOrgao,uriOrgao,siglaOrgao,idEvento,uriEvento,aprovacao,votosSim,votosNao,votosOutros,descricao,ultimaAberturaVotacao_dataHoraRegistro,ultimaAberturaVotacao_descricao,ultimaApresentacaoProposicao_dataHoraRegistro,ultimaApresentacaoProposicao_descricao,ultimaApresentacaoProposicao_idProposicao,ultimaApresentacaoProposicao_uriProposicao
0,2355879-47,https://dadosabertos.camara.leg.br/api/v2/votacoes/2355879-47,2024-02-06,2024-02-06T18:35:59,100001,https://dadosabertos.camara.leg.br/api/v2/orgaos/100001,SECAP(SGM),0,,1.0,0,0,0,"Realizar o encaminhamento do PL-1825/2023 √† CCJC (tramita√ß√£o simult√¢nea), em raz√£o da aprova√ß√£o ...",,,,,0,
1,2355879-48,https://dadosabertos.camara.leg.br/api/v2/votacoes/2355879-48,2024-02-06,2024-02-06T18:36:00,100001,https://dadosabertos.camara.leg.br/api/v2/orgaos/100001,SECAP(SGM),0,,1.0,0,0,0,"Realizar o encaminhamento do PL-1825/2023 √† CE (tramita√ß√£o simult√¢nea), em raz√£o da aprova√ß√£o de...",,,,,0,


### 3.2 Estrutura: Votos Individuais

In [23]:
print("üßë ESTRUTURA - VOTOS INDIVIDUAIS")
print("Colunas dispon√≠veis:")
print(df_votos.columns.tolist())
print("\nExemplo de registro:")
df_votos.head(2)

üßë ESTRUTURA - VOTOS INDIVIDUAIS
Colunas dispon√≠veis:
['idVotacao', 'uriVotacao', 'dataHoraVoto', 'voto', 'deputado_id', 'deputado_uri', 'deputado_nome', 'deputado_siglaPartido', 'deputado_uriPartido', 'deputado_siglaUf', 'deputado_idLegislatura', 'deputado_urlFoto']

Exemplo de registro:


Unnamed: 0,idVotacao,uriVotacao,dataHoraVoto,voto,deputado_id,deputado_uri,deputado_nome,deputado_siglaPartido,deputado_uriPartido,deputado_siglaUf,deputado_idLegislatura,deputado_urlFoto
0,1197773-140,https://dadosabertos.camara.leg.br/api/v2/votacoes/1197773-140,2024-12-04T21:10:04,N√£o,204379,https://dadosabertos.camara.leg.br/api/v2/deputados/204379,Ac√°cio Favacho,MDB,https://dadosabertos.camara.leg.br/api/v2/partidos/36899,AP,57,https://www.camara.leg.br/internet/deputado/bandep/204379.jpg
1,1197773-140,https://dadosabertos.camara.leg.br/api/v2/votacoes/1197773-140,2024-12-04T21:08:25,N√£o,220714,https://dadosabertos.camara.leg.br/api/v2/deputados/220714,Adail Filho,REPUBLICANOS,https://dadosabertos.camara.leg.br/api/v2/partidos/37908,AM,57,https://www.camara.leg.br/internet/deputado/bandep/220714.jpg


### 3.3 Estrutura: Proposi√ß√µes

In [26]:
print("üìú ESTRUTURA - PROPOSI√á√ïES")
print("Colunas dispon√≠veis:")
print(df_proposicoes.columns.tolist())
print("\nExemplo de registro:")
# Ajuste: o arquivo votacoesProposicoes tem os dados de proposi√ß√µes com prefixo 'proposicao_'
colunas_prop = ['proposicao_id', 'proposicao_siglaTipo', 'proposicao_numero', 'proposicao_ano', 'proposicao_ementa']
colunas_existentes = [c for c in colunas_prop if c in df_proposicoes.columns]
if colunas_existentes:
    df_proposicoes[colunas_existentes].head(2)
else:
    # Fallback para nomes antigos
    df_proposicoes[['id', 'siglaTipo', 'numero', 'ano', 'ementa']].head(2)

üìú ESTRUTURA - PROPOSI√á√ïES
Colunas dispon√≠veis:
['id', 'uri', 'siglaTipo', 'numero', 'ano', 'codTipo', 'descricaoTipo', 'ementa', 'ementaDetalhada', 'keywords', 'dataApresentacao', 'uriOrgaoNumerador', 'uriPropAnterior', 'uriPropPrincipal', 'uriPropPosterior', 'urlInteiroTeor', 'urnFinal', 'ultimoStatus_dataHora', 'ultimoStatus_sequencia', 'ultimoStatus_uriRelator', 'ultimoStatus_idOrgao', 'ultimoStatus_siglaOrgao', 'ultimoStatus_uriOrgao', 'ultimoStatus_regime', 'ultimoStatus_descricaoTramitacao', 'ultimoStatus_idTipoTramitacao', 'ultimoStatus_descricaoSituacao', 'ultimoStatus_idSituacao', 'ultimoStatus_despacho', 'ultimoStatus_apreciacao', 'ultimoStatus_url']

Exemplo de registro:


### 3.4 Tipos de Voto Dispon√≠veis

In [27]:
print("üìä TIPOS DE VOTO REGISTRADOS:")
print(df_votos['voto'].value_counts())

üìä TIPOS DE VOTO REGISTRADOS:
voto
Sim          67580
N√£o          46630
Obstru√ß√£o     1640
Absten√ß√£o      294
Artigo 17      256
Name: count, dtype: int64


## 4. Teste de Viabilidade: Montar o "Watch Item"

Agora vamos fazer o JOIN dos dados para criar a estrutura que voc√™ precisa para o MVP.

In [32]:
# Identificar a coluna de ID da vota√ß√£o em cada DataFrame
print("üîç Identificando colunas de ID para JOIN:")
print(f"   df_votacoes: {[c for c in df_votacoes.columns if 'id' in c.lower()]}")
print(f"   df_votos: {[c for c in df_votos.columns if 'id' in c.lower()]}")
print(f"   df_votacoes_proposicoes: {[c for c in df_votacoes_proposicoes.columns if 'id' in c.lower()]}")
print(f"   df_proposicoes: {[c for c in df_proposicoes.columns if 'id' in c.lower()]}")

üîç Identificando colunas de ID para JOIN:
   df_votacoes: ['id', 'idOrgao', 'idEvento', 'ultimaApresentacaoProposicao_idProposicao']
   df_votos: ['idVotacao', 'deputado_id', 'deputado_siglaPartido', 'deputado_uriPartido', 'deputado_idLegislatura']
   df_votacoes_proposicoes: ['idVotacao', 'proposicao_id']
   df_proposicoes: ['id', 'ultimoStatus_idOrgao', 'ultimoStatus_idTipoTramitacao', 'ultimoStatus_idSituacao']


In [33]:
# Fun√ß√£o para extrair ID da URI (se necess√°rio)
def extrair_id_uri(uri):
    """Extrai o ID num√©rico de uma URI da API."""
    if pd.isna(uri):
        return None
    return str(uri).split('/')[-1]

# Verificar formato das colunas de ID
print("Amostra de IDs:")
if 'idVotacao' in df_votacoes.columns:
    print(f"   votacoes.idVotacao: {df_votacoes['idVotacao'].iloc[0]}")
if 'idVotacao' in df_votos.columns:
    print(f"   votos.idVotacao: {df_votos['idVotacao'].iloc[0]}")
if 'uriVotacao' in df_votacoes_proposicoes.columns:
    print(f"   votacoes_proposicoes.uriVotacao: {df_votacoes_proposicoes['uriVotacao'].iloc[0]}")

Amostra de IDs:
   votos.idVotacao: 1197773-140
   votacoes_proposicoes.uriVotacao: https://dadosabertos.camara.leg.br/api/v2/votacoes/1006391-32


In [34]:
# Filtrar apenas vota√ß√µes NOMINAIS do PLEN√ÅRIO (escopo do MVP)
print("üéØ Filtrando vota√ß√µes nominais do Plen√°rio...")

# Verificar colunas dispon√≠veis para filtro
print(f"\nColunas de votacoes: {df_votacoes.columns.tolist()}")

# Filtrar vota√ß√µes nominais (onde h√° votos individuais registrados)
votacoes_com_votos = df_votos['idVotacao'].unique()
print(f"\nVota√ß√µes com votos registrados: {len(votacoes_com_votos)}")

# Usar coluna 'id' do arquivo votacoes.csv
col_id_votacao = 'id' if 'id' in df_votacoes.columns else 'idVotacao'
df_votacoes_nominais = df_votacoes[df_votacoes[col_id_votacao].isin(votacoes_com_votos)].copy()
# Renomear para padronizar
if col_id_votacao == 'id':
    df_votacoes_nominais = df_votacoes_nominais.rename(columns={'id': 'idVotacao'})
print(f"Vota√ß√µes nominais encontradas: {len(df_votacoes_nominais)}")

üéØ Filtrando vota√ß√µes nominais do Plen√°rio...

Colunas de votacoes: ['id', 'uri', 'data', 'dataHoraRegistro', 'idOrgao', 'uriOrgao', 'siglaOrgao', 'idEvento', 'uriEvento', 'aprovacao', 'votosSim', 'votosNao', 'votosOutros', 'descricao', 'ultimaAberturaVotacao_dataHoraRegistro', 'ultimaAberturaVotacao_descricao', 'ultimaApresentacaoProposicao_dataHoraRegistro', 'ultimaApresentacaoProposicao_descricao', 'ultimaApresentacaoProposicao_idProposicao', 'ultimaApresentacaoProposicao_uriProposicao']

Vota√ß√µes com votos registrados: 448
Vota√ß√µes nominais encontradas: 448


In [35]:
# Calcular placar de cada vota√ß√£o
print("üìä Calculando placar das vota√ß√µes...")

placar = df_votos.groupby('idVotacao')['voto'].value_counts().unstack(fill_value=0)
placar = placar.reset_index()

print(f"\nColunas do placar: {placar.columns.tolist()}")
placar.head()

üìä Calculando placar das vota√ß√µes...

Colunas do placar: ['idVotacao', 'Absten√ß√£o', 'Artigo 17', 'N√£o', 'Obstru√ß√£o', 'Sim']


voto,idVotacao,Absten√ß√£o,Artigo 17,N√£o,Obstru√ß√£o,Sim
0,1197773-140,1,1,404,0,23
1,1212491-84,0,0,20,0,31
2,1301141-69,0,0,38,0,3
3,1548579-186,0,1,332,0,36
4,1548579-194,2,1,38,0,336


In [36]:
# Juntar vota√ß√µes com placar
df_votacoes_placar = df_votacoes_nominais.merge(
    placar,
    on='idVotacao',
    how='left'
)

print(f"‚úÖ Vota√ß√µes com placar: {len(df_votacoes_placar)}")
df_votacoes_placar.head(2)

‚úÖ Vota√ß√µes com placar: 448


Unnamed: 0,idVotacao,uri,data,dataHoraRegistro,idOrgao,uriOrgao,siglaOrgao,idEvento,uriEvento,aprovacao,votosSim,votosNao,votosOutros,descricao,ultimaAberturaVotacao_dataHoraRegistro,ultimaAberturaVotacao_descricao,ultimaApresentacaoProposicao_dataHoraRegistro,ultimaApresentacaoProposicao_descricao,ultimaApresentacaoProposicao_idProposicao,ultimaApresentacaoProposicao_uriProposicao,Absten√ß√£o,Artigo 17,N√£o,Obstru√ß√£o,Sim
0,2367548-7,https://dadosabertos.camara.leg.br/api/v2/votacoes/2367548-7,2024-02-20,2024-02-20T21:12:58,180,https://dadosabertos.camara.leg.br/api/v2/orgaos/180,PLEN,71846,https://dadosabertos.camara.leg.br/api/v2/eventos/71846,1.0,442,2,1,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 442; n√£o: 2; total: 444.,,,,,0,,0,1,2,0,442
1,2388837-35,https://dadosabertos.camara.leg.br/api/v2/votacoes/2388837-35,2024-02-21,2024-02-21T19:43:55,180,https://dadosabertos.camara.leg.br/api/v2/orgaos/180,PLEN,71852,https://dadosabertos.camara.leg.br/api/v2/eventos/71852,1.0,425,0,1,"Aprovado, em aprecia√ß√£o preliminar, o Parecer da Comiss√£o Mista de Planos, Or√ßamentos P√∫blicos e...",2024-02-21T19:33:55,Vota√ß√£o preliminar em turno √∫nico.,,,0,,0,1,0,0,425


In [37]:
# Preparar link vota√ß√£o -> proposi√ß√£o
print("üîó Verificando link vota√ß√£o ‚Üí proposi√ß√£o...")

# O arquivo votacoes_proposicoes j√° tem idVotacao e as colunas de proposi√ß√£o com prefixo
print(f"Colunas dispon√≠veis: {df_votacoes_proposicoes.columns.tolist()}")
print(f"\nLinks vota√ß√£o-proposi√ß√£o: {len(df_votacoes_proposicoes)}")
df_votacoes_proposicoes[['idVotacao', 'proposicao_id', 'proposicao_siglaTipo']].head()

üîó Verificando link vota√ß√£o ‚Üí proposi√ß√£o...
Colunas dispon√≠veis: ['idVotacao', 'uriVotacao', 'data', 'descricao', 'proposicao_id', 'proposicao_uri', 'proposicao_titulo', 'proposicao_ementa', 'proposicao_codTipo', 'proposicao_siglaTipo', 'proposicao_numero', 'proposicao_ano']

Links vota√ß√£o-proposi√ß√£o: 7430


Unnamed: 0,idVotacao,proposicao_id,proposicao_siglaTipo
0,1006391-32,1006391,PL
1,1029052-77,1029052,PL
2,1030398-71,1030398,PL
3,1030398-74,1030398,PL
4,1050899-75,1050899,PL


In [38]:
# Converter IDs para mesmo tipo
df_votacoes_placar['idVotacao'] = df_votacoes_placar['idVotacao'].astype(str)
df_votacoes_proposicoes['idVotacao'] = df_votacoes_proposicoes['idVotacao'].astype(str)

# Juntar vota√ß√µes com proposi√ß√µes (usar idVotacao que j√° existe)
df_completo = df_votacoes_placar.merge(
    df_votacoes_proposicoes[['idVotacao', 'proposicao_id', 'proposicao_siglaTipo', 'proposicao_numero', 'proposicao_ano', 'proposicao_ementa']],
    on='idVotacao',
    how='left'
)

print(f"Ap√≥s merge com proposi√ß√µes: {len(df_completo)}")

Ap√≥s merge com proposi√ß√µes: 485


In [39]:
# Renomear colunas para simplificar
df_completo = df_completo.rename(columns={
    'proposicao_id': 'id_proposicao',
    'proposicao_siglaTipo': 'siglaTipo',
    'proposicao_numero': 'numero',
    'proposicao_ano': 'ano',
    'proposicao_ementa': 'ementa'
})

print(f"\n‚úÖ Dataset completo: {len(df_completo)} registros")
print(f"\nColunas finais: {df_completo.columns.tolist()}")


‚úÖ Dataset completo: 485 registros

Colunas finais: ['idVotacao', 'uri', 'data', 'dataHoraRegistro', 'idOrgao', 'uriOrgao', 'siglaOrgao', 'idEvento', 'uriEvento', 'aprovacao', 'votosSim', 'votosNao', 'votosOutros', 'descricao', 'ultimaAberturaVotacao_dataHoraRegistro', 'ultimaAberturaVotacao_descricao', 'ultimaApresentacaoProposicao_dataHoraRegistro', 'ultimaApresentacaoProposicao_descricao', 'ultimaApresentacaoProposicao_idProposicao', 'ultimaApresentacaoProposicao_uriProposicao', 'Absten√ß√£o', 'Artigo 17', 'N√£o', 'Obstru√ß√£o', 'Sim', 'id_proposicao', 'siglaTipo', 'numero', 'ano', 'ementa']


## 5. Resultado: Watch Item Completo

Agora vamos visualizar alguns exemplos do "Watch Item" que seria exibido no feed do produto.

In [40]:
# Selecionar colunas relevantes para o Watch Item
colunas_watch_item = [
    'idVotacao',
    'dataHoraRegistro',
    'descricao',
    'siglaTipo',
    'numero',
    'ano',
    'ementa',
]

# Adicionar colunas de placar se existirem
for col in ['Sim', 'N√£o', 'Absten√ß√£o', 'Obstru√ß√£o']:
    if col in df_completo.columns:
        colunas_watch_item.append(col)

# Filtrar apenas registros com proposi√ß√£o identificada
df_watch = df_completo[df_completo['ementa'].notna()][colunas_watch_item].drop_duplicates()

print(f"üìã WATCH ITEMS PRONTOS: {len(df_watch)}")
print("\n" + "="*80)
df_watch.head(10)

üìã WATCH ITEMS PRONTOS: 484



Unnamed: 0,idVotacao,dataHoraRegistro,descricao,siglaTipo,numero,ano,ementa,Sim,N√£o,Absten√ß√£o,Obstru√ß√£o
0,2367548-7,2024-02-20T21:12:58,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 442; n√£o: 2; total: 444.,PL,10106.0,2018.0,"Altera a Lei n¬∫ 8.080, de 19 de setembro de 1990, para dispor sobre a obrigatoriedade de publica...",442,2,0,0
1,2367548-7,2024-02-20T21:12:58,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 442; n√£o: 2; total: 444.,REQ,1884.0,2023.0,"Requer urg√™ncia para o PL 10106/2018, do Senado Federal, que ‚Äúaltera a Lei n¬∫ 8.080, de 19 de se...",442,2,0,0
2,2388837-35,2024-02-21T19:43:55,"Aprovado, em aprecia√ß√£o preliminar, o Parecer da Comiss√£o Mista de Planos, Or√ßamentos P√∫blicos e...",MPV,1188.0,2023.0,"Abre cr√©dito extraordin√°rio, em favor dos Minist√©rios da Defesa, da Integra√ß√£o e do Desenvolvime...",425,0,0,0
3,2382257-49,2024-02-21T20:50:49,"Aprovada a Subemenda Substitutiva Global ao Projeto de Lei Complementar n¬∫ 175, de 2023, adotada...",PLP,175.0,2023.0,"Altera o artigo 5¬∫ da Lei Complementar n¬∫ 172, de 15 de abril de 2020, para conceder prazo para ...",426,4,0,0
4,2411815-7,2024-02-21T21:02:11,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 413; n√£o: 13; absten√ß√£o: 1; total: ...,PL,1269.0,2022.0,"Acrescenta o Art. 16-A na Lei Federal n¬∫ 8.429 de 02 de junho de 1992, que disp√µe sobre as san√ß√µ...",413,13,1,0
5,2403068-11,2024-02-27T19:00:29,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 285; n√£o: 103; absten√ß√£o: 1; total:...,PL,4932.0,2023.0,Estabelece requisitos para a autoriza√ß√£o do funcionamento de prestadores de servi√ßos de ativos v...,285,103,1,0
6,2403068-11,2024-02-27T19:00:29,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 285; n√£o: 103; absten√ß√£o: 1; total:...,REQ,3912.0,2023.0,"Requer urg√™ncia do art. 155 para aprecia√ß√£o imediata do PL 4.932, de 2023.",285,103,1,0
7,2379378-9,2024-02-27T20:44:54,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 258; n√£o: 164; absten√ß√£o: 3; total:...,PL,2459.0,2023.0,Estabelece a obrigatoriedade de afixa√ß√£o de cartazes e veicula√ß√£o de mensagem sonoro nos portos ...,258,164,3,0
8,2415411-9,2024-02-27T21:09:19,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 339; n√£o: 82; absten√ß√£o: 1; total: ...,PL,4831.0,2023.0,"Altera a Lei no 9.074, de 7 de julho de 1995 e a Lei no 10.848, de 15 de mar√ßo de 2004, e d√° out...",339,82,1,0
9,2415411-9,2024-02-27T21:09:19,Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 339; n√£o: 82; absten√ß√£o: 1; total: ...,REQ,4403.0,2023.0,"Requer regime de urg√™ncia para aprecia√ß√£o do PL n¬∫ 4831 de 2023, que ‚ÄúAltera a Lei n¬∫ 9.074, de ...",339,82,1,0


In [41]:
# Exibir um Watch Item formatado
def formatar_watch_item(row):
    """Formata um registro como Watch Item para visualiza√ß√£o."""
    print("=" * 80)
    print(f"üìú {row.get('siglaTipo', 'N/A')} {row.get('numero', 'N/A')}/{row.get('ano', 'N/A')}")
    print(f"üìÖ Data: {row.get('dataHoraRegistro', 'N/A')}")
    print(f"\nüìù Ementa: {row.get('ementa', 'N/A')[:200]}...")
    print(f"\nüó≥Ô∏è Descri√ß√£o da vota√ß√£o: {row.get('descricao', 'N/A')[:150]}...")

    sim = row.get('Sim', 0)
    nao = row.get('N√£o', 0)
    print(f"\nüìä PLACAR: ‚úÖ SIM: {sim}  |  ‚ùå N√ÉO: {nao}")
    print("=" * 80)

# Mostrar 3 exemplos
print("\nüîç EXEMPLOS DE WATCH ITEMS:\n")
for idx, row in df_watch.head(3).iterrows():
    formatar_watch_item(row)
    print()


üîç EXEMPLOS DE WATCH ITEMS:

üìú PL 10106.0/2018.0
üìÖ Data: 2024-02-20T21:12:58

üìù Ementa: Altera a Lei n¬∫ 8.080, de 19 de setembro de 1990, para dispor sobre a obrigatoriedade de publica√ß√£o na internet de listas de pacientes que ser√£o submetidos a procedimentos cir√∫rgicos eletivos no √¢mbit...

üó≥Ô∏è Descri√ß√£o da vota√ß√£o: Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 442; n√£o: 2; total: 444....

üìä PLACAR: ‚úÖ SIM: 442  |  ‚ùå N√ÉO: 2

üìú REQ 1884.0/2023.0
üìÖ Data: 2024-02-20T21:12:58

üìù Ementa: Requer urg√™ncia para o PL 10106/2018, do Senado Federal, que ‚Äúaltera a Lei n¬∫ 8.080, de 19 de setembro de 1990, para dispor sobre a obrigatoriedade de publica√ß√£o na internet de listas de pacientes que...

üó≥Ô∏è Descri√ß√£o da vota√ß√£o: Aprovado o Requerimento de Urg√™ncia (Art. 155 do RICD). Sim: 442; n√£o: 2; total: 444....

üìä PLACAR: ‚úÖ SIM: 442  |  ‚ùå N√ÉO: 2

üìú MPV 1188.0/2023.0
üìÖ Data: 2024-02-21T19:43:55

üìù Ementa: Abre

## 6. Teste: Votos Individuais de uma Vota√ß√£o

Agora vamos pegar uma vota√ß√£o espec√≠fica e listar como cada deputado votou.

In [42]:
# Pegar uma vota√ß√£o de exemplo
id_votacao_exemplo = df_watch['idVotacao'].iloc[0]
print(f"üîç Analisando vota√ß√£o: {id_votacao_exemplo}")

# Filtrar votos dessa vota√ß√£o
df_votos['idVotacao'] = df_votos['idVotacao'].astype(str)
votos_exemplo = df_votos[df_votos['idVotacao'] == str(id_votacao_exemplo)].copy()

print(f"\nTotal de votos registrados: {len(votos_exemplo)}")
print(f"\nColunas dispon√≠veis nos votos: {votos_exemplo.columns.tolist()}")

üîç Analisando vota√ß√£o: 2367548-7

Total de votos registrados: 445

Colunas dispon√≠veis nos votos: ['idVotacao', 'uriVotacao', 'dataHoraVoto', 'voto', 'deputado_id', 'deputado_uri', 'deputado_nome', 'deputado_siglaPartido', 'deputado_uriPartido', 'deputado_siglaUf', 'deputado_idLegislatura', 'deputado_urlFoto']


In [43]:
# Exibir votos por partido
print("üìä VOTOS POR PARTIDO:")
# Usar nome correto da coluna (deputado_siglaPartido no arquivo votacoesVotos)
col_partido = 'deputado_siglaPartido' if 'deputado_siglaPartido' in votos_exemplo.columns else 'siglaPartido'
print(votos_exemplo.groupby([col_partido, 'voto']).size().unstack(fill_value=0))

üìä VOTOS POR PARTIDO:
voto                   Artigo 17  N√£o  Sim
deputado_siglaPartido                     
AVANTE                         0    0    6
CIDADANIA                      0    0    4
MDB                            0    0   33
NOVO                           0    0    3
PCdoB                          0    0    7
PDT                            0    0   18
PL                             0    0   88
PODE                           0    0   13
PP                             1    1   42
PRD                            0    0    4
PSB                            0    0   13
PSD                            0    0   38
PSDB                           0    0   12
PSOL                           0    0   12
PT                             0    0   60
PV                             0    0    5
REDE                           0    0    1
REPUBLICANOS                   0    0   35
SOLIDARIEDADE                  0    1    4
UNI√ÉO                          0    0   44


In [44]:
# Exibir votos individuais (amostra)
print("\nüë§ VOTOS INDIVIDUAIS (primeiros 20):")
# Nomes das colunas no arquivo votacoesVotos t√™m prefixo 'deputado_'
colunas_voto = ['deputado_nome', 'deputado_siglaPartido', 'deputado_siglaUf', 'voto']
colunas_disponiveis = [c for c in colunas_voto if c in votos_exemplo.columns]

votos_exemplo[colunas_disponiveis].head(20)


üë§ VOTOS INDIVIDUAIS (primeiros 20):


Unnamed: 0,deputado_nome,deputado_siglaPartido,deputado_siglaUf,voto
32712,Abilio Brunini,PL,MT,Sim
32713,Ac√°cio Favacho,MDB,AP,Sim
32714,Adail Filho,REPUBLICANOS,AM,Sim
32715,Adilson Barroso,PL,SP,Sim
32716,Adriana Ventura,NOVO,SP,Sim
32717,Adriano do Baldy,PP,GO,Sim
32718,Afonso Hamm,PP,RS,Sim
32719,Afonso Motta,PDT,RS,Sim
32720,AJ Albuquerque,PP,CE,Sim
32721,Alberto Fraga,PL,DF,Sim


## 7. Teste: Orienta√ß√£o de Bancada

Verificar se temos as orienta√ß√µes dos l√≠deres partid√°rios.

In [45]:
print("üèõÔ∏è ORIENTA√á√ïES DE BANCADA")
print(f"\nColunas dispon√≠veis: {df_orientacoes.columns.tolist()}")
print(f"\nTotal de orienta√ß√µes: {len(df_orientacoes)}")

df_orientacoes.head(10)

üèõÔ∏è ORIENTA√á√ïES DE BANCADA

Colunas dispon√≠veis: ['idVotacao', 'uriVotacao', 'siglaOrgao', 'descricao', 'siglaBancada', 'uriBancada', 'orientacao']

Total de orienta√ß√µes: 4361


Unnamed: 0,idVotacao,uriVotacao,siglaOrgao,descricao,siglaBancada,uriBancada,orientacao
0,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Minoria,,N√£o
1,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Maioria,,Sim
2,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Governo,,Sim
3,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",PSB,https://dadosabertos.camara.leg.br/api/v2/partidos/36832,Sim
4,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",PL,https://dadosabertos.camara.leg.br/api/v2/partidos/37906,Liberado
5,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Bl UniPpFdrPsdbCid...,,Sim
6,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Oposi√ß√£o,,N√£o
7,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Novo,https://dadosabertos.camara.leg.br/api/v2/partidos/37901,N√£o
8,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Bl MdbPsdRepPode,,Sim
9,2460010-43,https://dadosabertos.camara.leg.br/api/v2/votacoes/2460010-43,PLEN,"Aprovado o Projeto de Lei n¬∫ 3.802, de 2024. Sim: 340; N√£o: 117; Absten√ß√£o: 1; Total: 458.",Fdr PSOL-REDE,,Sim


In [46]:
# Orienta√ß√µes da vota√ß√£o de exemplo
df_orientacoes['idVotacao'] = df_orientacoes['idVotacao'].astype(str)
orientacoes_exemplo = df_orientacoes[df_orientacoes['idVotacao'] == str(id_votacao_exemplo)]

print(f"\nüìã ORIENTA√á√ïES PARA VOTA√á√ÉO {id_votacao_exemplo}:")
if len(orientacoes_exemplo) > 0:
    # Usar nome correto da coluna (siglaBancada no arquivo votacoesOrientacoes)
    col_bancada = 'siglaBancada' if 'siglaBancada' in orientacoes_exemplo.columns else 'siglaPartidoBloco'
    print(orientacoes_exemplo[[col_bancada, 'orientacao']].to_string(index=False))
else:
    print("Nenhuma orienta√ß√£o encontrada para esta vota√ß√£o.")


üìã ORIENTA√á√ïES PARA VOTA√á√ÉO 2367548-7:
         siglaBancada orientacao
     Bl MdbPsdRepPode        Sim
              Maioria        Sim
                 Novo        Sim
             Oposi√ß√£o        NaN
              Minoria        Sim
Bl UniPpFdrPsdbCid...        Sim
              Governo        Sim
      Fdr PT-PCdoB-PV        Sim
                   PL        Sim
                  PSB        NaN
        Fdr PSOL-REDE        Sim


## 8. ‚úÖ Conclus√£o: Checklist de Viabilidade

In [47]:
print("="*80)
print("üìã CHECKLIST DE VIABILIDADE T√âCNICA")
print("="*80)

checks = [
    ("Proposi√ß√µes (PL, ementa, status)", len(df_proposicoes) > 0),
    ("Vota√ß√µes (data, resultado, placar)", len(df_votacoes) > 0),
    ("Votos individuais (deputado, partido, UF, SIM/N√ÉO)", len(df_votos) > 0),
    ("Link vota√ß√£o ‚Üí proposi√ß√£o", len(df_votacoes_proposicoes) > 0),
    ("Orienta√ß√£o de bancada", len(df_orientacoes) > 0),
    ("Watch Item mont√°vel (JOIN funcionou)", len(df_watch) > 0),
]

todos_ok = True
for item, ok in checks:
    status = "‚úÖ" if ok else "‚ùå"
    print(f"  {status} {item}")
    if not ok:
        todos_ok = False

print("\n" + "="*80)
if todos_ok:
    print("üéâ VEREDICTO: PROJETO √â 100% VI√ÅVEL!")
    print("   Todos os dados necess√°rios est√£o dispon√≠veis na API da C√¢mara.")
else:
    print("‚ö†Ô∏è  Alguns dados n√£o foram encontrados. Investigar mais.")
print("="*80)

üìã CHECKLIST DE VIABILIDADE T√âCNICA
  ‚úÖ Proposi√ß√µes (PL, ementa, status)
  ‚úÖ Vota√ß√µes (data, resultado, placar)
  ‚úÖ Votos individuais (deputado, partido, UF, SIM/N√ÉO)
  ‚úÖ Link vota√ß√£o ‚Üí proposi√ß√£o
  ‚úÖ Orienta√ß√£o de bancada
  ‚úÖ Watch Item mont√°vel (JOIN funcionou)

üéâ VEREDICTO: PROJETO √â 100% VI√ÅVEL!
   Todos os dados necess√°rios est√£o dispon√≠veis na API da C√¢mara.


## 9. Pr√≥ximos Passos Sugeridos

Agora que sabemos que os dados existem, os pr√≥ximos passos seriam:

1. **Pipeline Bronze ‚Üí Silver ‚Üí Gold**
   - Bronze: Download di√°rio dos CSVs
   - Silver: Normaliza√ß√£o e JOIN das tabelas
   - Gold: Gera√ß√£o dos Watch Items com LLM

2. **Classifica√ß√£o de Stages**
   - Criar l√≥gica para identificar texto-base vs. reda√ß√£o final vs. DTQ
   - Usar campo `descricao` da vota√ß√£o

3. **Integra√ß√£o com LLM**
   - Gerar "headline" a partir da ementa
   - Gerar "why it matters" explicando impacto

4. **Frontend MVP**
   - Feed de Watch Items
   - P√°gina de detalhes da vota√ß√£o
   - Lista de votos por deputado

In [48]:
# Salvar dataset processado para uso futuro
output_path = os.path.join(DATA_DIR, 'watch_items_2024.csv')
df_watch.to_csv(output_path, index=False, encoding='utf-8')
print(f"üíæ Dataset salvo em: {output_path}")

üíæ Dataset salvo em: ./dados_camara/watch_items_2024.csv
