In [1]:
import pandas as pd
import os

# ==========================================
# 1. CONFIGURA√á√ÉO
# ==========================================
# Vamos usar o RAW (Excel) porque precisamos dos nomes completos das perguntas
# O CSV processado pode ter simplificado os nomes, e precisamos do texto da pergunta para o relat√≥rio.
RAW_DATA_PATH = '../data/raw/ebt_municipios_br.xlsx'

print("üîÑ Carregando dados brutos para auditoria detalhada...")
df = pd.read_excel(RAW_DATA_PATH)

# Limpeza b√°sica dos nomes das colunas (retirar espa√ßos nas pontas)
df.columns = [c.strip() for c in df.columns]

# ==========================================
# 2. ISOLAR O ALVO (PARACAMBI)
# ==========================================
# Mapeando a coluna de munic√≠pio novamente
col_municipio = next((c for c in df.columns if c.lower() in ['municipio', 'entidade avaliada', 'nome_municipio']), None)
col_uf = next((c for c in df.columns if c.lower() in ['uf', 'estado', 'sigla_uf']), None)

# Filtra Paracambi no RJ
alvo = df[
    (df[col_uf].str.strip() == 'Rio de Janeiro') & 
    (df[col_municipio].astype(str).str.contains('Paracambi'))
].copy()

if alvo.empty:
    raise ValueError("‚ùå Paracambi n√£o encontrada. Verifique os filtros.")

print(f"‚úÖ Dados de Paracambi carregados. Nota Geral: {alvo['Nota Avalia√ß√£o'].values[0]}")

# ==========================================
# 3. AUDITORIA DE PONTOS PERDIDOS (A M√ÅGICA)
# ==========================================
print("\nüïµÔ∏è‚Äç‚ôÇÔ∏è Iniciando varredura de vulnerabilidades...")

report_gaps = []

# Iterar sobre as colunas. 
# A l√≥gica da CGU geralmente √©: Coluna "Pergunta" seguida imediatamente por "Nota Quest√£o"
# Vamos procurar colunas que tenham "Nota" no nome e verificar se o valor √© 0.

for i, col_name in enumerate(df.columns):
    # Se a coluna atual √© uma nota...
    if 'Nota' in col_name and 'Avalia√ß√£o' not in col_name: # Ignora a Nota Final
        nota_obtida = alvo[col_name].values[0]
        
        # Se a nota for ZERO ou NULA, √© um problema grave
        if nota_obtida == 0 or pd.isna(nota_obtida):
            
            # Tenta pegar o nome da pergunta (geralmente √© a coluna imediatamente anterior)
            # Ex: Coluna 10 √© a Pergunta, Coluna 11 √© a Nota.
            pergunta_provavel = df.columns[i-1]
            
            # Adiciona ao relat√≥rio
            report_gaps.append({
                'Item Avaliado (Pergunta)': pergunta_provavel,
                'Nota Obtida': 0,
                'Status': 'üî¥ CR√çTICO (A√ß√£o Imediata)',
                'Coluna T√©cnica': col_name
            })

# Transformar em DataFrame para visualiza√ß√£o bonita
df_gaps = pd.DataFrame(report_gaps)

# ==========================================
# 4. EXIBI√á√ÉO DO PLANO DE A√á√ÉO
# ==========================================
pd.set_option('display.max_colwidth', None) # Mostra o texto todo da pergunta

print(f"\nüìã RELAT√ìRIO DE FALHAS IDENTIFICADAS: {len(df_gaps)} ITENS")
print("Este √© o seu 'Lead': A lista exata do que eles precisam consertar no site.")

if not df_gaps.empty:
    # Mostra tabela formatada
    display(df_gaps[['Item Avaliado (Pergunta)', 'Status']])
    
    # Salva em Excel para voc√™ mandar pro cliente se quiser
    df_gaps.to_excel('../data/processed/plano_acao_paracambi.xlsx', index=False)
    print("\nüíæ Relat√≥rio salvo em: data/processed/plano_acao_paracambi.xlsx")
else:
    print("üéâ Incr√≠vel! Nenhum item zerado encontrado (o que contradiz a nota 6.11, verifique os dados).")

# ==========================================
# FIM
# ==========================================

üîÑ Carregando dados brutos para auditoria detalhada...
‚úÖ Dados de Paracambi carregados. Nota Geral: 6.11

üïµÔ∏è‚Äç‚ôÇÔ∏è Iniciando varredura de vulnerabilidades...

üìã RELAT√ìRIO DE FALHAS IDENTIFICADAS: 30 ITENS
Este √© o seu 'Lead': A lista exata do que eles precisam consertar no site.


Unnamed: 0,Item Avaliado (Pergunta),Status
0,1.1 - Informe o link do s√≠tio oficial:,üî¥ CR√çTICO (A√ß√£o Imediata)
1,2.1 - Informe o link do portal de transpar√™ncia:,üî¥ CR√çTICO (A√ß√£o Imediata)
2,4.1 - Indique as informa√ß√µes sobre as unidades administrativas que o ente federado disponibiliza:,üî¥ CR√çTICO (A√ß√£o Imediata)
3,5.1 - Indique as informa√ß√µes localizadas sobre Receitas:,üî¥ CR√çTICO (A√ß√£o Imediata)
4,6.1 - Indique as informa√ß√µes localizadas sobre Empenhos:,üî¥ CR√çTICO (A√ß√£o Imediata)
5,6.2 - Indique as informa√ß√µes localizadas sobre Pagamentos:,üî¥ CR√çTICO (A√ß√£o Imediata)
6,9.1 - Indique as informa√ß√µes localizadas sobre Licita√ß√µes:,üî¥ CR√çTICO (A√ß√£o Imediata)
7,12.1 - Indique as informa√ß√µes localizadas sobre Contratos:,üî¥ CR√çTICO (A√ß√£o Imediata)
8,12.2 - O ente federado disponibiliza o conte√∫do integral dos contratos?,üî¥ CR√çTICO (A√ß√£o Imediata)
9,Indique as informa√ß√µes localizadas sobre Obras P√∫blicas:,üî¥ CR√çTICO (A√ß√£o Imediata)



üíæ Relat√≥rio salvo em: data/processed/plano_acao_paracambi.xlsx


In [7]:
import pandas as pd
import numpy as np
import os

# ==========================================
# 1. CARGA E CONVERS√ÉO ROBUSTA
# ==========================================
RAW_DATA_PATH = '../data/raw/ebt_municipios_br.xlsx'

print("üîÑ Carregando dados brutos...")
# L√™ o Excel e for√ßa tudo a ser string inicialmente para tratarmos as v√≠rgulas manualmente
df = pd.read_excel(RAW_DATA_PATH, dtype=str)

# Limpeza de nomes de colunas
df.columns = [c.strip() for c in df.columns]

# Identificadores
col_municipio = next((c for c in df.columns if c.lower() in ['municipio', 'entidade avaliada', 'nome_municipio']), None)
col_uf = next((c for c in df.columns if c.lower() in ['uf', 'estado', 'sigla_uf']), None)
col_nota_final = next((c for c in df.columns if 'final' in c.lower() or 'avalia√ß√£o' in c.lower()), None)

# ==========================================
# 2. SANITIZA√á√ÉO DE N√öMEROS (O Segredo)
# ==========================================
print("üßπ Convertendo notas de texto (0,50) para n√∫meros (0.50)...")

# Fun√ß√£o para corrigir n√∫meros brasileiros
def fix_brazilian_number(val):
    if pd.isna(val): return 0.0
    val = str(val).replace(',', '.') # Troca v√≠rgula por ponto
    try:
        return float(val)
    except:
        return 0.0

# Aplica a corre√ß√£o em TODAS as colunas que t√™m "Nota" no nome
cols_notas = [c for c in df.columns if 'Nota' in c]
for col in cols_notas:
    df[col] = df[col].apply(fix_brazilian_number)

# Tamb√©m corrige a Nota Final para garantir
if col_nota_final:
    df[col_nota_final] = df[col_nota_final].apply(fix_brazilian_number)

# ==========================================
# 3. FILTRAR ESTADO E ALVO
# ==========================================
df_rj = df[df[col_uf].str.strip() == 'Rio de Janeiro'].copy()
print(f"üìç Base RJ carregada: {df_rj.shape[0]} munic√≠pios.")

alvo = df_rj[df_rj[col_municipio].str.contains('Paracambi', na=False)].copy()

if alvo.empty:
    raise ValueError("‚ùå Paracambi n√£o encontrada.")

print(f"‚úÖ Alvo: {alvo[col_municipio].values[0]} | Nota Geral: {alvo[col_nota_final].values[0]}")

# ==========================================
# 4. GERA√á√ÉO DE LEADS (AUDITORIA INTELIGENTE)
# ==========================================
print("\nüïµÔ∏è‚Äç‚ôÇÔ∏è Cruzando dados para encontrar Gaps REAIS...")

comparativo_list = []

for i, col_nota in enumerate(df.columns):
    # S√≥ analisa colunas de Nota (excluindo a nota geral final)
    if 'Nota' in col_nota and col_nota != col_nota_final:
        
        # 1. Descobre a nota de Paracambi e a M√°xima do RJ
        nota_paracambi = alvo[col_nota].values[0]
        max_nota_rj = df_rj[col_nota].max()
        
        # 2. A L√ìGICA DE OURO:
        # S√≥ √© problema se:
        # a) Paracambi tirou 0 (ou muito baixo)
        # b) ALGU√âM no RJ tirou nota maior (max_nota_rj > 0). 
        #    (Se o max for 0, a quest√£o n√£o vale ponto, ent√£o ignoramos)
        
        if nota_paracambi == 0 and max_nota_rj > 0:
            
            # Pega a pergunta (coluna anterior)
            pergunta = df.columns[i-1]
            
            # Descobre quem √© a refer√™ncia (quem tirou a nota m√°xima)
            quem_gabaritou = df_rj[df_rj[col_nota] == max_nota_rj]
            # Tenta pegar algu√©m que n√£o seja a pr√≥pria capital ou estado, se poss√≠vel, pra ser mais "realista"
            exemplo = quem_gabaritou[~quem_gabaritou[col_municipio].str.contains('Governo|Capital', regex=True)]
            
            if exemplo.empty:
                nome_exemplo = quem_gabaritou.iloc[0][col_municipio]
            else:
                nome_exemplo = exemplo.iloc[0][col_municipio]
            
            comparativo_list.append({
                'Quest√£o Chave': pergunta,
                'Nota Paracambi': 0.0,
                'Nota M√°xima Poss√≠vel': max_nota_rj,
                'Refer√™ncia (Benchmarking)': nome_exemplo
            })

# ==========================================
# 5. RESULTADO FINAL
# ==========================================
df_gap = pd.DataFrame(comparativo_list)

if not df_gap.empty:
    # Ordena pelas notas maiores (Onde estamos perdendo mais ponto?)
    df_gap = df_gap.sort_values(by='Nota M√°xima Poss√≠vel', ascending=False)
    
    print(f"\nüìã ENCONTRADOS {len(df_gap)} PONTOS DE MELHORIA REAIS.")
    print("Estas s√£o as funcionalidades que FALTAM no site e que valem nota.")
    
    pd.set_option('display.max_colwidth', None)
    display(df_gap.head(15)) # Mostra os top 15 erros
    
    # Salvar
    df_gap.to_excel('../data/processed/relatorio_final_gaps.xlsx', index=False)
    print("\nüíæ Relat√≥rio salvo: data/processed/relatorio_final_gaps.xlsx")
else:
    print("üéâ Nada encontrado. Se a nota n√£o √© 10, revise a l√≥gica das colunas.")

üîÑ Carregando dados brutos...
üßπ Convertendo notas de texto (0,50) para n√∫meros (0.50)...
üìç Base RJ carregada: 39 munic√≠pios.
‚úÖ Alvo: Paracambi - RJ | Nota Geral: 6.11

üïµÔ∏è‚Äç‚ôÇÔ∏è Cruzando dados para encontrar Gaps REAIS...

üìã ENCONTRADOS 6 PONTOS DE MELHORIA REAIS.
Estas s√£o as funcionalidades que FALTAM no site e que valem nota.


Unnamed: 0,Quest√£o Chave,Nota Paracambi,Nota M√°xima Poss√≠vel,Refer√™ncia (Benchmarking)
4,24 - PEDIDO 2: O pedido 2 foi enviado com sucesso e obteve resposta?,0.0,1.1,Niter√≥i - RJ
5,25 - PEDIDO 3: O pedido 3 foi enviado com sucesso e obteve resposta?,0.0,1.1,Campos dos Goytacazes - RJ
0,11 - O ente federado disponibiliza consulta para acesso aos resultados das licita√ß√µes ocorridas?,0.0,0.3,Rio de Janeiro
2,14 - OBRAS P√öBLICAS: O ente federado disponibiliza consulta para o acompanhamento de Obras P√∫blicas?,0.0,0.25,Mesquita - RJ
1,13 - O ente federado permite gerar relat√≥rio da consulta de licita√ß√µes ou da consulta de contratos em formato aberto?,0.0,0.1,Rio de Janeiro
3,19 - BASES DE DADOS ABERTOS: O ente federado publica em seu s√≠tio oficial alguma rela√ß√£o das bases dedados abertos do munic√≠pio (cat√°lago/invent√°rio de dados abertos)?,0.0,0.05,Maca√© - RJ



üíæ Relat√≥rio salvo: data/processed/relatorio_final_gaps.xlsx
