# üîç Pesquisa Completa no Gov.br por CPF

Este notebook pesquisa informa√ß√µes p√∫blicas relacionadas a um CPF em m√∫ltiplas APIs do Portal da Transpar√™ncia.

## ‚ö†Ô∏è Importante
- **Dados retornados s√£o p√∫blicos e agregados**
- **N√£o retorna dados pessoais sens√≠veis** (nome completo, endere√ßo, email)
- **Apenas informa√ß√µes de transpar√™ncia p√∫blica** (benef√≠cios, servidores, empresas)
- **Respeita LGPD e privacidade dos cidad√£os**

## 1. Configura√ß√£o e Imports

In [None]:
import requests
import pandas as pd
from datetime import datetime, timedelta
import json
from IPython.display import display, HTML
import warnings
warnings.filterwarnings('ignore')

# Configura√ß√µes
PORTAL_TRANSPARENCIA_API_KEY = "2c56919ba91b8c1b13473dcef43fb031"
transparency_url = "https://api.portaldatransparencia.gov.br/api-de-dados"

headers = {
    'chave-api-dados': PORTAL_TRANSPARENCIA_API_KEY,
    'Accept': 'application/json'
}

print("‚úÖ Configura√ß√µes carregadas!")

## 2. Fun√ß√µes Auxiliares

In [None]:
def formatar_cpf(cpf):
    """Remove formata√ß√£o do CPF"""
    return ''.join(filter(str.isdigit, str(cpf)))

def mascarar_cpf(cpf):
    """Mascara CPF para exibi√ß√£o (XXX.XXX.XXX-XX)"""
    cpf_limpo = formatar_cpf(cpf)
    if len(cpf_limpo) == 11:
        return f"{cpf_limpo[:3]}.{cpf_limpo[3:6]}.{cpf_limpo[6:9]}-{cpf_limpo[9:]}"
    return cpf_limpo

def consultar_endpoint(endpoint, params, descricao):
    """Consulta um endpoint da API e retorna os dados"""
    try:
        response = requests.get(
            f"{transparency_url}{endpoint}",
            headers=headers,
            params=params,
            timeout=30
        )
        
        if response.status_code == 200:
            data = response.json()
            if data and len(data) > 0:
                return {
                    'status': 'success',
                    'data': data,
                    'count': len(data) if isinstance(data, list) else 1
                }
            else:
                return {
                    'status': 'empty',
                    'data': [],
                    'count': 0
                }
        elif response.status_code == 401:
            return {
                'status': 'unauthorized',
                'data': [],
                'count': 0,
                'error': 'N√£o autorizado - verifique a chave API'
            }
        else:
            return {
                'status': 'error',
                'data': [],
                'count': 0,
                'error': f"Status {response.status_code}: {response.text[:200]}"
            }
    except Exception as e:
        return {
            'status': 'error',
            'data': [],
            'count': 0,
            'error': str(e)
        }

print("‚úÖ Fun√ß√µes auxiliares criadas!")

## 3. Entrada do CPF

In [None]:
# INSIRA O CPF AQUI (com ou sem formata√ß√£o)
CPF_INPUT = ""  # Exemplo: "12345678901" ou "123.456.789-01"

# Se vazio, solicitar input
if not CPF_INPUT:
    CPF_INPUT = input("Digite o CPF para pesquisa (com ou sem formata√ß√£o): ")

CPF = formatar_cpf(CPF_INPUT)

if len(CPF) != 11:
    print(f"‚ùå CPF inv√°lido! Deve ter 11 d√≠gitos. Recebido: {len(CPF)} d√≠gitos")
    raise ValueError("CPF inv√°lido")

CPF_MASCARADO = mascarar_cpf(CPF)
print(f"\nüîç Pesquisando informa√ß√µes para CPF: {CPF_MASCARADO}")
print("=" * 80)

## 4. Pesquisa em M√∫ltiplos Endpoints

In [None]:
resultados = {}

print("\nüìä Iniciando pesquisa em m√∫ltiplos endpoints...\n")

# 1. Bolsa Fam√≠lia por CPF/NIS
print("[1/7] Consultando Bolsa Fam√≠lia por CPF/NIS...")
meses_para_testar = 12  # √öltimos 12 meses
bolsa_familia_resultados = []

for i in range(meses_para_testar):
    data_ref = (datetime.now() - timedelta(days=30*i)).strftime('%Y%m')
    result = consultar_endpoint(
        '/bolsa-familia-por-cpf-ou-nis',
        {'cpfOuNis': CPF, 'mesAno': data_ref, 'pagina': 1},
        f'Bolsa Fam√≠lia - {data_ref}'
    )
    if result['status'] == 'success' and result['count'] > 0:
        bolsa_familia_resultados.extend(result['data'])

resultados['bolsa_familia'] = {
    'status': 'success' if bolsa_familia_resultados else 'empty',
    'data': bolsa_familia_resultados,
    'count': len(bolsa_familia_resultados)
}
print(f"   {'‚úÖ' if bolsa_familia_resultados else '‚ö†Ô∏è '} {len(bolsa_familia_resultados)} registro(s) encontrado(s)")

# 2. Servidores P√∫blicos
print("\n[2/7] Consultando Servidores P√∫blicos...")
mes_atual = datetime.now().strftime('%Y%m')
result_servidores = consultar_endpoint(
    '/servidores',
    {'cpf': CPF, 'mesAnoReferencia': mes_atual, 'pagina': 1},
    'Servidores P√∫blicos'
)
resultados['servidores'] = result_servidores
print(f"   {'‚úÖ' if result_servidores['count'] > 0 else '‚ö†Ô∏è '} {result_servidores['count']} registro(s) encontrado(s)")

# 3. CEIS - Cadastro de Empresas Inid√¥neas e Suspensas
print("\n[3/7] Consultando CEIS (Empresas Inid√¥neas)...")
result_ceis = consultar_endpoint(
    '/ceis',
    {'cpfOuCnpj': CPF, 'pagina': 1},
    'CEIS'
)
resultados['ceis'] = result_ceis
print(f"   {'‚úÖ' if result_ceis['count'] > 0 else '‚ö†Ô∏è '} {result_ceis['count']} registro(s) encontrado(s)")

# 4. CNEP - Cadastro Nacional de Empresas Punidas
print("\n[4/7] Consultando CNEP (Empresas Punidas)...")
result_cnep = consultar_endpoint(
    '/cnep',
    {'cpfOuCnpj': CPF, 'pagina': 1},
    'CNEP'
)
resultados['cnep'] = result_cnep
print(f"   {'‚úÖ' if result_cnep['count'] > 0 else '‚ö†Ô∏è '} {result_cnep['count']} registro(s) encontrado(s)")

# 5. Despesas (se o CPF for fornecedor)
print("\n[5/7] Consultando Despesas P√∫blicas...")
mes_inicio = (datetime.now() - timedelta(days=365)).strftime('%Y%m')
mes_fim = datetime.now().strftime('%Y%m')
result_despesas = consultar_endpoint(
    '/despesas/documentos',
    {'cpfCnpjFornecedor': CPF, 'mesAnoInicio': mes_inicio, 'mesAnoFim': mes_fim, 'pagina': 1},
    'Despesas P√∫blicas'
)
resultados['despesas'] = result_despesas
print(f"   {'‚úÖ' if result_despesas['count'] > 0 else '‚ö†Ô∏è '} {result_despesas['count']} registro(s) encontrado(s)")

# 6. Conv√™nios (se o CPF for proponente/executor)
print("\n[6/7] Consultando Conv√™nios...")
data_inicio = (datetime.now() - timedelta(days=365)).strftime('%d/%m/%Y')
data_fim = datetime.now().strftime('%d/%m/%Y')
result_convenios = consultar_endpoint(
    '/convenios',
    {'cpfCnpjProponente': CPF, 'dataInicialCelebracao': data_inicio, 'dataFinalCelebracao': data_fim, 'pagina': 1},
    'Conv√™nios'
)
resultados['convenios'] = result_convenios
print(f"   {'‚úÖ' if result_convenios['count'] > 0 else '‚ö†Ô∏è '} {result_convenios['count']} registro(s) encontrado(s)")

# 7. Contratos
print("\n[7/7] Consultando Contratos...")
data_inicio_contrato = (datetime.now() - timedelta(days=365)).strftime('%d/%m/%Y')
data_fim_contrato = datetime.now().strftime('%d/%m/%Y')
result_contratos = consultar_endpoint(
    '/contratos',
    {'cpfCnpjContratado': CPF, 'dataInicial': data_inicio_contrato, 'dataFinal': data_fim_contrato, 'pagina': 1},
    'Contratos'
)
resultados['contratos'] = result_contratos
print(f"   {'‚úÖ' if result_contratos['count'] > 0 else '‚ö†Ô∏è '} {result_contratos['count']} registro(s) encontrado(s)")

print("\n" + "=" * 80)
print("‚úÖ Pesquisa conclu√≠da!")
print("=" * 80)

## 5. Resumo dos Resultados

In [None]:
print(f"\nüìä RESUMO DA PESQUISA - CPF: {CPF_MASCARADO}\n")
print("=" * 80)

resumo = []
total_registros = 0

for categoria, resultado in resultados.items():
    count = resultado.get('count', 0)
    status_emoji = '‚úÖ' if count > 0 else '‚ö†Ô∏è'
    status_texto = 'Encontrado' if count > 0 else 'N√£o encontrado'
    
    resumo.append({
        'Categoria': categoria.replace('_', ' ').title(),
        'Status': status_texto,
        'Registros': count
    })
    total_registros += count

df_resumo = pd.DataFrame(resumo)
display(df_resumo)

print(f"\nüìà Total de registros encontrados: {total_registros}")

if total_registros == 0:
    print("\n‚ö†Ô∏è  Nenhum registro encontrado. Poss√≠veis motivos:")
    print("   - CPF n√£o possui registros p√∫blicos nos sistemas consultados")
    print("   - Per√≠odo de consulta n√£o cont√©m dados")
    print("   - Dados podem n√£o estar dispon√≠veis na API")
else:
    print("\n‚úÖ Dados encontrados! Veja os detalhes abaixo.")

## 6. Detalhamento por Categoria

In [None]:
# Fun√ß√£o para exibir dados de forma organizada
def exibir_resultados(categoria, dados, titulo):
    if not dados or len(dados) == 0:
        print(f"\n‚ö†Ô∏è  {titulo}: Nenhum registro encontrado")
        return
    
    print(f"\n{'='*80}")
    print(f"üìã {titulo}")
    print(f"{'='*80}")
    
    try:
        df = pd.DataFrame(dados)
        print(f"\nTotal de registros: {len(df)}")
        print(f"\nColunas dispon√≠veis: {', '.join(df.columns.tolist())}")
        print("\n" + "-"*80)
        display(df.head(20))  # Mostrar primeiros 20 registros
        
        if len(df) > 20:
            print(f"\n... e mais {len(df) - 20} registro(s)")
    except Exception as e:
        print(f"\n‚ö†Ô∏è  Erro ao processar dados: {e}")
        print(f"\nDados brutos (JSON):")
        print(json.dumps(dados[:3], indent=2, ensure_ascii=False))

# Exibir cada categoria
if resultados['bolsa_familia']['count'] > 0:
    exibir_resultados('bolsa_familia', resultados['bolsa_familia']['data'], 'Bolsa Fam√≠lia')

if resultados['servidores']['count'] > 0:
    exibir_resultados('servidores', resultados['servidores']['data'], 'Servidores P√∫blicos')

if resultados['ceis']['count'] > 0:
    exibir_resultados('ceis', resultados['ceis']['data'], 'CEIS - Empresas Inid√¥neas')

if resultados['cnep']['count'] > 0:
    exibir_resultados('cnep', resultados['cnep']['data'], 'CNEP - Empresas Punidas')

if resultados['despesas']['count'] > 0:
    exibir_resultados('despesas', resultados['despesas']['data'], 'Despesas P√∫blicas')

if resultados['convenios']['count'] > 0:
    exibir_resultados('convenios', resultados['convenios']['data'], 'Conv√™nios')

if resultados['contratos']['count'] > 0:
    exibir_resultados('contratos', resultados['contratos']['data'], 'Contratos')

## 7. Exportar Resultados

In [None]:
# Exportar para JSON
exportar_json = True  # Mude para False se n√£o quiser exportar

if exportar_json and total_registros > 0:
    arquivo_json = f"pesquisa_cpf_{CPF}_{datetime.now().strftime('%Y%m%d_%H%M%S')}.json"
    
    dados_export = {
        'cpf': CPF_MASCARADO,
        'data_pesquisa': datetime.now().isoformat(),
        'total_registros': total_registros,
        'resultados': {}
    }
    
    for categoria, resultado in resultados.items():
        if resultado['count'] > 0:
            dados_export['resultados'][categoria] = resultado['data']
    
    with open(arquivo_json, 'w', encoding='utf-8') as f:
        json.dump(dados_export, f, indent=2, ensure_ascii=False, default=str)
    
    print(f"\n‚úÖ Resultados exportados para: {arquivo_json}")
else:
    print("\nüí° Para exportar resultados, altere 'exportar_json' para True")

## 8. Observa√ß√µes Importantes

### ‚ö†Ô∏è Limita√ß√µes e Considera√ß√µes

1. **Dados Pessoais**: As APIs n√£o retornam dados pessoais completos (nome completo, endere√ßo, email)
2. **Privacidade**: Apenas informa√ß√µes p√∫blicas de transpar√™ncia s√£o retornadas
3. **LGPD**: Todos os dados respeitam a Lei Geral de Prote√ß√£o de Dados
4. **Per√≠odo**: Algumas consultas limitam o per√≠odo hist√≥rico dispon√≠vel
5. **Rate Limiting**: A API pode ter limites de requisi√ß√µes por minuto

### üìã O que √© retornado:
- **Benef√≠cios**: Valores e per√≠odos de benef√≠cios sociais
- **Servidores**: Informa√ß√µes p√∫blicas sobre servidores (se aplic√°vel)
- **Empresas**: Rela√ß√£o com empresas inid√¥neas ou punidas
- **Contratos/Conv√™nios**: Rela√ß√£o com o poder p√∫blico
- **Despesas**: Pagamentos recebidos do governo

### ‚ùå O que N√ÉO √© retornado:
- Nome completo do titular
- Endere√ßo residencial
- Email pessoal
- Telefone
- Outros dados pessoais sens√≠veis

### üìö Documenta√ß√£o:
- Portal da Transpar√™ncia: https://portaldatransparencia.gov.br/api-de-dados
- Swagger/API Docs: https://portaldatransparencia.gov.br/api-de-dados/swagger-ui.html