# 3. Validação de Consultas

Este notebook verifica a integridade dos dados de consultas processados.

**Entradas:**
- `dados_com_consultas.xlsx` (Gerado no passo 2)
- Relatório de Slip Fatura (para comparação de totais, opcional)

**Objetivo:** Garantir que não houve duplicação indevida e que os valores batem.

In [1]:
import pandas as pd
import warnings
warnings.filterwarnings('ignore')

### 3.1 Carregamento dos Dados Processados

In [None]:
dados_com_consultas = '../Data/dados_com_consultas.xlsx' # Caminho para o arquivo de dados com consultas

dados = pd.read_excel(dados_com_consultas)
dados.head()

### 3.2 Verificação de Duplicatas com Consulta
Verifica se existem beneficiários duplicados que possuem valor de consulta preenchido. Isso é crítico para não cobrar duas vezes.

In [3]:
duplicate_names = dados[dados['CONSULTA'].notna() & dados['NOME'].duplicated(keep=False)]

if not duplicate_names.empty:
    print("PERIGO: Nomes duplicados encontrados na planilha 'dados' com valor de CONSULTA:")
    display(duplicate_names)
else:
    print("Sucesso: Não há nomes duplicados com consultas na planilha.")

### 3.3 Verificação de Valores Altos (Opcional)
Lista as maiores consultas para conferência visual (detectar outliers ou erros de leitura).

In [4]:
top_consultas = dados[dados['CONSULTA'].notna()].sort_values(by='CONSULTA', ascending=False).head(10)

print("Top 10 maiores valores de consultas:")
display(top_consultas[['NOME', 'CONSULTA']])

### 3.4 Estatísticas Gerais

In [5]:
total_consultas = dados['CONSULTA'].sum()
qtd_beneficiarios = dados['CONSULTA'].count()

print(f"Valor Total de Consultas na Planilha: R$ {total_consultas:.2f}")
print(f"Quantidade de Beneficiários com Consulta: {qtd_beneficiarios}")