In [0]:
from pyspark.sql import functions as F
from pyspark.sql.types import TimestampType

CATALOGO_DESTINO = "v_credit"
SCHEMA_DESTINO = "silver"
TABELA_DESTINO = "tb_atendente_invalidos"

nome_tabela_destino = f"{CATALOGO_DESTINO}.{SCHEMA_DESTINO}.{TABELA_DESTINO}"

### DDL - Tabela de Auditoria (Atendentes Invalidos)
Cria tabela de auditoria para registros de atendentes rejeitados por falhas de validacao:
- Contem **todas as colunas da tabela principal** (tb_atendente)
- **Flags de validacao**: flag_id_valido, flag_nome_valido, flag_nivel_valido
- **flag_qualidade**: Sempre "ERRO" (registros validos vao para tb_atendente)

**Proposito**: Rastreabilidade completa de dados rejeitados para analise e correcao na origem.

### Configuracao
Define catalogo, schema e nome da tabela de auditoria de atendentes invalidos.

In [0]:
query = f"""
CREATE OR REPLACE TABLE {nome_tabela_destino} (
    cd_atendente BIGINT COMMENT 'Identificador único do atendente.',
    nm_atendente STRING COMMENT 'Nome completo do funcionário.',
    nu_nivel SMALLINT COMMENT 'Nível de senioridade do atendimento.',
    dt_ingestion TIMESTAMP COMMENT 'Data de ingestão do registro.',
    dc_origem STRING COMMENT 'Origem do dado (ex: supabase).',
    flag_id_valido BOOLEAN COMMENT 'Indica se o ID do atendente é válido.',
    flag_nome_valido BOOLEAN COMMENT 'Indica se o nome do atendente é válido.',
    flag_nivel_valido BOOLEAN COMMENT 'Indica se o nível está no range válido (1 ou 2).',
    flag_qualidade STRING COMMENT 'Status de qualidade: OK ou ERRO.',
    CONSTRAINT pk_atendente_invalidos PRIMARY KEY (cd_atendente)
)
COMMENT 'Tabela silver de auditoria - registros de atendentes rejeitados por problemas de qualidade';
"""

spark.sql(query)
print(f"✅ Tabela {nome_tabela_destino} criada com sucesso!")