In [0]:
from pyspark.sql import functions as F
from pyspark.sql.types import TimestampType

CATALOGO_DESTINO = "v_credit"
SCHEMA_DESTINO = "silver"
TABELA_DESTINO = "tb_cliente_invalidos"

nome_tabela_destino = f"{CATALOGO_DESTINO}.{SCHEMA_DESTINO}.{TABELA_DESTINO}"

In [0]:
query = f"""
CREATE OR REPLACE TABLE {nome_tabela_destino} (
    cd_cliente STRING COMMENT 'Identificador único do cliente (hash SHA256 truncado).',
    nu_cpf STRING COMMENT 'Hash SHA256 do CPF do cliente.',
    nm_cliente VARCHAR(150) COMMENT 'Nome completo do cliente.',
    ds_email VARCHAR(150) COMMENT 'Endereço de e-mail.',
    nm_regiao VARCHAR(50) COMMENT 'Região geográfica do cliente.',
    nu_idade SMALLINT COMMENT 'Idade do cliente.',
    dt_ingestion TIMESTAMP COMMENT 'Data e hora da ingestão do registro.',
    dc_origem STRING COMMENT 'Identificação do sistema ou arquivo fonte dos dados.',
    flag_email_valido BOOLEAN COMMENT 'Indica se o email é válido (formato correto).',
    flag_maior_idade BOOLEAN COMMENT 'Indica se o cliente é maior de idade (>=18).',
    flag_cpf_valido BOOLEAN COMMENT 'Indica se o CPF foi hasheado corretamente.',
    flag_qualidade STRING COMMENT 'Status de qualidade: OK ou ERRO.',
    CONSTRAINT pk_cliente_invalidos PRIMARY KEY (cd_cliente)
)
COMMENT 'Tabela silver de auditoria - registros de clientes rejeitados por problemas de qualidade';
"""

spark.sql(query)
print(f"✅ Tabela {nome_tabela_destino} criada com sucesso!")