# üîÑ Silver - tb_custo_chamado (SRC)

**Camada**: Silver  
**Cat√°logo**: v_credit  
**Tabelas de Sa√≠da**:
- `tb_custo_chamado` ‚Üí Registros v√°lidos
- `tb_custo_chamado_invalidos` ‚Üí Registros rejeitados (auditoria)

**Origem**: `v_credit.bronze.custos`

**Objetivo**: Limpar e padronizar custos associados aos chamados, convertendo valores monet√°rios e garantindo integridade.

## üìã Imports e Configura√ß√£o

In [0]:
from pyspark.sql import functions as F
from pyspark.sql.types import DecimalType

## 1Ô∏è‚É£ Leitura da Bronze

In [0]:
TABLE_SOURCE = "v_credit.bronze.custos"
TABLE_TARGET_VALIDOS = "v_credit.silver.tb_custo_chamado"
TABLE_TARGET_INVALIDOS = "v_credit.silver.tb_custo_chamado_invalidos"

df_bronze = spark.table(TABLE_SOURCE)

total_bronze = df_bronze.count()
print(f"\n‚úÖ Total de registros lidos da Bronze: {total_bronze}")

## 2Ô∏è‚É£ Limpeza e Padroniza√ß√£o

In [0]:
df_limpo = (
    df_bronze
    .select(
        F.col("id_custo").cast("bigint").alias("cd_custo"),
        F.col("id_chamado").cast("bigint").alias("cd_chamado"),
        F.expr("""
            try_cast(
                replace(
                    regexp_replace(custo, '[^0-9,.-]', ''), 
                    ',', '.'
                ) as decimal(10,8)
            )
        """).alias("vl_custo"),
        # Mant√©m estritamente o timestamp da origem (Bronze)
        F.col("ingestion_timestamp").alias("dt_ingestion"),
        F.coalesce(F.col("origem"), F.lit("sistema_custos")).alias("dc_origem")
    )
    .dropDuplicates(["cd_custo"])
    .withColumn("data_processamento", F.current_timestamp())
)

total_limpo = df_limpo.count()
print(f"‚úÖ Dados limpos e padronizados: {total_limpo} registros")

## 3Ô∏è‚É£ Regras de Valida√ß√£o e Qualidade

In [0]:
df_validacao = (
    df_limpo
    # Flag 1: ID do custo obrigat√≥rio
    .withColumn("flag_id_valido", F.col("cd_custo").isNotNull())
    # Flag 2: V√≠nculo com chamado obrigat√≥rio
    .withColumn("flag_chamado_valido", F.col("cd_chamado").isNotNull())
    # Flag 3: Valor deve ser num√©rico v√°lido e maior que zero
    .withColumn(
        "flag_valor_valido", 
        (F.col("vl_custo").isNotNull()) & (F.col("vl_custo") >= 0)
    )
    # Valida√ß√£o Geral
    .withColumn("flag_qualidade",
        F.when(
            F.col("flag_id_valido") &
            F.col("flag_chamado_valido") &
            F.col("flag_valor_valido"),
            F.lit("OK")
        ).otherwise(F.lit("ERRO"))
    )
)

print("‚úÖ Regras de valida√ß√£o aplicadas")

## 4Ô∏è‚É£ Separa√ß√£o de Dados V√°lidos e Inv√°lidos

In [0]:
# Separa√ß√£o dos DataFrames
df_validos = df_validacao.filter(F.col("flag_qualidade") == "OK")

df_invalidos = (
    df_validacao
    .filter(F.col("flag_qualidade") == "ERRO")
    .withColumn(
        "motivo_rejeicao",
        F.concat_ws(
            "; ",
            F.when(~F.col("flag_id_valido"), F.lit("cd_custo NULL")),
            F.when(~F.col("flag_chamado_valido"), F.lit("cd_chamado NULL")),
            F.when(~F.col("flag_valor_valido"), F.lit("vl_custo inv√°lido ou <= 0"))
        )
    )
    .withColumn("dt_validacao", F.lit(processing_timestamp))
    .drop(
        "flag_id_valido",
        "flag_chamado_valido",
        "flag_valor_valido",
        "data_processamento"
    )
)

# Contagens necess√°rias para o MERGE e logs
total_validos = df_validos.count()
total_invalidos = df_invalidos.count()

print(f"‚ÑπÔ∏è Resumo: {total_validos} v√°lidos | {total_invalidos} inv√°lidos")

## 5Ô∏è‚É£ Grava√ß√£o: MERGE de Registros V√°lidos

In [0]:
if total_validos > 0:
    # Criar temp view
    df_validos.createOrReplaceTempView("temp_custo_validos")
    
    print(f"üîÑ Executando MERGE de {total_validos} registros v√°lidos em {TABLE_TARGET_VALIDOS}...")
    
    # MERGE SQL - Chave: cd_custo
    spark.sql(f"""
        MERGE INTO {TABLE_TARGET_VALIDOS} AS target
        USING temp_custo_validos AS source
        ON target.cd_custo = source.cd_custo
        
        WHEN MATCHED THEN
            UPDATE SET
                target.cd_chamado = source.cd_chamado,
                target.vl_custo = source.vl_custo,
                target.dt_ingestion = source.dt_ingestion,
                target.dc_origem = source.dc_origem
        
        WHEN NOT MATCHED THEN
            INSERT (
                cd_custo,
                cd_chamado,
                vl_custo,
                dt_ingestion,
                dc_origem
            )
            VALUES (
                source.cd_custo,
                source.cd_chamado,
                source.vl_custo,
                source.dt_ingestion,
                source.dc_origem
            )
    """)
    
    print(f"‚úÖ MERGE conclu√≠do com sucesso!")
else:
    print("‚ö†Ô∏è  Nenhum registro v√°lido para inserir na Silver")

## 6Ô∏è‚É£ Grava√ß√£o: APPEND de Registros Inv√°lidos

In [0]:
if total_invalidos > 0:
    print(f"üìù Enviando {total_invalidos} registro(s) inv√°lido(s) para auditoria...")
    
    # APPEND (acumula hist√≥rico de rejei√ß√µes)
    (df_invalidos.write
        .format("delta")
        .mode("append")
        .saveAsTable(TABLE_TARGET_INVALIDOS))
    
    print(f"‚úÖ Registros inv√°lidos gravados em {TABLE_TARGET_INVALIDOS}")
else:
    print("üéâ Nenhum registro inv√°lido - 100% de qualidade!")