# comercio_ext_indices.tb_nomenclatura_brasileira
> ### Origem â€” `bronze/autoloader/landingbeca2026jan/balancacomercial/NBM_delta`
## ðŸ“Œ DescriÃ§Ã£o do arquivo

Tabela de referÃªncia com o **cÃ³digo NBM** e sua **descriÃ§Ã£o textual** do produto.

**NBM (Nomenclatura Brasileira de Mercadorias)** Ã© uma classificaÃ§Ã£o histÃ³rica de produtos usada no Brasil antes (ou em paralelo, dependendo do recorte temporal) da consolidaÃ§Ã£o do uso da **NCM**.  
Neste projeto, ela serve como **tabela dimensÃ£o/legado** para compatibilizaÃ§Ã£o e histÃ³rico.

Tipo: DimensÃ£o de produto (legado)  
Uso: ReferÃªncia / bridge com NCM (via `NBM_NCM.csv`)

|Coluna|DescriÃ§Ã£o tÃ©cnica|InterpretaÃ§Ã£o humana|
|---|---|---|
|`CO_NBM`|CÃ³digo NBM do produto|Identificador do produto na nomenclatura NBM|
|`NO_NBM`|DescriÃ§Ã£o do produto|Nome/descriÃ§Ã£o do item conforme NBM|

## ConfiguraÃ§Ãµes
> #### **imports**
> #### **get files**
> #### **schema**

In [0]:
from pyspark.sql import functions as F
from pyspark.sql import types as T
from delta.tables import DeltaTable
jvm = spark._jvm
FileSystem = jvm.org.apache.hadoop.fs.FileSystem
Path = jvm.org.apache.hadoop.fs.Path
fs = FileSystem.get(spark._jsc.hadoopConfiguration())

In [0]:
bronzePath = "/mnt/bronze/autoloader/landingbeca2026jan/balancacomercial/nbm/"
silverPath = "/mnt/silver/landingbeca2026jan/comercio_ext_indices/tb_nomenclatura_brasileira/"
silverTable = "silver_comercio_ext_indices.tb_nomenclatura_brasileira"

In [0]:
silverSchema = T.StructType([
    T.StructField("CO_NBM",   T.StringType(),   False),
    T.StructField("NO_NBM",   T.StringType(),   False),
    T.StructField("TS_REF",   T.TimestampType(),False),
    T.StructField("NM_ORIGEM",T.StringType(),   False),
])

## ExtraÃ§Ã£o
> #### **saprk.read**

In [0]:
df_bronze = spark.read.format("delta").load(bronzePath)

##NormalizaÃ§Ã£o
> #### **datatype**

In [0]:
df_norm = (
    df_bronze
    .withColumn("CO_NBM", F.upper(F.trim(F.col("CO_NBM").cast(T.StringType()))))
    .withColumn("NO_NBM", F.col("NO_NBM").cast(T.StringType()))
    .withColumn("TS_REF", F.current_timestamp())
    .withColumn("NM_ORIGEM", F.lit("/landingbeca2026jan/comercio_ext_indices/NBM_delta"))
)

###ValidaÃ§Ãµes

In [0]:
df_valid = df_norm.filter(F.col("CO_NBM").isNotNull())



In [0]:
df_dedup = df_valid.dropDuplicates(["CO_NBM"])


In [0]:
df_silver = df_dedup.select("CO_NBM","NO_NBM","TS_REF","NM_ORIGEM")

##Carga
> #### **merge**

In [0]:
delta_target = DeltaTable.forName(spark, "silver_comercio_ext_indices.tb_nomenclatura_brasileira")

merge_condition = """
      t.CO_NBM = s.CO_NBM
    """

(delta_target.alias("t")
    .merge(df_silver.alias("s"), merge_condition)
    .whenMatchedUpdate(set={
        "t.NO_NBM":   "s.NO_NBM",
        "t.TS_REF":     "s.TS_REF",
        "t.NM_ORIGEM":  "s.NM_ORIGEM",
    })
    .whenNotMatchedInsertAll()
    .execute()
)