# comercio_ext_indices.tb_nomenclatura_brasileira
> ### Origem â€” `bronze/autoloader/landingbeca2026jan/balancacomercial/NBM_delta`
## ðŸ“Œ DescriÃ§Ã£o do arquivo

Tabela de referÃªncia com o **cÃ³digo NBM** e sua **descriÃ§Ã£o textual** do produto.

**NBM (Nomenclatura Brasileira de Mercadorias)** Ã© uma classificaÃ§Ã£o histÃ³rica de produtos usada no Brasil antes (ou em paralelo, dependendo do recorte temporal) da consolidaÃ§Ã£o do uso da **NCM**.  
Neste projeto, ela serve como **tabela dimensÃ£o/legado** para compatibilizaÃ§Ã£o e histÃ³rico.

Tipo: DimensÃ£o de produto (legado)  
Uso: ReferÃªncia / bridge com NCM (via `NBM_NCM.csv`)

|Coluna|DescriÃ§Ã£o tÃ©cnica|InterpretaÃ§Ã£o humana|
|---|---|---|
|`CO_NBM`|CÃ³digo NBM do produto|Identificador do produto na nomenclatura NBM|
|`NO_NBM`|DescriÃ§Ã£o do produto|Nome/descriÃ§Ã£o do item conforme NBM|

## ConfiguraÃ§Ãµes
> #### **imports**
> #### **get files**
> #### **schema**

In [0]:
import org . apache . spark  . sql . functions . _
import org . apache . spark  . sql . types . _
import org . apache . spark  . sql . DataFrame
import org . apache . hadoop . fs  . FileSystem 
import org . apache . hadoop . fs  . Path 
import io  . delta  . tables . _

In [0]:

val bronzePath =     "/mnt/bronze/autoloader/landingbeca2026jan/balancacomercial/nbm/"   
val silverPath =     "/mnt/silver/landingbeca2026jan/comercio_ext_indices/tb_nomenclatura_brasileira/"   
val silverTable =    "tb_nomenclatura_brasileira"
val fs = FileSystem.get(spark.sparkContext.hadoopConfiguration)



In [0]:

val silverSchema = StructType (
  Seq (
    StructField ( "CO_NBM" , StringType ,  nullable = false ) ,
    StructField ( "NO_NBM" , StringType ,  nullable = false ) ,
    StructField ( "TS_REF" , TimestampType ,  nullable = false ) ,
    StructField ( "NM_ORIGEM" , StringType ,  nullable = false ) 
  )
)



## ExtraÃ§Ã£o
> #### **saprk.read**

In [0]:
val dfBronzeRaw = spark . read . format ( "delta" ) . load ( bronzePath )

##NormalizaÃ§Ã£o
> #### **datatype**
> #### **regras**

In [0]:
val dfNormalized = dfBronzeRaw
  .withColumn("CO_NBM", trim(upper(col("CO_NBM").cast(StringType))))
  .withColumn("NO_NBM", col("NO_NBM").cast(StringType))

In [0]:
val dfWithDefaults = dfNormalized
  .withColumn("TS_REF", current_timestamp())
  .withColumn("NM_ORIGEM", lit("/landingbeca2026jan/balancacomercial/nbm"))
  .select("CO_NBM","NO_NBM", "TS_REF", "NM_ORIGEM")

###ValidaÃ§Ãµes

In [0]:

val dfValid = dfWithDefaults . filter ( 
  col("CO_NBM").isNotNull
)



In [0]:
val dfDedup = dfValid . dropDuplicates (
  Seq (
    "CO_NBM"
  )
)


In [0]:
val dfSilver = spark.createDataFrame(dfDedup.rdd, silverSchema.fieldNames.foldLeft(dfDedup.schema)((schema, name) => schema))

##Carga
> #### **merge**

In [0]:
val deltaTarget = DeltaTable . forName ( "silver_comercio_ext_indices.tb_nomenclatura_brasileira" )

deltaTarget.as("t")
  .merge(
    dfSilver.as("s"),
    """
      t.CO_NBM = s.CO_NBM
    """
  )
  .whenMatched()
  .updateExpr(Map(
    "NO_NBM" -> "s.NO_NBM",
    "TS_REF" -> "s.TS_REF",
    "NM_ORIGEM" -> "s.NM_ORIGEM"
  ))
  .whenNotMatched()
  .insertAll()
  .execute()