# comercio_ext_indices.tb_referencia_isic_cuci
> ### Origem â€” `bronze/autoloader/landingbeca2026jan/balancacomercial/ISIC_CUCI_delta`
## ðŸ“Œ DescriÃ§Ã£o do arquivo

Tabela de **classificaÃ§Ã£o econÃ´mica internacional**, que relaciona **atividades econÃ´micas (ISIC)** com **grupos de produtos (CUCI)**.

Esse arquivo **nÃ£o contÃ©m valores, volumes ou operaÃ§Ãµes comerciais**.  
Ele existe exclusivamente para **interpretaÃ§Ã£o econÃ´mica e setorial**.

Fonte: MDIC / classificaÃ§Ãµes internacionais (ISIC / CUCI)  
Tipo: Tabela de referÃªncia (dimensÃ£o / bridge)

| Coluna          | DescriÃ§Ã£o tÃ©cnica    | InterpretaÃ§Ã£o humana             |
| --------------- | -------------------- | -------------------------------- |
| `CO_ISIC_SECAO` | CÃ³digo da seÃ§Ã£o ISIC | Macroatividade econÃ´mica         |
| `NO_ISIC_SECAO` | Nome da seÃ§Ã£o ISIC   | DescriÃ§Ã£o da atividade econÃ´mica |
| `CO_CUCI_GRUPO` | CÃ³digo do grupo CUCI | Grupo internacional de produtos  |
| `NO_CUCI_GRUPO` | Nome do grupo CUCI   | Tipo de bem comercializado       |

## ConfiguraÃ§Ãµes
> #### **imports**
> #### **get files**
> #### **schema**

In [0]:
import org . apache . spark  . sql . functions . _
import org . apache . spark  . sql . types . _
import org . apache . spark  . sql . DataFrame
import org . apache . hadoop . fs  . FileSystem 
import org . apache . hadoop . fs  . Path 
import io  . delta  . tables . _

In [0]:

val bronzePath =     "/mnt/bronze/autoloader/landingbeca2026jan/balancacomercial/ISIC_CUCI_delta/"   
val silverPath =     "/mnt/silver/landingbeca2026jan/comercio_ext_indices/tb_classificacao_isic_cuci/"   
val silverTable =    "tb_classificacao_isic_cuci"
val fs = FileSystem.get(spark.sparkContext.hadoopConfiguration)



In [0]:


val silverSchema = StructType(
    Seq (
      StructField ( "CO_ISIC_SECAO" , StringType ,  nullable = false ) ,
      StructField ( "NO_ISIC_SECAO" , StringType ,  nullable = false ) ,
      StructField ( "CO_CUCI_GRUPO" , StringType ,  nullable = false ) ,
      StructField ( "NO_CUCI_GRUPO" , StringType ,  nullable = false ) ,
      StructField ( "TS_REF" , TimestampType ,  nullable = false ) ,
      StructField ( "NM_ORIGEM" , StringType ,  nullable = false ) 
    )
  )


## ExtraÃ§Ã£o
> #### **saprk.read**

In [0]:
val dfBronzeRaw = spark . read . format ( "delta" ) . load ( bronzePath )

##NormalizaÃ§Ã£o
> #### **datatype**
> #### **regras**

In [0]:
val dfNormalized = dfBronzeRaw
  .withColumn("CO_ISIC_SECAO", trim(upper(col("CO_ISIC_SECAO").cast(StringType))))
  .withColumn("NO_ISIC_SECAO", col("NO_ISIC_SECAO").cast(StringType))
  .withColumn("CO_CUCI_GRUPO", trim(upper(col("CO_CUCI_GRUPO").cast(StringType))))
  .withColumn("NO_CUCI_GRUPO", col("NO_CUCI_GRUPO").cast(StringType))

In [0]:
val dfWithDefaults = dfNormalized
  .withColumn("TS_REF", current_timestamp())
  .withColumn("NM_ORIGEM", lit("/landingbeca2026jan/balancacomercial/ISIC_CUCI_delta"))

##ValidaÃ§Ãµes
> #### **data quality**
> #### **deduplicaÃ§Ã£o**
> #### **schema fit**

In [0]:

val dfValid = dfWithDefaults . filter ( 
    col("CO_ISIC_SECAO").isNotNull && 
    col("CO_CUCI_GRUPO").isNotNull
  )



In [0]:
val dfDedup = dfValid . dropDuplicates (
    Seq (
        "CO_ISIC_SECAO","CO_CUCI_GRUPO"
    )
  )

In [0]:
val dfSilver = spark.createDataFrame(dfDedup.rdd, silverSchema.fieldNames.foldLeft(dfDedup.schema)((schema, name) => schema))

##Carga
> #### **overwrite**

In [0]:
spark.conf.set("spark.databricks.optimizer.dynamicPartitionPruning", "true")
spark.conf.set("spark.sql.sources.partitionOverwriteMode", "dynamic")

val silverExists = fs.exists(new Path(silverPath))

if (!silverExists) {
  dfSilver
    .write
    .format("delta")
    .mode("overwrite")
    .save(silverPath)
}