# **1. Contexto del Análisis**

En el ámbito del comercio exterior, los microdatos de exportaciones son esenciales para el análisis de las dinámicas comerciales que impactan tanto a nivel microeconómico, en términos de empresas, como a nivel macroeconómico, en cuanto a la economía nacional. La exportación, entendida como la salida de mercancías del territorio aduanero colombiano hacia otros países, zonas francas o depósitos francos, está regida por un conjunto normativo que asegura el cumplimiento de las disposiciones aduaneras, con el fin de garantizar un comercio exterior controlado y transparente. 

### Importar librerías

In [23]:
import pandas as pd
import numpy as np
import os
import seaborn as sns
import matplotlib.pyplot as plt

# Mostrar todos los datos del dataframe
pd.options.display.max_columns = None # Muestra todas las columnas
pd.set_option('display.max_rows', None) # Muestra todas las filas

#### Carga y visualización del archivo de ejemplo

In [24]:
# Ruta y carga del archivo
df = pd.read_excel('C:/Users/Aleja/OneDrive/Escritorio/Icesi/TDG/TDG/Data/01_Exportaciones_2025_Enero.xlsx')

# Mostrar las primeras filas del DataFrame
print(df.head(5))

   FECHA_PROCESO  NUMERO_SERIE  OFICINA  COD_ADUANA_DESPACHO  \
0         202501             1       99                    3   
1         202501             1       99                   87   
2         202501             2       99                   87   
3         202501             1       99                   87   
4         202501             3       99                   87   

                             ADUANA_DESPACHO  TIPO_IDENT  NIT_EXPORTADOR  \
0  Aduanas de Bogotá -  Aeropuerto El Dorado           2     900647398.0   
1                    Aduanas de Barranquilla           2     860026753.0   
2                    Aduanas de Barranquilla           2     802009120.0   
3                    Aduanas de Barranquilla           2     802009120.0   
4                    Aduanas de Barranquilla           2     802009120.0   

   TIPO_USUARIO  COD_USUARIO  CLASE_EXPORTADOR  COD_DPTO_EXPORTADOR  \
0            36            0                 2                76001   
1            36 

In [25]:
# Mostrar las últimas filas filas del DataFrame
print(df.tail(5))

       FECHA_PROCESO  NUMERO_SERIE  OFICINA  COD_ADUANA_DESPACHO  \
96002         202501             1       99                   89   
96003         202501             1       99                   89   
96004         202501             1       99                   89   
96005         202501             6       99                   89   
96006         202501             5       99                   89   

         ADUANA_DESPACHO  TIPO_IDENT  NIT_EXPORTADOR  TIPO_USUARIO  \
96002  Aduanas de Cúcuta           2     900711875.0            36   
96003  Aduanas de Cúcuta           2     800218958.0            36   
96004  Aduanas de Cúcuta           2     800245795.0            36   
96005  Aduanas de Cúcuta           2     811036030.0            36   
96006  Aduanas de Cúcuta           2     811036030.0            36   

       COD_USUARIO  CLASE_EXPORTADOR  COD_DPTO_EXPORTADOR  \
96002            0                 2                54001   
96003            0                 2            

In [26]:
# Visualizar el tamaño del dataframe
df.shape

(96007, 72)

In [27]:
# Visualizar estructura del dataframe
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 96007 entries, 0 to 96006
Data columns (total 72 columns):
 #   Column                         Non-Null Count  Dtype  
---  ------                         --------------  -----  
 0   FECHA_PROCESO                  96007 non-null  int64  
 1   NUMERO_SERIE                   96007 non-null  int64  
 2   OFICINA                        96007 non-null  int64  
 3   COD_ADUANA_DESPACHO            96007 non-null  int64  
 4   ADUANA_DESPACHO                96007 non-null  object 
 5   TIPO_IDENT                     96007 non-null  int64  
 6   NIT_EXPORTADOR                 95509 non-null  float64
 7   TIPO_USUARIO                   96007 non-null  int64  
 8   COD_USUARIO                    96007 non-null  int64  
 9   CLASE_EXPORTADOR               96007 non-null  int64  
 10  COD_DPTO_EXPORTADOR            96007 non-null  int64  
 11  COD_PAIS_DESTINO_NUM           96007 non-null  int64  
 12  COD_PAIS_DESTINO_ALF           96007 non-null 

In [None]:
# Primero, convertimos las columnas que contienen "FECHA" a datetime
for col in df.columns:
    if 'FECHA' in col.upper():
        df[col] = pd.to_datetime(df[col], errors='coerce', format='%Y%m%d')

# Luego, convertimos el resto de columnas al tipo más apropiado
df = df.astype({
    'NUMERO_SERIE': 'Int64',
    'OFICINA': 'Int64',
    'COD_ADUANA_DESPACHO': 'Int64',
    'ADUANA_DESPACHO': 'string',
    'TIPO_IDENT': 'Int64',
    'NIT_EXPORTADOR': 'Float64',
    'TIPO_USUARIO': 'Int64',
    'COD_USUARIO': 'Int64',
    'CLASE_EXPORTADOR': 'Int64',
    'COD_DPTO_EXPORTADOR': 'Int64',
    'COD_PAIS_DESTINO_NUM': 'Int64',
    'COD_PAIS_DESTINO_ALF': 'string',
    'COD_PAIS_DESTINO': 'string',
    'PAIS_DESTINO_FINAL': 'string',
    'CIUDAD_DESTINATARIO': 'string',
    'NUM_SOLICITUD_AUTO_EMBARQUE': 'Float64',
    'TIPO_DECLARACION': 'Int64',
    'TIPO_DESPACHO': 'string',
    'COD_LUGAR_SALIDA_NUM': 'Int64',
    'COD_LUG_SALIDA_ALF': 'string',
    'COD_REGION_PROCEDENCIA': 'Int64',
    'REGION_PROCEDENCIA': 'string',
    'NUM__DECLA_EXPORTACION_ANT': 'Int64',
    'NUM_DECLARACION_PRECEDENTE': 'Int64',
    'COD_MODALIDAD_PRECEDENTE': 'string',
    'COD_MONEDA_TRANSACCION': 'string',
    'COD_MODO_TRANSPORTE': 'Int64',
    'MODO_TRANSPORTE': 'string',
    'BANDERA': 'Int64',
    'COD_NACIONALIDAD_BANDERA': 'string',
    'NACIONALIDAD_BANDERA': 'string',
    'COD_REGIMEN_CAN': 'Int64',
    'COD_MODALIDAD_EXPORTACION': 'Int64',
    'MODALIDAD_EXPORTACION': 'string',
    'FORMA_PAGO': 'Int64',
    'COD_TIPO_EMBARQUE': 'Int64',
    'TIPO_DE_EMBARQUE': 'string',
    'COD_TIPO_DATOS': 'Int64',
    'TIPO_DE_DATOS': 'string',
    'TIPO_CERTIFICADO_ORIGEN': 'Int64',
    'SISTEMAS_ESPECIALES': 'string',
    'COD_EXPORTACION_TRANSITO': 'string',
    'EXPORTACION_EN_TRANSITO': 'string',
    'SUBPARTIDA': 'Int64',
    'COD_REGION_ORIGEN': 'Int64',
    'REGION_DE_ORIGEN': 'string',
    'COD_UNIDAD_FISICA_NUM': 'Int64',
    'COD_UNIDAD_FISICA_ALF': 'string',
    'UNIDAD_FISICA': 'string',
    'CANTIDAD_UNIDADES_FISICAS': 'Float64',
    'PESO_BRUTO_KGS': 'Float64',
    'PESO_NETO_KGS': 'Float64',
    'VALOR_FOB_USD': 'Float64',
    'VALOR_FOB_PESOS': 'Float64',
    'VLR_SERIE_AGREGADO_NAL_USD': 'Float64',
    'VALOR_SERIE_FLETES_USD': 'Float64',
    'VALOR_SERIE_SEGUROS_USD': 'Float64',
    'VLR_SERIE_OTROS_GASTOS_USD': 'Float64',
    'COD_ADUANA_SALIDA': 'Int64',
    'ADUANA_SALIDA': 'string',
    'NUMERO_FORMULARIO': 'Int64',
    'RAZON_SOCIAL_EXPORTADOR': 'string',
    'DIREC_EXPORTADOR': 'string',
    'NIT_DECLARANTE': 'Float64',
    'RAZON_SOCIAL_DECLARANTE': 'string',
    'RAZON_SOCIAL_DESTINATARIO': 'string',
    'DOMICILIO_DESTINATARIO': 'string'
})

In [28]:
# Ver na por columna
df.isna().sum().sort_values(ascending=False)

COD_MODALIDAD_PRECEDENTE         93483
NIT_EXPORTADOR                     498
DIREC_EXPORTADOR                   498
NIT_DECLARANTE                     146
CIUDAD_DESTINATARIO                 42
NUM_SOLICITUD_AUTO_EMBARQUE         42
DOMICILIO_DESTINATARIO              10
FECHA_PROCESO                        0
TIPO_USUARIO                         0
TIPO_IDENT                           0
ADUANA_DESPACHO                      0
COD_ADUANA_DESPACHO                  0
NUMERO_SERIE                         0
OFICINA                              0
COD_PAIS_DESTINO_NUM                 0
COD_DPTO_EXPORTADOR                  0
PAIS_DESTINO_FINAL                   0
TIPO_DECLARACION                     0
TIPO_DESPACHO                        0
COD_LUGAR_SALIDA_NUM                 0
COD_LUG_SALIDA_ALF                   0
COD_PAIS_DESTINO_ALF                 0
COD_PAIS_DESTINO                     0
COD_USUARIO                          0
NUM__DECLA_EXPORTACION_ANT           0
FECH_DECLA_EXPORTACION_AN

### ❓ ¿Por qué hay valores nulos en algunas variables?

Según el **Fallo del Tribunal Administrativo de Cundinamarca** del **19 de septiembre de 2022**, expediente **No. 25000-23-41-000-2022-00994-00**, aclarado mediante auto del **25 de octubre de 2022**, las bases estadísticas **no incluyen variables que contengan datos personales de identificación y ubicación de personas naturales**.

Por esta razón, algunas variables pueden contener valores nulos. Estas son:

- 🆔 `NIT_EXPORTADOR`
- 📍 `DIREC_EXPORTADOR`
- 🆔 `NIT_DECLARANTE`
- 🌆 `CIUDAD_DESTINATARIO`
- 🏠 `DOMICILIO_DESTINATARIO`
- 📄 `NUM_SOLICITUD_AUTO_EMBARQUE`

> ℹ️ **Nota:** Esta omisión garantiza la protección de datos personales conforme a la normativa vigente en Colombia.

### 📦 ¿Por qué hay valores nulos en `COD_MODALIDAD_PRECEDENTE`?

La columna `COD_MODALIDAD_PRECEDENTE` presenta una alta proporción de valores nulos porque la mayoría de las exportaciones son **regulares, directas y sin operaciones anteriores asociadas**.

A continuación, se muestran ejemplos de cuándo **sí** y **no** aplica una modalidad precedente:

| 💼 **Situación**                                                               | 📋 **¿Hay modalidad precedente?** |
|-------------------------------------------------------------------------------|-----------------------------------|
| Exportación regular de bananos                                               | ❌ No                              |
| Bananos exportados, devueltos, y ahora reexportados                          | ✅ Sí                              |
| Exportación temporal para procesamiento y luego exportación definitiva       | ✅ Sí                              |
| Exportación definitiva directa sin operaciones previas                       | ❌ No                              |

> 📝 **Conclusión:** La `modalidad precedente` se registra **solo cuando existe un historial previo de exportación** relacionado con la misma mercancía.
