# EDA - Encuesta Nacional de Consumo de Sustancias Psicoactivas (ENCSPA) 2019
## Análisis Exploratorio de Datos para Predicción de Consumo de Sustancias

### Fuente de los Datos
**Dataset**: Encuesta Nacional de Consumo de Sustancias Psicoactivas (ENCSPA) 2019
- **Institución**: DANE (Departamento Administrativo Nacional de Estadística) - Colombia
- **Población objetivo**: 12 a 65 años en territorio nacional
- **Tamaño de muestra**: 49,756 observaciones válidas
- **Variables**: 98 variables (entorno social, accesibilidad, comportamiento)
- **Propósito**: Caracterización nacional de patrones de consumo de sustancias

### Enfoque del Análisis: Variables Clave para Predicción ML

**VARIABLES OBJETIVO SELECCIONADAS:**
- G_11_F: Consumo de Marihuana (Variable principal - 8.0% prevalencia)
- G_11_G: Consumo de Cocaína (Variable intermedia - 1.96% prevalencia)
- G_11_H: Consumo de Basuco (Variable alto riesgo - 0.62% prevalencia)
- G_13: Uso de Jeringas (Análisis descriptivo - 0.014% prevalencia)

**VARIABLES PREDICTORAS PRINCIPALES:**
- Entorno Social: G_01, G_02 (familiares/amigos consumidores)
- Actitudes: G_03, G_04, G_05 (curiosidad, disposición)
- Accesibilidad: G_06_A-G_06_D (facilidad de acceso)
- Exposición: G_07, G_08_A-G_08_G (ofertas recibidas)

In [7]:
# Importar librerías necesarias
import pandas as pd
import numpy as np
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots
import plotly.figure_factory as ff
import warnings
warnings.filterwarnings('ignore')
df = pd.read_csv('../data/g_capitulos.csv')

In [8]:
# Variables seleccionadas siguiendo metodología del proyecto

# Variables objetivo identificadas (4 variables para diferentes análisis)
target_variables = {
    'principal': 'G_11_F',
    'intermedia': 'G_11_G',
    'alto_riesgo': 'G_11_H',
    'descriptiva': 'G_13'
}

# Variables predictoras categóricas (entorno social + actitudes)
categorical_features = [
    # Entorno Social
    'G_01',  # Familiares consumen sustancias
    'G_02',  # Amigos consumen sustancias  
    
    # Actitudes y Curiosidad
    'G_03',  # Curiosidad por probar
    'G_04',  # Disposición a consumir
    'G_05'   # Tuvo oportunidad de probar
]

# Variables predictoras numéricas (accesibilidad + exposición)
numerical_features = [
    # Cantidad de familiares/amigos
    'G_01_A',  # Cantidad de familiares que consumen
    'G_02_A',  # Cantidad de amigos que consumen
    
    # Accesibilidad (facilidad de acceso)
    'G_06_A',  # Facilidad acceso marihuana
    'G_06_B',  # Facilidad acceso cocaína
    'G_06_C',  # Facilidad acceso basuco
    'G_06_D',  # Facilidad acceso éxtasis
    
    # Exposición (ofertas recibidas)
    'G_07',    # Ofertas recibidas en último año
    'G_08_A',  # Veces que ofrecieron marihuana
    'G_08_B'   # Veces que ofrecieron cocaína
]

# DICCIONARIO DE NOMBRES LEGIBLES PARA GRÁFICOS Y PRINTS
variable_names = {
    # Variables objetivo
    'G_11_F': 'Consumo de Marihuana',
    'G_11_G': 'Consumo de Cocaína', 
    'G_11_H': 'Consumo de Basuco',
    'G_13': 'Uso de Jeringas',
    
    # Variables categóricas (entorno social + actitudes)
    'G_01': 'Familiares Consumen Sustancias',
    'G_02': 'Amigos Consumen Sustancias',
    'G_03': 'Curiosidad por Probar',
    'G_04': 'Disposición a Consumir',
    'G_05': 'Tuvo Oportunidad de Probar',
    
    # Variables numéricas (cantidades + acceso + exposición)
    'G_01_A': 'Cantidad de Familiares que Consumen',
    'G_02_A': 'Cantidad de Amigos que Consumen',
    'G_06_A': 'Acceso Fácil a Marihuana',
    'G_06_B': 'Acceso Fácil a Cocaína',
    'G_06_C': 'Acceso Fácil a Basuco',
    'G_06_D': 'Acceso Fácil a Éxtasis',
    'G_07': 'Ofertas Recibidas (Último Año)',
    'G_08_A': 'Ofertas de Marihuana',
    'G_08_B': 'Ofertas de Cocaína'
}

# Función para obtener nombre legible
def get_readable_name(var_code):
    """Convierte código de variable a nombre legible"""
    return variable_names.get(var_code, var_code)

# Todas las variables para el análisis
all_predictors = categorical_features + numerical_features

print("Variables clave definidas para el proyecto de ML:")
print(f"Variables objetivo: {len(target_variables)}")
print(f"Variables predictoras categóricas: {len(categorical_features)}")
print(f"Variables predictoras numéricas: {len(numerical_features)}")
print(f"Total variables predictoras: {len(all_predictors)}")

print(f"\nVariables objetivo seleccionadas:")
for i, (tipo, var) in enumerate(target_variables.items(), 1):
    print(f"{i}. {get_readable_name(var)} ({tipo})")

print(f"\nVariables predictoras categóricas:")
for i, var in enumerate(categorical_features, 1):
    print(f"   {i}. {get_readable_name(var)}")

print(f"\nVariables predictoras numéricas:")
for i, var in enumerate(numerical_features, 1):
    print(f"   {i}. {get_readable_name(var)}")

print(f"\nEstructura SINCRONIZADA con notebook de preprocesamiento")

Variables clave definidas para el proyecto de ML:
Variables objetivo: 4
Variables predictoras categóricas: 5
Variables predictoras numéricas: 9
Total variables predictoras: 14

Variables objetivo seleccionadas:
1. Consumo de Marihuana (principal)
2. Consumo de Cocaína (intermedia)
3. Consumo de Basuco (alto_riesgo)
4. Uso de Jeringas (descriptiva)

Variables predictoras categóricas:
   1. Familiares Consumen Sustancias
   2. Amigos Consumen Sustancias
   3. Curiosidad por Probar
   4. Disposición a Consumir
   5. Tuvo Oportunidad de Probar

Variables predictoras numéricas:
   1. Cantidad de Familiares que Consumen
   2. Cantidad de Amigos que Consumen
   3. Acceso Fácil a Marihuana
   4. Acceso Fácil a Cocaína
   5. Acceso Fácil a Basuco
   6. Acceso Fácil a Éxtasis
   7. Ofertas Recibidas (Último Año)
   8. Ofertas de Marihuana
   9. Ofertas de Cocaína

Estructura SINCRONIZADA con notebook de preprocesamiento


## ANÁLISIS ESPECÍFICO PARA PREDICCIÓN DE CONSUMO
### Variables Objetivo: Marihuana, Cocaína, Basuco y Uso de Jeringas
### Variables Predictoras: Entorno Social, Actitudes, Accesibilidad y Exposición

**ENFOQUE ESTRATÉGICO:**
- **Marihuana**: Variable principal para modelos de clasificación (8% prevalencia)
- **Cocaína**: Variable intermedia para análisis de riesgo (1.96% prevalencia)
- **Basuco**: Variable de alto riesgo con técnicas para clases desbalanceadas (0.62% prevalencia)
- **Jeringas**: Variable de análisis descriptivo (0.014% prevalencia)

In [11]:
# ANÁLISIS ESPECÍFICO DE VARIABLES OBJETIVO

# Verificar disponibilidad de variables objetivo
variables_objetivo_disponibles = {}
for tipo, var in target_variables.items():
    if var in df.columns:
        variables_objetivo_disponibles[tipo] = var
        print(f"{get_readable_name(var)} ({tipo.upper()}): {var} - Disponible")
    else:
        print(f"{get_readable_name(var)} ({tipo.upper()}): {var} - NO disponible")

print(f"\nVariables objetivo disponibles: {len(variables_objetivo_disponibles)}")

# Calcular prevalencias para variables objetivo
prevalencias_objetivo = {}
for tipo, var in variables_objetivo_disponibles.items():
    prevalencia = (df[var] == 1).mean() * 100
    prevalencias_objetivo[tipo] = prevalencia
    nombre_legible = get_readable_name(var)
    print(f"{nombre_legible}: {prevalencia:.2f}% de prevalencia")

# Gráfico de variables objetivo con nombres legibles
if prevalencias_objetivo:
    # Crear nombres legibles para el gráfico
    nombres_legibles = []
    valores_prevalencia = []
    
    for tipo, prevalencia in prevalencias_objetivo.items():
        var_code = target_variables[tipo]
        nombre_legible = get_readable_name(var_code)
        nombres_legibles.append(nombre_legible)
        valores_prevalencia.append(prevalencia)
    
    fig_objetivo = px.bar(
        x=nombres_legibles,
        y=valores_prevalencia,
        title='Variables Objetivo: Prevalencia de Consumo para Modelos de ML',
        labels={'x': 'Variable Objetivo', 'y': 'Prevalencia de Consumo (%)'},
        color=valores_prevalencia,
        color_continuous_scale='Reds',
        text=[f'{v:.1f}%' for v in valores_prevalencia]
    )
    
    fig_objetivo.update_traces(textposition='outside')
    fig_objetivo.update_layout(
        height=500,
        showlegend=False,
        xaxis_tickangle=-45,
        annotations=[
            dict(
                x=0.5, y=1.1,
                xref='paper', yref='paper',
                text='Variables seleccionadas como TARGET para modelos predictivos',
                showarrow=False,
                font=dict(size=12, color='gray')
            )
        ]
    )
    
    fig_objetivo.show()
else:
    print("No se encontraron variables objetivo en el dataset")

Consumo de Marihuana (PRINCIPAL): G_11_F - Disponible
Consumo de Cocaína (INTERMEDIA): G_11_G - Disponible
Consumo de Basuco (ALTO_RIESGO): G_11_H - Disponible
Uso de Jeringas (DESCRIPTIVA): G_13 - Disponible

Variables objetivo disponibles: 4
Consumo de Marihuana: 8.00% de prevalencia
Consumo de Cocaína: 1.96% de prevalencia
Consumo de Basuco: 0.62% de prevalencia
Uso de Jeringas: 0.01% de prevalencia


In [14]:
# ANÁLISIS DE PODER PREDICTIVO: ENTORNO SOCIAL vs CONSUMO DE MARIHUANA
# Este es el análisis clave para demostrar la viabilidad del modelo de ML

# Variables clave para análisis predictivo
marihuana_var = target_variables['principal']  # G_11_F
familiares_var = categorical_features[0]       # G_01  
amigos_var = categorical_features[1]          # G_02

if marihuana_var in df.columns and familiares_var in df.columns and amigos_var in df.columns:
    
    # Crear tabla cruzada para análisis con nombres legibles
    entorno_consumo = pd.DataFrame({
        get_readable_name(familiares_var): df[familiares_var].map({1: 'Sí', 2: 'No', 9: 'No sabe'}),
        get_readable_name(amigos_var): df[amigos_var].map({1: 'Sí', 2: 'No', 9: 'No sabe'}),
        get_readable_name(marihuana_var): df[marihuana_var].map({1: 'Sí', 2: 'No', 9: 'No sabe'})
    })
    
    # Calcular probabilidades condicionales
    prob_data = []
    
    for fam in ['Sí', 'No']:
        for ami in ['Sí', 'No']:
            subset = entorno_consumo[
                (entorno_consumo[get_readable_name(familiares_var)] == fam) & 
                (entorno_consumo[get_readable_name(amigos_var)] == ami)
            ]
            
            if len(subset) > 10:  # Solo si hay suficientes casos
                prob_consumo = (subset[get_readable_name(marihuana_var)] == 'Sí').mean() * 100
                count = len(subset)
                
                prob_data.append({
                    'Familiares': fam,
                    'Amigos': ami,
                    'Prob_Consumo': prob_consumo,
                    'Casos': count,
                    'Categoria': f"Fam:{fam}, Ami:{ami}"
                })
    
    # Crear gráfico de poder predictivo
    if prob_data:
        df_prob = pd.DataFrame(prob_data)
        
        fig_predictivo = px.bar(
            df_prob,
            x='Categoria',
            y='Prob_Consumo',
            title=f'Poder Predictivo del Entorno Social para {get_readable_name(marihuana_var)}',
            labels={'Categoria': 'Combinación de Entorno Social', 
                   'Prob_Consumo': f'Probabilidad de {get_readable_name(marihuana_var)} (%)'},
            color='Prob_Consumo',
            color_continuous_scale='RdYlBu_r',
            text=[f'{p:.1f}%<br>n={c}' for p, c in zip(df_prob['Prob_Consumo'], df_prob['Casos'])]
        )
        
        fig_predictivo.update_traces(textposition='outside')
        fig_predictivo.update_layout(
            height=500,
            xaxis_tickangle=-45,
            annotations=[
                dict(
                    x=0.5, y=1.15,
                    xref='paper', yref='paper',
                    text='Mayor entorno consumidor = Mayor probabilidad personal',
                    showarrow=False,
                    font=dict(size=12, color='red', style='italic')
                )
            ]
        )
        
        fig_predictivo.show()
        
        # Mostrar estadísticas clave con nombres legibles
        print("ESTADÍSTICAS:")
        for _, row in df_prob.iterrows():
            print(f"- {row['Categoria']}: {row['Prob_Consumo']:.1f}% probabilidad (n={row['Casos']})")
    
else:
    print("Variables de entorno social o marihuana no disponibles para análisis predictivo")

ESTADÍSTICAS:
- Fam:Sí, Ami:Sí: 25.9% probabilidad (n=5318)
- Fam:Sí, Ami:No: 7.1% probabilidad (n=4440)
- Fam:No, Ami:Sí: 17.6% probabilidad (n=8247)
- Fam:No, Ami:No: 2.6% probabilidad (n=31751)


In [15]:
# Cargar el dataset (verificación de carga)
print(f"Dataset cargado correctamente desde: '../data/g_capitulos.csv'")
print(f"Dimensiones del dataset: {df.shape}")
print(f"\nPrimeras 5 filas:")
df.head()

Dataset cargado correctamente desde: '../data/g_capitulos.csv'
Dimensiones del dataset: (49756, 98)

Primeras 5 filas:


Unnamed: 0,G_01,G_01_A,G_02,G_02_A,G_03,G_04,G_05,G_05_A,G_06_A,G_06_B,...,G_14_B,G_14_C,G_14_D,G_14_E,G_14_F,G_14_G,DIRECTORIO,SECUENCIA_ENCUESTA,SECUENCIA_P,ORDEN
0,2,,2,,2,2,2,,9,9,...,,,,,,,1,2,1,2
1,2,,2,,2,2,2,,9,9,...,,,,,,,2,1,1,1
2,2,,2,,2,2,2,,3,3,...,,,,,,,3,1,1,1
3,2,,2,,2,2,2,,9,9,...,,,,,,,4,1,1,1
4,2,,2,,2,2,2,,9,9,...,,,,,,,6,1,1,1


In [16]:
# Información general del dataset
print("Información general:")
df.info()
print(f"\nValores únicos por columna:")
for col in df.columns[:10]:  # Primeras 10 columnas
    print(f"{col}: {df[col].unique()}")

Información general:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 49756 entries, 0 to 49755
Data columns (total 98 columns):
 #   Column              Non-Null Count  Dtype  
---  ------              --------------  -----  
 0   G_01                49756 non-null  int64  
 1   G_01_A              9758 non-null   float64
 2   G_02                49756 non-null  int64  
 3   G_02_A              13565 non-null  float64
 4   G_03                49756 non-null  int64  
 5   G_04                49756 non-null  int64  
 6   G_05                49756 non-null  int64  
 7   G_05_A              13545 non-null  float64
 8   G_06_A              49756 non-null  int64  
 9   G_06_B              49756 non-null  int64  
 10  G_06_C              49756 non-null  int64  
 11  G_06_D              49756 non-null  int64  
 12  G_06_E              49756 non-null  int64  
 13  G_06_F              49756 non-null  int64  
 14  G_06_G              49756 non-null  int64  
 15  G_06_H              49756 non-nu

## 1. Análisis del Entorno Social - Familiares y Amigos Consumidores

In [18]:
# Gráfico 1: Prevalencia de familiares y amigos consumidores

# Variables del entorno social (primeras 2 categóricas)
familiares_var = categorical_features[0]  # G_01
amigos_var = categorical_features[1]      # G_02

entorno_data = {
    'Tipo': [get_readable_name(familiares_var), get_readable_name(amigos_var)],
    'Sí (%)': [
        (df[familiares_var] == 1).mean() * 100,
        (df[amigos_var] == 1).mean() * 100
    ],
    'No (%)': [
        (df[familiares_var] == 2).mean() * 100,
        (df[amigos_var] == 2).mean() * 100
    ]
}

fig1 = go.Figure(data=[
    go.Bar(name='Sí', x=entorno_data['Tipo'], y=entorno_data['Sí (%)'], marker_color='#FF6B6B'),
    go.Bar(name='No', x=entorno_data['Tipo'], y=entorno_data['No (%)'], marker_color='#4ECDC4')
])

fig1.update_layout(
    title='Prevalencia de Consumo en el Entorno Social',
    xaxis_title='Tipo de Relación',
    yaxis_title='Porcentaje (%)',
    barmode='group',
    height=500
)

fig1.show()

## 2. Curiosidad y Disposición al Consumo

In [19]:
# Gráfico 2: Curiosidad vs Disposición a probar sustancias

curiosidad_vars = categorical_features[2:5]  # G_03, G_04, G_05
curiosidad_data = {
    'Pregunta': [get_readable_name(var) for var in curiosidad_vars],
    'Sí (%)': [(df[var] == 1).mean() * 100 for var in curiosidad_vars]
}

fig2 = px.bar(
    x=curiosidad_data['Pregunta'], 
    y=curiosidad_data['Sí (%)'],
    title='Curiosidad y Disposición hacia el Consumo de Sustancias',
    labels={'x': 'Aspecto Evaluado', 'y': 'Porcentaje de Respuestas Positivas (%)'},
    color=curiosidad_data['Sí (%)'],
    color_continuous_scale='Reds'
)

fig2.update_layout(height=500, xaxis_tickangle=-45)
fig2.show()

## 3. Facilidad de Acceso a Diferentes Sustancias

In [20]:
# Gráfico 3: Facilidad de acceso por sustancia

# Variables de accesibilidad (posiciones 2-5 en numerical_features)
acceso_vars = numerical_features[2:6]  # G_06_A, G_06_B, G_06_C, G_06_D

# Agregar variables adicionales de accesibilidad si están disponibles
acceso_adicionales = ['G_06_E', 'G_06_F', 'G_06_G', 'G_06_H', 'G_06_I', 'G_06_J']
for var in acceso_adicionales:
    if var in df.columns:
        acceso_vars.append(var)

# Calcular porcentajes de acceso fácil
acceso_facil = []
nombres_sustancias = []

for var in acceso_vars:
    if var in df.columns:
        facil_pct = (df[var] == 1).mean() * 100  # 1 = "Me sería fácil"
        acceso_facil.append(facil_pct)
        # Usar nombres legibles si están en el diccionario, sino crear nombres descriptivos
        if var in variable_names:
            nombres_sustancias.append(get_readable_name(var))
        else:
            # Crear nombre descriptivo para variables no mapeadas
            sustancia_map = {
                'G_06_E': 'Inhalables', 'G_06_F': 'Popper', 'G_06_G': 'Metanfetaminas',
                'G_06_H': 'Tranquilizantes', 'G_06_I': 'Estimulantes', 'G_06_J': 'Heroína'
            }
            nombres_sustancias.append(sustancia_map.get(var, var))

fig3 = px.bar(
    x=nombres_sustancias,
    y=acceso_facil,
    title='Facilidad de Acceso Percibida por Sustancia',
    labels={'x': 'Sustancia', 'y': 'Porcentaje que considera "Fácil de conseguir" (%)'},
    color=acceso_facil,
    color_continuous_scale='Oranges'
)

fig3.update_layout(height=500, xaxis_tickangle=-45)
fig3.show()

## 4. Consumo Personal por Tipo de Sustancia

In [24]:
# Gráfico 4: Prevalencia de consumo personal

# Variables de consumo personal (empezando por las 4 objetivo principales)
consumo_vars = list(target_variables.values())  # G_11_F, G_11_G, G_11_H, G_13

# Agregar otras variables de consumo si están disponibles
consumo_adicionales = ['G_11_A', 'G_11_B', 'G_11_C', 'G_11_D', 'G_11_E', 'G_11_I', 'G_11_J']
for var in consumo_adicionales:
    if var in df.columns:
        consumo_vars.append(var)

consumo_personal = []
nombres_consumo = []

for var in consumo_vars:
    if var in df.columns:
        consumo_pct = (df[var] == 1).mean() * 100  # 1 = "Sí"
        consumo_personal.append(consumo_pct)
        
        # Usar nombres legibles si están en el diccionario
        if var in variable_names:
            nombres_consumo.append(get_readable_name(var))
        else:
            # Crear nombres descriptivos para variables no mapeadas
            sustancia_map = {
                'G_11_A': 'Tranquilizantes', 'G_11_B': 'Estimulantes', 'G_11_C': 'Inhalables',
                'G_11_D': 'DICK', 'G_11_E': 'Popper', 'G_11_I': 'Éxtasis', 'G_11_J': 'Heroína'
            }
            nombres_consumo.append(sustancia_map.get(var, var))

# Ordenar de mayor a menor
datos_ordenados = sorted(zip(nombres_consumo, consumo_personal), key=lambda x: x[1], reverse=True)
nombres_ord, consumo_ord = zip(*datos_ordenados)

colors = ['#FF6B6B', '#4ECDC4', '#45B7D1', '#96CEB4', '#FFEAA7', 
          '#DDA0DD', '#FFB347', '#87CEEB', '#F0E68C', '#FFA07A', '#98FB98']

fig4 = px.bar(
    x=list(nombres_ord),
    y=list(consumo_ord),
    title='Prevalencia de Consumo Personal por Sustancia (Alguna vez en la vida)',
    labels={'x': 'Sustancia', 'y': 'Porcentaje de Consumidores (%)'},
    color=list(range(len(consumo_ord))),  # Usar índices para colores discretos
    color_discrete_sequence=colors[:len(consumo_ord)],  # Aplicar colores personalizados
    text=[f'{v:.1f}%' for v in consumo_ord]  # Agregar valores en las barras
)

fig4.update_traces(textposition='outside', textfont=dict(size=12, color='black'))
fig4.update_layout(
    height=500, 
    xaxis_tickangle=-45,
    showlegend=False,
    plot_bgcolor='white',
    xaxis=dict(gridcolor='lightgray'),
    yaxis=dict(gridcolor='lightgray')
)
fig4.show()

## 5. Relación entre Entorno Social y Consumo Personal

In [22]:
# Gráfico 5: Matriz de correlación entre entorno, acceso y comportamiento


# Crear variables binarias para análisis de correlación usando nombres legibles
df_analisis = pd.DataFrame()

# Variables categóricas (entorno + actitudes)
for var in categorical_features:
    if var in df.columns:
        nombre_legible = get_readable_name(var)
        df_analisis[nombre_legible] = (df[var] == 1).astype(int)

# Variables numéricas principales (primeras 6 de numerical_features)
numeric_principales = numerical_features[:6]  # Cantidades + accesibilidad principal
for var in numeric_principales:
    if var in df.columns:
        nombre_legible = get_readable_name(var)
        df_analisis[nombre_legible] = (df[var] == 1).astype(int)

# Variables objetivo (las 3 principales)
objetivos_principales = [target_variables['principal'], target_variables['intermedia'], target_variables['alto_riesgo']]
for var in objetivos_principales:
    if var in df.columns:
        nombre_legible = get_readable_name(var)
        df_analisis[nombre_legible] = (df[var] == 1).astype(int)

# Calcular matriz de correlación
if not df_analisis.empty:
    corr_matrix = df_analisis.corr()

    fig5 = px.imshow(
        corr_matrix,
        title='Correlación: Entorno Social, Acceso a Drogas y Comportamiento de Consumo',
        color_continuous_scale='RdBu_r',
        aspect='auto',
        labels=dict(color="Correlación")
    )

    fig5.update_layout(
        height=700,
        width=900,
        annotations=[
            dict(
                x=0.5, y=1.1,
                xref='paper', yref='paper',
                text='Variables predictoras clave para modelos de Machine Learning',
                showarrow=False,
                font=dict(size=12, color='gray')
            )
        ]
    )

    fig5.show()
else:
    print("No se pudieron crear variables para la matriz de correlación")