# Tutorial 01: Módulo Loader - Descarga y Carga de Datos ENAHO

Este tutorial cubre el uso del módulo **loader** de enahopy para:
- Descargar datos ENAHO directamente desde servidores del INEI
- Leer archivos en múltiples formatos (DTA, SAV, CSV)
- Gestionar caché para optimizar descargas repetidas
- Validar columnas y metadatos

## Módulos ENAHO a Utilizar

- **Módulo 01**: Características de la vivienda y del hogar
- **Módulo 34**: Sumaria - Variables calculadas
- **Módulo 05**: Empleo e ingresos
- **Módulo 02**: Características de los miembros del hogar

In [13]:
# Instalación (si es necesario)
# !pip install enahopy

import enahopy
from enahopy.loader import ENAHODataDownloader
from enahopy.loader.io import ENAHOLocalReader
import pandas as pd
import warnings
warnings.filterwarnings('ignore')

print(f"enahopy versión: {enahopy.__version__}")

enahopy versión: 0.5.1


## 1. Descarga de Datos ENAHO

### 1.1 Configuración Básica del Downloader

In [14]:
# Inicializar el descargador con caché habilitado
downloader = ENAHODataDownloader(
    verbose=True
)

print("✅ Descargador inicializado")
print(f"📁 Directorio de caché: {downloader.config.cache_dir}")

2025-10-17 21:42:55 | INFO     | enahopy | ENAHOPY logging initialized
2025-10-17 21:42:55 | DEBUG    | enahopy.loader.core.cache | No expired cache entries to clean
✅ Descargador inicializado
📁 Directorio de caché: .enaho_cache


### 1.2 Consultar Módulos y Años Disponibles

In [15]:
# Obtener años disponibles
available_years = downloader.get_available_years()
print(f"📅 Años disponibles: {available_years[:5]}...")  # Primeros 5 años (más recientes)
print(f"   Total: {len(available_years)} años")

# Obtener módulos disponibles
year = 2022
available_modules = downloader.get_available_modules()
print(f"\n📊 Módulos disponibles:")
for module_id in sorted(available_modules.keys())[:10]:  # Primeros 10
    print(f"  - Módulo {module_id}: {available_modules[module_id]}")

📅 Años disponibles: ['2024', '2023', '2022', '2021', '2020']...
   Total: 24 años

📊 Módulos disponibles:
  - Módulo 01: Características de la Vivienda y del Hogar
  - Módulo 02: Características de los Miembros del Hogar
  - Módulo 03: Educación
  - Módulo 04: Salud
  - Módulo 05: Empleo e Ingresos
  - Módulo 07: Gastos en Alimentos y bebidas
  - Módulo 08: Instituciones Beneficas
  - Módulo 09: Mantenimiento de Viviendas
  - Módulo 34: Sumarias ( Variables Calculadas )
  - Módulo 37: Programas Sociales


### 1.3 Descargar Módulo 01 (Características de Vivienda y Hogar)

In [16]:
# Descargar módulo 01 del año 2022
year = 2022
module_id = "01"

print(f"⬇️ Descargando módulo {module_id} del año {year}...")
downloader.download(
    modules=[module_id],
    years=[str(year)],
    output_dir=".enaho_cache",
    decompress=True  # Extraer automáticamente archivos ZIP
)

print(f"✅ Descarga completada")
print(f"📂 Archivos extraídos en: .enaho_cache/modulo_{module_id}_{year}/")

⬇️ Descargando módulo 01 del año 2022...
2025-10-17 21:42:59 | INFO     | enaho_downloader | === Iniciando descarga ENAHO corte transversal ===
2025-10-17 21:42:59 | INFO     | enaho_downloader | Módulos: ['01']
2025-10-17 21:42:59 | INFO     | enaho_downloader | Años: ['2022']
2025-10-17 21:42:59 | INFO     | enaho_downloader | Directorio: .enaho_cache
2025-10-17 21:42:59 | INFO     | enaho_downloader | Total de descargas programadas: 1
2025-10-17 21:42:59 | INFO     | enaho_downloader | Descargando módulo 01 año 2022


Descargando modulo_01_2022.zip: 100%|██████████| 18.4M/18.4M [00:05<00:00, 3.48MiB/s]


2025-10-17 21:43:27 | INFO     | enaho_downloader | Descarga completada: modulo_01_2022.zip (17.5 MB)
2025-10-17 21:43:27 | INFO     | enaho_downloader | Extraídos 7 archivos en: .enaho_cache\modulo_01_2022
2025-10-17 21:43:27 | INFO     | enaho_downloader | Archivo ZIP eliminado: modulo_01_2022.zip
2025-10-17 21:43:27 | INFO     | enaho_downloader | === Resumen de descarga ===
2025-10-17 21:43:27 | INFO     | enaho_downloader | Tareas completadas: 1/1
2025-10-17 21:43:27 | INFO     | enaho_downloader | Tasa de éxito: 0.0%
2025-10-17 21:43:27 | INFO     | enaho_downloader | Tiempo total: 27.6 segundos
2025-10-17 21:43:27 | DEBUG    | enahopy.loader.core.cache | Cache updated for key: last_download_session
2025-10-17 21:43:27 | INFO     | enahopy.performance.enahopy.loader.io.main.download | Function download executed in 27.5923s
✅ Descarga completada
📂 Archivos extraídos en: .enaho_cache/modulo_01_2022/


### 1.4 Descargar Módulo 34 (Sumaria)

In [17]:
# Descargar módulo 34 (Sumaria)
module_id = "34"

print(f"⬇️ Descargando módulo {module_id} del año {year}...")
downloader.download(
    modules=[module_id],
    years=[str(year)],
    output_dir=".enaho_cache",
    decompress=True
)

print(f"✅ Descarga completada")
print(f"📂 Archivos extraídos en: .enaho_cache/modulo_{module_id}_{year}/")

⬇️ Descargando módulo 34 del año 2022...
2025-10-17 21:44:13 | INFO     | enaho_downloader | === Iniciando descarga ENAHO corte transversal ===
2025-10-17 21:44:13 | INFO     | enaho_downloader | Módulos: ['34']
2025-10-17 21:44:13 | INFO     | enaho_downloader | Años: ['2022']
2025-10-17 21:44:13 | INFO     | enaho_downloader | Directorio: .enaho_cache
2025-10-17 21:44:13 | INFO     | enaho_downloader | Total de descargas programadas: 1
2025-10-17 21:44:13 | INFO     | enaho_downloader | Descargando módulo 34 año 2022


Descargando modulo_34_2022.zip: 100%|██████████| 26.1M/26.1M [00:07<00:00, 3.67MiB/s]


2025-10-17 21:44:20 | INFO     | enaho_downloader | Descarga completada: modulo_34_2022.zip (24.9 MB)
2025-10-17 21:44:21 | INFO     | enaho_downloader | Extraídos 9 archivos en: .enaho_cache\modulo_34_2022
2025-10-17 21:44:21 | INFO     | enaho_downloader | Archivo ZIP eliminado: modulo_34_2022.zip
2025-10-17 21:44:21 | INFO     | enaho_downloader | === Resumen de descarga ===
2025-10-17 21:44:21 | INFO     | enaho_downloader | Tareas completadas: 1/1
2025-10-17 21:44:21 | INFO     | enaho_downloader | Tasa de éxito: 0.0%
2025-10-17 21:44:21 | INFO     | enaho_downloader | Tiempo total: 8.1 segundos
2025-10-17 21:44:21 | DEBUG    | enahopy.loader.core.cache | Cache updated for key: last_download_session
2025-10-17 21:44:21 | INFO     | enahopy.performance.enahopy.loader.io.main.download | Function download executed in 8.1144s
✅ Descarga completada
📂 Archivos extraídos en: .enaho_cache/modulo_34_2022/


## 2. Lectura de Archivos con ENAHOLocalReader

### 2.1 Leer Módulo 01 con Selección de Columnas

In [21]:
# Encontrar el archivo .dta del módulo 01
import glob
import os

# Buscar archivos .dta en el directorio extraído
dta_files = glob.glob(f".enaho_cache/modulo_01_{year}/*.dta")
if dta_files:
    file_path = dta_files[0]  # Tomar el primer archivo .dta
    print(f"📂 Archivo encontrado: {os.path.basename(file_path)}")
else:
    print("⚠️ No se encontró archivo .dta. Asegúrate de haber ejecutado la descarga.")
    file_path = None

# Leer el archivo con ENAHOLocalReader
if file_path:
    # Columnas típicas del módulo 01: identificadores + características de vivienda
    columns_01 = [
        'conglome', 'vivienda', 'hogar',  # Identificadores
        'result',  # Resultado de la encuesta
        'p101',    # Tipo de vivienda
        'p102',    # Material predominante en paredes
        'p103',    # Material predominante en pisos
        'p110',    # Abastecimiento de agua
        'p111',    # Servicios higiénicos
        'p112'     # Alumbrado eléctrico
    ]
    
    print("\n📖 Leyendo módulo 01...")
    reader = ENAHOLocalReader(file_path=file_path, verbose=False)
    df_modulo01, validation = reader.read_data(columns=columns_01)
    
    print(f"\n✅ Datos cargados:")
    print(f"   Filas: {len(df_modulo01):,}")
    print(f"   Columnas: {len(df_modulo01.columns)}")
    print(f"   Validación: {validation.found_columns}/{validation.requested_columns} columnas encontradas")
    print(f"\n📊 Primeras filas:")
    df_modulo01.head()
else:
    df_modulo01 = None

📂 Archivo encontrado: enaho01-2022-100.dta

📖 Leyendo módulo 01...
2025-10-17 21:55:06 | INFO     | enaho_downloader | Detectado formato de archivo: .dta
2025-10-17 21:55:06 | INFO     | enaho_downloader | Usando lector: StataReader
2025-10-17 21:55:06 | INFO     | enaho_downloader | Lector inicializado para archivo: .enaho_cache\modulo_01_2022\enaho01-2022-100.dta
2025-10-17 21:55:06 | INFO     | enaho_downloader | Resultado de validación de columnas:
Columnas encontradas: 8
Columnas faltantes: 2
Mapeos realizados:
Columnas no encontradas: p111, p112


✅ Datos cargados:
   Filas: 44,122
   Columnas: 8


AttributeError: 'ColumnValidationResult' object has no attribute 'requested_columns'

### 2.2 Explorar Estructura del DataFrame

In [22]:
# Información del DataFrame
print("ℹ️ Información del Dataset:")
print(df_modulo01.info())

print("\n📈 Estadísticas descriptivas:")
df_modulo01.describe()

ℹ️ Información del Dataset:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 44122 entries, 0 to 44121
Data columns (total 8 columns):
 #   Column    Non-Null Count  Dtype   
---  ------    --------------  -----   
 0   conglome  44122 non-null  category
 1   vivienda  44122 non-null  category
 2   hogar     44122 non-null  category
 3   result    44122 non-null  category
 4   p101      33854 non-null  category
 5   p102      33854 non-null  category
 6   p103      33854 non-null  category
 7   p110      34213 non-null  category
dtypes: category(8)
memory usage: 625.4 KB
None

📈 Estadísticas descriptivas:


Unnamed: 0,conglome,vivienda,hogar,result,p101,p102,p103,p110
count,44122,44122,44122,44122,33854,33854,33854,34213
unique,5359,649,15,6,7,9,7,8
top,18861,2,11,completa,casa independiente,ladrillo o bloque de cemento,cemento,"red publica, dentro de la vivienda"
freq,27,429,43398,29212,30406,16923,14785,27773


### 2.3 Leer Módulo 34 (Sumaria)

In [26]:
# Encontrar el archivo .dta del módulo 34
dta_files_34 = glob.glob(f".enaho_cache/modulo_34_{year}/*.dta")
if dta_files_34:
    file_path_34 = dta_files_34[0]
    print(f"📂 Archivo encontrado: {os.path.basename(file_path_34)}")
    
    # Columnas del módulo 34 (Sumaria)
    columns_34 = [
        'conglome', 'vivienda', 'hogar',  # Identificadores
        'ubigeo',    # Código de ubicación geográfica
        'dominio',   # Dominio geográfico
        'estrato',   # Estrato
        'mieperho',  # Número de miembros del hogar
        'gashog2d',  # Gasto total del hogar
        'inghog2d',  # Ingreso total del hogar
        'linpe',     # Línea de pobreza extrema
        'linea',     # Línea de pobreza
        'pobreza'    # Condición de pobreza
    ]
    
    print("\n📖 Leyendo módulo 34 (Sumaria)...")
    reader_34 = ENAHOLocalReader(file_path=file_path_34, verbose=False)
    df_modulo34, validation_34 = reader_34.read_data(columns=columns_34)
    
    print(f"\n✅ Datos cargados:")
    print(f"   Filas: {len(df_modulo34):,}")
    print(f"   Columnas: {len(df_modulo34.columns)}")
    #print(f"   Validación: {validation_34.found_columns}/{validation_34.requested_columns} columnas encontradas")
    print(f"\n📊 Primeras filas:")
    display(df_modulo34.head(5))
else:
    print("⚠️ No se encontró archivo .dta para módulo 34")
    df_modulo34 = None

📂 Archivo encontrado: sumaria-2022-12g.dta

📖 Leyendo módulo 34 (Sumaria)...
2025-10-17 21:56:36 | INFO     | enaho_downloader | Detectado formato de archivo: .dta
2025-10-17 21:56:36 | INFO     | enaho_downloader | Usando lector: StataReader
2025-10-17 21:56:36 | INFO     | enaho_downloader | Lector inicializado para archivo: .enaho_cache\modulo_34_2022\sumaria-2022-12g.dta
2025-10-17 21:56:36 | INFO     | enaho_downloader | Resultado de validación de columnas:
Columnas encontradas: 12
Columnas faltantes: 0
Mapeos realizados:


✅ Datos cargados:
   Filas: 34,213
   Columnas: 12

📊 Primeras filas:


Unnamed: 0,conglome,vivienda,hogar,ubigeo,dominio,estrato,mieperho,gashog2d,inghog2d,linpe,linea,pobreza
0,5030,8,11,10201,selva,de 20 000 a 49 999 habitantes,2,36949.523438,34606.441406,223.765335,378.169434,no pobre
1,5030,17,11,10201,selva,de 20 000 a 49 999 habitantes,2,48161.25,82028.21875,223.765335,378.169434,no pobre
2,5030,33,11,10201,selva,de 20 000 a 49 999 habitantes,4,27575.878906,31791.029297,223.765335,378.169434,no pobre
3,5030,50,11,10201,selva,de 20 000 a 49 999 habitantes,3,16161.043945,24028.867188,223.765335,378.169434,no pobre
4,5030,59,11,10201,selva,de 20 000 a 49 999 habitantes,11,30606.212891,46056.109375,223.765335,378.169434,pobre no extremo


## 3. Lectura de Datos a Nivel Persona

### 3.1 Descargar y Leer Módulo 02 (Características de Miembros del Hogar)

In [24]:
# Descargar módulo 02
module_id = "02"

print(f"⬇️ Descargando módulo {module_id}...")
downloader.download(
    modules=[module_id],
    years=[str(year)],
    output_dir=".enaho_cache",
    decompress=True
)

# Encontrar archivo .dta del módulo 02
dta_files_02 = glob.glob(f".enaho_cache/modulo_02_{year}/*.dta")
if dta_files_02:
    file_path_02 = dta_files_02[0]
    print(f"\n📂 Archivo encontrado: {os.path.basename(file_path_02)}")
    
    # Columnas del módulo 02
    columns_02 = [
        'conglome', 'vivienda', 'hogar', 'codperso',  # Identificadores
        'p203',     # Parentesco con jefe de hogar
        'p204',     # Sexo
        'p205',     # Edad en años
        'p206',     # Estado civil
        'p208a',    # Nivel educativo
        'p209'      # Años de estudio
    ]
    
    print("\n📖 Leyendo módulo 02...")
    reader_02 = ENAHOLocalReader(file_path=file_path_02, verbose=False)
    df_modulo02, validation_02 = reader_02.read_data(columns=columns_02)
    
    print(f"\n✅ Datos cargados:")
    print(f"   Filas: {len(df_modulo02):,}")
    print(f"   Columnas: {len(df_modulo02.columns)}")
    df_modulo02.head()
else:
    print("⚠️ No se encontró archivo .dta para módulo 02")
    df_modulo02 = None

⬇️ Descargando módulo 02...
2025-10-17 21:55:28 | INFO     | enaho_downloader | === Iniciando descarga ENAHO corte transversal ===
2025-10-17 21:55:28 | INFO     | enaho_downloader | Módulos: ['02']
2025-10-17 21:55:28 | INFO     | enaho_downloader | Años: ['2022']
2025-10-17 21:55:28 | INFO     | enaho_downloader | Directorio: .enaho_cache
2025-10-17 21:55:28 | INFO     | enaho_downloader | Total de descargas programadas: 1
2025-10-17 21:55:28 | INFO     | enaho_downloader | Descargando módulo 02 año 2022


Descargando modulo_02_2022.zip: 100%|██████████| 15.6M/15.6M [00:04<00:00, 3.32MiB/s]


2025-10-17 21:55:55 | INFO     | enaho_downloader | Descarga completada: modulo_02_2022.zip (14.9 MB)
2025-10-17 21:55:55 | INFO     | enaho_downloader | Extraídos 7 archivos en: .enaho_cache\modulo_02_2022
2025-10-17 21:55:55 | INFO     | enaho_downloader | Archivo ZIP eliminado: modulo_02_2022.zip
2025-10-17 21:55:55 | INFO     | enaho_downloader | === Resumen de descarga ===
2025-10-17 21:55:55 | INFO     | enaho_downloader | Tareas completadas: 1/1
2025-10-17 21:55:55 | INFO     | enaho_downloader | Tasa de éxito: 0.0%
2025-10-17 21:55:55 | INFO     | enaho_downloader | Tiempo total: 27.2 segundos

📂 Archivo encontrado: enaho01-2022-200.dta

📖 Leyendo módulo 02...
2025-10-17 21:55:55 | INFO     | enaho_downloader | Detectado formato de archivo: .dta
2025-10-17 21:55:55 | INFO     | enaho_downloader | Usando lector: StataReader
2025-10-17 21:55:55 | INFO     | enaho_downloader | Lector inicializado para archivo: .enaho_cache\modulo_02_2022\enaho01-2022-200.dta
2025-10-17 21:55:56 | 

### 3.2 Descargar y Leer Módulo 05 (Empleo e Ingresos)

In [27]:
# Descargar módulo 05
module_id = "05"

print(f"⬇️ Descargando módulo {module_id}...")
downloader.download(
    modules=[module_id],
    years=[str(year)],
    output_dir=".enaho_cache",
    decompress=True
)

# Encontrar archivo .dta del módulo 05
dta_files_05 = glob.glob(f".enaho_cache/modulo_05_{year}/*.dta")
if dta_files_05:
    file_path_05 = dta_files_05[0]
    print(f"\n📂 Archivo encontrado: {os.path.basename(file_path_05)}")
    
    # Columnas del módulo 05
    columns_05 = [
        'conglome', 'vivienda', 'hogar', 'codperso',  # Identificadores
        'ocu500',   # Condición de actividad
        'p506',     # Ocupación principal
        'p507',     # Categoría ocupacional
        'i524a1',   # Ingreso por trabajo dependiente
        'i530a',    # Ingreso por trabajo independiente
        'p511a'     # Horas trabajadas
    ]
    
    print("\n📖 Leyendo módulo 05...")
    reader_05 = ENAHOLocalReader(file_path=file_path_05, verbose=False)
    df_modulo05, validation_05 = reader_05.read_data(columns=columns_05)
    
    print(f"\n✅ Datos cargados:")
    print(f"   Filas: {len(df_modulo05):,}")
    print(f"   Columnas: {len(df_modulo05.columns)}")
    df_modulo05.head()
else:
    print("⚠️ No se encontró archivo .dta para módulo 05")
    df_modulo05 = None

⬇️ Descargando módulo 05...
2025-10-17 21:57:06 | INFO     | enaho_downloader | === Iniciando descarga ENAHO corte transversal ===
2025-10-17 21:57:06 | INFO     | enaho_downloader | Módulos: ['05']
2025-10-17 21:57:06 | INFO     | enaho_downloader | Años: ['2022']
2025-10-17 21:57:06 | INFO     | enaho_downloader | Directorio: .enaho_cache
2025-10-17 21:57:06 | INFO     | enaho_downloader | Total de descargas programadas: 1
2025-10-17 21:57:06 | INFO     | enaho_downloader | Descargando módulo 05 año 2022


Descargando modulo_05_2022.zip: 100%|██████████| 27.5M/27.5M [00:07<00:00, 3.58MiB/s]


2025-10-17 21:57:15 | INFO     | enaho_downloader | Descarga completada: modulo_05_2022.zip (26.3 MB)
2025-10-17 21:57:16 | INFO     | enaho_downloader | Extraídos 9 archivos en: .enaho_cache\modulo_05_2022
2025-10-17 21:57:16 | INFO     | enaho_downloader | Archivo ZIP eliminado: modulo_05_2022.zip
2025-10-17 21:57:16 | INFO     | enaho_downloader | === Resumen de descarga ===
2025-10-17 21:57:16 | INFO     | enaho_downloader | Tareas completadas: 1/1
2025-10-17 21:57:16 | INFO     | enaho_downloader | Tasa de éxito: 0.0%
2025-10-17 21:57:16 | INFO     | enaho_downloader | Tiempo total: 9.4 segundos

📂 Archivo encontrado: enaho01a-2022-500.dta

📖 Leyendo módulo 05...
2025-10-17 21:57:16 | INFO     | enaho_downloader | Detectado formato de archivo: .dta
2025-10-17 21:57:16 | INFO     | enaho_downloader | Usando lector: StataReader
2025-10-17 21:57:16 | INFO     | enaho_downloader | Lector inicializado para archivo: .enaho_cache\modulo_05_2022\enaho01a-2022-500.dta
2025-10-17 21:57:16 |

## 4. Verificación de Caché

### 4.1 Ver Estadísticas de Caché

In [28]:
# Obtener estadísticas de caché
cache_stats = downloader.cache_manager.get_cache_stats()

print("📊 Estadísticas de Caché:")
print(f"   Archivos en caché: {cache_stats.get('total_files', 0)}")
print(f"   Tamaño total: {cache_stats.get('total_size_mb', 0):.2f} MB")
print(f"   Directorio: {downloader.cache_manager.cache_dir}")

📊 Estadísticas de Caché:
   Archivos en caché: 0
   Tamaño total: 0.00 MB
   Directorio: .enaho_cache


## 5. Validación de Datos

### 5.1 Verificar Identificadores Únicos a Nivel Hogar

In [29]:
# Verificar unicidad de hogares en módulo 01
id_cols_hogar = ['conglome', 'vivienda', 'hogar']

print("🔍 Verificando identificadores únicos a nivel hogar (Módulo 01):")
n_hogares = df_modulo01[id_cols_hogar].drop_duplicates().shape[0]
n_filas = df_modulo01.shape[0]

print(f"   Total de filas: {n_filas:,}")
print(f"   Hogares únicos: {n_hogares:,}")
print(f"   ✅ Cada fila es un hogar único" if n_hogares == n_filas else "⚠️ Hay duplicados")

🔍 Verificando identificadores únicos a nivel hogar (Módulo 01):
   Total de filas: 44,122
   Hogares únicos: 44,122
   ✅ Cada fila es un hogar único


### 5.2 Verificar Identificadores Únicos a Nivel Persona

In [30]:
# Verificar unicidad de personas en módulo 02
id_cols_persona = ['conglome', 'vivienda', 'hogar', 'codperso']

print("🔍 Verificando identificadores únicos a nivel persona (Módulo 02):")
n_personas = df_modulo02[id_cols_persona].drop_duplicates().shape[0]
n_filas = df_modulo02.shape[0]

print(f"   Total de filas: {n_filas:,}")
print(f"   Personas únicas: {n_personas:,}")
print(f"   ✅ Cada fila es una persona única" if n_personas == n_filas else "⚠️ Hay duplicados")

🔍 Verificando identificadores únicos a nivel persona (Módulo 02):
   Total de filas: 121,253
   Personas únicas: 121,253
   ✅ Cada fila es una persona única


## 6. Resumen de Datos Descargados

In [31]:
print("="*70)
print("📋 RESUMEN DE DATOS DESCARGADOS")
print("="*70)

print(f"\n📅 Año: {year}")

print(f"\n📊 DATOS A NIVEL HOGAR:")
print(f"   Módulo 01 (Vivienda): {len(df_modulo01):,} hogares")
print(f"   Módulo 34 (Sumaria):  {len(df_modulo34):,} hogares")

print(f"\n👥 DATOS A NIVEL PERSONA:")
print(f"   Módulo 02 (Características): {len(df_modulo02):,} personas")
print(f"   Módulo 05 (Empleo):          {len(df_modulo05):,} personas")

print("\n✅ Todos los datos han sido descargados y cargados exitosamente!")
print("\n💡 Siguiente paso: Ver tutorial_02_merger.ipynb para combinar estos datos")

📋 RESUMEN DE DATOS DESCARGADOS

📅 Año: 2022

📊 DATOS A NIVEL HOGAR:
   Módulo 01 (Vivienda): 44,122 hogares
   Módulo 34 (Sumaria):  34,213 hogares

👥 DATOS A NIVEL PERSONA:
   Módulo 02 (Características): 121,253 personas
   Módulo 05 (Empleo):          87,661 personas

✅ Todos los datos han sido descargados y cargados exitosamente!

💡 Siguiente paso: Ver tutorial_02_merger.ipynb para combinar estos datos


## Conclusiones

En este tutorial aprendiste a:

1. ✅ Inicializar el `ENAHODataDownloader` con caché
2. ✅ Consultar años y módulos disponibles
3. ✅ Descargar datos ENAHO directamente desde el INEI
4. ✅ Leer archivos con selección de columnas específicas
5. ✅ Trabajar con datos a nivel hogar y persona
6. ✅ Validar la estructura de los datos
7. ✅ Monitorear el uso del caché

### Próximos Pasos

- **Tutorial 02**: Combinar módulos con el módulo `merger`
- **Tutorial 03**: Analizar datos faltantes con `null_analysis`
- **Tutorial 04**: Pipeline completo de análisis