## Importando modulos de la Enaho-INEI
Se va a importar la informacion de la encuesta Encuesta Nacional de los Hogares (Enaho) realizado por Inei que se encuentra en sus microdatos http://iinei.inei.gob.pe/microdatos/. Este codigo es una adaptacion y extension de uno creado y presentado en una clase por Angel Guillen y Erick Ore

In [1]:
import pandas as pd
import requests
import time
from zipfile import ZipFile, BadZipfile
import os
from os.path import join
from os import chdir, listdir, rmdir
from shutil import move

Se define todas las Enahos anuales

In [2]:
Enaho_anual = {
    2004: "280", #0
    2005: "281", #1
    2006: "282", #2
    2007: "283", #3 
    2008: "284", #4
    2009: "285", #5
    2010: "279", #6
    2011: "291", #7
    2012: "324", #8
    2013: "404", #9
    2014: "440", #10
    2015: "498", #11
    2016: "546", #12
    2017: "603", #13
    2018: "634", #14
    2019: "687", #15
    2020: "737", #16
    2021: "759" #17
}

Se busca importar algunos modulos en particular. Los mas usuales son los siguientes:

In [3]:
Modulos = ["02", "03", "05"]

Donde el modulo 02 representa las caracteristica de los miembros del hogar, el modulo 03 la educacion y el 05 los ingresos.

### Importando las Enaho

Primero, debido a que no siempre es necesario usar todas las Enahos, se puede seleccionar un set. Esto tambien ayudara a que la importacion de los datos sea mas rapida. Se define como set de las `Enaho anuales` al periodo `2017-2021`

In [4]:
FechaIni = 2019
FechaFin = 2019

Rango = list(range(FechaIni, FechaFin+1))
Enaho_anual = {key: Enaho_anual[key] for key in Rango}

Por corroborar, las siguientes deberian dar los resultados deseados

In [5]:
Enaho_anual

{2019: '687'}

Se separa los `keys` y los `values`

In [6]:
Periodos = list(Enaho_anual.keys())
Encuestas = list(Enaho_anual.values())

La importacion y presentacion de los archivos `.dta` se puede realizar de dos maneras diferentes: (1) tener todos los modulos en cada carpeta correspondiente a su periodo, (2) tener todos los modulos en una unica carpeta.

El codigo mostrado a continuacion corresponde al punto (1), donde el resultado deberia ser muchas carpetas, donde cada una representa un periodo y contiene los modulos seleccionados

In [None]:
periodo = Periodos[0]


for i, n in enumerate(Encuestas):
    
    
    # Creando la carpeta por cada periodo
    try:
        os.makedirs(f"Bases de datos//{str(periodo)}")
    except:
        pass
    
    
    # Iterando cada modulo para cada periodo
    for m in Modulos:
        
        # Haciendo el request con la pagina de INEI
        try:
            r = requests.get(f"http://iinei.inei.gob.pe/iinei/srienaho/descarga/STATA/{n}-Modulo{m}.zip", allow_redirects=True)
        except:
            time.sleep(3)
            r = requests.get(f"http://iinei.inei.gob.pe/iinei/srienaho/descarga/STATA/{n}-Modulo{m}.zip", allow_redirects=True)
        
        # Abriendo el Zip y renombrandolo
        open(f"Bases de datos//{str(periodo)}//Modulo{n}{m}.zip", 'wb').write(r.content)

        # Extrayendo todos los archivos del Zip
        with ZipFile(f"Bases de datos//{str(periodo)}//Modulo{n}{m}.zip", 'r') as file:
            file.extractall(path = f"Bases de datos//{str(periodo)}")

        try:
            # Moviendo los archivos a la ruta
            ruta = join(f"Bases de datos//{str(periodo)}", f"{n}-Modulo{m}")
            
            for filename in listdir(ruta):
                move(join(ruta, filename), join(f"Bases de datos//{str(periodo)}", filename))
                        
            # Eliminando archivos no usados
            rmdir(ruta)
            
        except:
            pass
        
        
        # Eliminando todos los archivos que no son de interes
        for file in listdir(f"Bases de datos//{str(periodo)}"):
            if not file.startswith("enaho01"):
                os.remove(f"Bases de datos//{str(periodo)}//{file}")
            if file.endswith("a.dta"):
                os.remove(f"Bases de datos//{str(periodo)}//{file}")
                            
    periodo += 1

El siguiente codigo es el punto (2) donde todos los modulos de cada periodo estaran en una unica carpeta

In [7]:
for i, n in enumerate(Encuestas):
    
    
    # Creando la carpeta por cada periodo
    try:
        os.makedirs("Bases de datos")
    except:
        pass
    
    
    # Iterando cada modulo para cada periodo
    for m in Modulos:
        
        # Haciendo el request con la pagina de INEI
        try:
            r = requests.get(f"http://iinei.inei.gob.pe/iinei/srienaho/descarga/STATA/{n}-Modulo{m}.zip", allow_redirects=True)
        except:
            time.sleep(3)
            r = requests.get(f"http://iinei.inei.gob.pe/iinei/srienaho/descarga/STATA/{n}-Modulo{m}.zip", allow_redirects=True)
        
        # Abriendo el Zip y renombrandolo
        open(f"Bases de datos//Modulo{n}{m}.zip", 'wb').write(r.content)

        # Extrayendo todos los archivos del Zip
        with ZipFile(f"Bases de datos//Modulo{n}{m}.zip", 'r') as file:
            file.extractall(path = "Bases de datos")

        try:
            # Moviendo los archivos a la ruta
            ruta = join("Bases de datos", f"{n}-Modulo{m}")
            
            for filename in listdir(ruta):
                move(join(ruta, filename), join("Bases de datos", filename))
                        
            # Eliminando archivos no usados
            rmdir(ruta)
            
        except:
            pass
        
        
        # Eliminando todos los archivos que no son de interes
        for file in listdir("Bases de datos"):
            if not file.startswith("enaho01"):
                os.remove(f"Bases de datos//{file}")
            if file.endswith("a.dta"):
                os.remove(f"Bases de datos//{file}")