In [50]:
if(! require('pacman')) install.packages('pacman')
pacman::p_load(tidyverse, srvyr, janitor, stringr, readxl, writexl)

In [10]:
# Función para descomprimir los archivos ZIP y extraer todos los CSV
descomprimir_capas <- function(ruta_zip, carpeta_destino) {

options(timeout = 9000)

  unzip(ruta_zip, exdir = carpeta_destino)
  
  archivos <- list.files(carpeta_destino, full.names = TRUE)
  print('Archivos extraídos del zip principal:')
  print(archivos)

  zip_files <- archivos[grepl("\\.zip$", archivos)]
  
  if (length(zip_files) > 0) {
    carpeta_2 <- file.path(carpeta_destino, "datos")
    dir.create(carpeta_2, showWarnings = FALSE)

    for (zip in zip_files) {
      unzip(zip, exdir = carpeta_2)
    }

    archivos_2 <- list.files(carpeta_2, full.names = TRUE)

    csv_files <- archivos_2[grepl("^ENSU_CB_\\d{4}\\.csv$", basename(archivos_2))]

    if (length(csv_files) > 0) {
      return(csv_files)
    }
  }
  
  return(NULL)
}

In [11]:
#Definición de directorio, años y url
dir.create('microdatos_ensu/', showWarnings = FALSE)
url_base <- 'https://www.inegi.org.mx/contenidos/programas/ensu/microdatos/ensu_bd_'
years <- c(2021:2024)
data_list <- list()

In [12]:
# Descargar y procesar los datos por año y trimestre
for (year in years) {
  fin <- '_csv.zip'
  destfile <- paste0('microdatos_ensu/', year, fin)
  folder <- paste0('microdatos_ensu/', year)
  
  dir.create(folder, showWarnings = FALSE)

  download.file(paste0(url_base, year, fin), destfile, mode = 'wb')
  
  archivos_csv <- descomprimir_capas(destfile, folder)
  
  if (!is.null(archivos_csv)) {
    data_list[[as.character(year)]] <- list()  # Crear una sublista por año
    
    for (file in archivos_csv) {
      print(paste('Leyendo archivo:', file))
      
      datos <- read_csv(file, show_col_types = FALSE)
      
      # Par leer los csv para bo_efectivo, leer solo las tablas con ENSU_CB_MMYY.csv
      trimestre <- case_when(
        grepl("03\\d{2}", basename(file)) ~ "T1",
        grepl("06\\d{2}", basename(file)) ~ "T2",
        grepl("09\\d{2}", basename(file)) ~ "T3",
        grepl("12\\d{2}", basename(file)) ~ "T4",
        TRUE ~ "Desconocido"
      )
      
      data_list[[as.character(year)]][[trimestre]] <- datos
      
    }
  } else {
    message('No se encontraron archivos CSV ENSU_CB_ para el año ', year)
  }
}


[1] "Archivos extraídos del zip principal:"
[1] "microdatos_ensu/2021/datos"                          
[2] "microdatos_ensu/2021/ensu_bd_diciembre_2021_csv.zip" 
[3] "microdatos_ensu/2021/ensu_bd_junio_2021_csv.zip"     
[4] "microdatos_ensu/2021/ensu_bd_septiembre_2021_csv.zip"
[1] "Leyendo archivo: microdatos_ensu/2021/datos/ENSU_CB_0621.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Leyendo archivo: microdatos_ensu/2021/datos/ENSU_CB_0921.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"


[1] "Leyendo archivo: microdatos_ensu/2021/datos/ENSU_CB_1221.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Archivos extraídos del zip principal:"
[1] "microdatos_ensu/2022/datos"                          
[2] "microdatos_ensu/2022/ensu_bd_diciembre_2022_csv.zip" 
[3] "microdatos_ensu/2022/ensu_bd_junio_2022_csv.zip"     
[4] "microdatos_ensu/2022/ensu_bd_marzo_2022_csv.zip"     
[5] "microdatos_ensu/2022/ensu_bd_septiembre_2022_csv.zip"
[1] "Leyendo archivo: microdatos_ensu/2022/datos/ENSU_CB_0322.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Leyendo archivo: microdatos_ensu/2022/datos/ENSU_CB_0622.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Leyendo archivo: microdatos_ensu/2022/datos/ENSU_CB_0922.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"


[1] "Leyendo archivo: microdatos_ensu/2022/datos/ENSU_CB_1222.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Archivos extraídos del zip principal:"
[1] "microdatos_ensu/2023/datos"                          
[2] "microdatos_ensu/2023/ensu_bd_diciembre_2023_csv.zip" 
[3] "microdatos_ensu/2023/ensu_bd_junio_2023_csv.zip"     
[4] "microdatos_ensu/2023/ensu_bd_marzo_2023_csv.zip"     
[5] "microdatos_ensu/2023/ensu_bd_septiembre_2023_csv.zip"
[1] "Leyendo archivo: microdatos_ensu/2023/datos/ENSU_CB_0323.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Leyendo archivo: microdatos_ensu/2023/datos/ENSU_CB_0623.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`


[1] "Leyendo archivo: microdatos_ensu/2023/datos/ENSU_CB_0923.csv"


[1m[22mNew names:
[36m•[39m `` -> `...1`
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"


[1] "Leyendo archivo: microdatos_ensu/2023/datos/ENSU_CB_1223.csv"
[1] "Archivos extraídos del zip principal:"
[1] "microdatos_ensu/2024/datos"                          
[2] "microdatos_ensu/2024/ensu_bd_diciembre_2024_csv.zip" 
[3] "microdatos_ensu/2024/ensu_bd_junio_2024_csv.zip"     
[4] "microdatos_ensu/2024/ensu_bd_marzo_2024_csv.zip"     
[5] "microdatos_ensu/2024/ensu_bd_septiembre_2024_csv.zip"
[1] "Leyendo archivo: microdatos_ensu/2024/datos/ENSU_CB_0324.csv"
[1] "Leyendo archivo: microdatos_ensu/2024/datos/ENSU_CB_0624.csv"
[1] "Leyendo archivo: microdatos_ensu/2024/datos/ENSU_CB_0924.csv"


"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"


[1] "Leyendo archivo: microdatos_ensu/2024/datos/ENSU_CB_1224.csv"


In [13]:
datos <- archivos_csv %>% lapply(read_csv)

[1mRows: [22m[34m24022[39m [1mColumns: [22m[34m145[39m
[36m──[39m [1mColumn specification[22m [36m────────────────────────────────────────────────────────[39m
[1mDelimiter:[22m ","
[31mchr[39m  (22): ID_VIV, ID_PER, UPM, VIV_SEL, R_SEL, CVE_ENT, NOM_ENT, CVE_MUN, N...
[32mdbl[39m (123): H_MUD, S_MUD, N_ENT, SEXO, EDAD, BP1_1, BP1_2_01, BP1_2_02, BP1_2...

[36mℹ[39m Use `spec()` to retrieve the full column specification for this data.
[36mℹ[39m Specify the column types or set `show_col_types = FALSE` to quiet this message.
[1mRows: [22m[34m24114[39m [1mColumns: [22m[34m149[39m
[36m──[39m [1mColumn specification[22m [36m────────────────────────────────────────────────────────[39m
[1mDelimiter:[22m ","
[31mchr[39m  (21): ID_VIV, ID_PER, UPM, VIV_SEL, R_SEL, ID_VIVT, ID_PERT, CVE_ENT, N...
[32mdbl[39m (128): H_MUD, S_MUD, N_ENT, SEXO, EDAD, BP1_1, BP1_2_01, BP1_2_02, BP1_2...

[36mℹ[39m Use `spec()` to retrieve the full column specification for

In [65]:
variables <- list() #Lista para filtrar y seleccionar las variables que necesitamos para bog_efec
PobTot <- list() #Lista para vaciar valores de pob_total
GobEfectivo <- list() #Lista para vaciar los valores de gob_efect

In [66]:
for(i in seq_along(datos)) {
    variables[[i]] <- datos[[i]] %>%
    clean_names() %>%
      select(edad, upm, viv_sel, cve_ent, cve_mun, nom_cd, r_def, bp3_2, fac_sel) %>%
      filter(cve_ent == '09', edad >= 18) %>% 
      mutate(fecha = str_sub(basename(archivos_csv[[i]]), 9, 12))

    PobTot[[i]] <- variables[[i]] %>%
      group_by(cve_mun, nom_cd, fecha) %>%
      summarise(pob_total = sum(fac_sel, na.rm = TRUE), .groups = 'drop')

    GobEfectivo[[i]] <- variables[[i]] %>%
      filter(bp3_2 %in% c(1,2)) %>%
      group_by(cve_mun, nom_cd, fecha) %>%
      summarise(efectivo = sum(fac_sel, na.rm = TRUE), .groups = 'drop')

}


In [74]:
tablas <- list()  # Lista para almacenar las tablas previamente definidas


In [75]:

for (i in seq_along(PobTot)) {

    tablas[[i]] <- left_join(PobTot[[i]], GobEfectivo[[i]], by = c('nom_cd', 'fecha')) %>%
    mutate(porcent = efectivo * 100 / pob_total) %>%
    mutate(fecha = paste0('01', fecha), fecha = dmy(fecha)) %>%
    mutate(fecha = format(as.Date(fecha), '%m-%Y')) %>%
    select(fecha, nom_cd, pob_total, efectivo, porcent)
        
}


In [76]:
dataframes_alcaldias <- list()

for (i in seq_along(tablas)) {
    alcaldias <- unique(tablas[[i]]$nom_cd)
    
    for (alcaldia in alcaldias) {
        df_alcaldia <- tablas[[i]] %>% filter(nom_cd == alcaldia)

        if (!is.null(dataframes_alcaldias[[alcaldia]])) {
            dataframes_alcaldias[[alcaldia]] <- bind_rows(dataframes_alcaldias[[alcaldia]], df_alcaldia)
        } else {
            dataframes_alcaldias[[alcaldia]] <- df_alcaldia
        }
    }
}

In [77]:
#Guardar los csv para subirlos (después) al sistema de indicadores
dir.create('microdatos_ensu/resultados_alcaldias', showWarnings = FALSE)  # Crear carpeta

for (year in names(data_list)) {
    for (trimestre in names(data_list[[year]])) {
        for (alcaldia in names(dataframes_alcaldias)) {
            write.csv(dataframes_alcaldias[[alcaldia]], 
                      file = paste0('microdatos_ensu/resultados_alcaldias/', 
                                    alcaldia, '_', year, '_', trimestre, '.csv'), 
                      row.names = FALSE)
        }
    }
}
