## Estimación de pobreza de vivienda de acuerdo con Evalúa CDMX

El siguiente script descarga los microdatos de la ENIGH, procesa la información y estima la pobreza de vivienda en la Ciudad de México para los años 2018, 2020 y 2022. La estimación se realiza de acuerdo con la metodología de Evalúa CDMX. https://www.evalua.cdmx.gob.mx/medicion-de-la-pobreza-desigualdad-e-indice-de-desarrollo-social/medicion-de-la-pobreza-2018-2022

In [7]:
##Estimación de pobreza de vivienda de acuerdo con Evalúa CDMX
#Se borra todo lo que se encuentra en el entorno

rm(list=ls())

# Librerías ====
if(!require('pacman')) install.packages('pacman')
pacman::p_load(tidyverse, srvyr, gt)

### Descarga de microdatos de ENIGH

In [8]:
# Definir URL base y parte intermedia
url_basica <- "https://www.inegi.org.mx/contenidos/programas/enigh/nc/"
segunda_parte <- "microdatos/enigh"

# Definir los años y los tipos de archivos a descargar
years <- c("2018", "2020", "2022", "2024")
tipos <- c("ns_viviendas", "ns_poblacion")  # Tipos de archivos

# Crear la carpeta de destino si no existe
if (!dir.exists("data")) {
  dir.create("data")
}

# Descargar, descomprimir y renombrar los archivos
for (year in years) {
  for (tipo in tipos) {
    # Construir URL y nombres de archivo
    url <- paste0(url_basica, year, "/", segunda_parte, year, "_", tipo, "_csv.zip")
    zip_destfile <- paste0("data/", year, "_", tipo, ".zip")

    # Descargar solo si el archivo no existe
    if (!file.exists(zip_destfile)) {
      download.file(url, destfile = zip_destfile, mode = "wb")
    } else {
      message("Archivo ya descargado: ", zip_destfile)
    }

    # Extraer archivos en una subcarpeta específica
    extract_dir <- paste0("data/", year, "_", tipo)
    if (!dir.exists(extract_dir)) {
      dir.create(extract_dir)
    }

    unzip(zip_destfile, exdir = extract_dir)

    # Buscar el archivo CSV dentro de la carpeta extraída
    extracted_files <- list.files(extract_dir, pattern = "\\.csv$", full.names = TRUE)

    if (length(extracted_files) == 1) {
      # Determinar el nuevo nombre con formato adecuado
      new_name <- paste0("data/", tipo, "_", year, ".csv")

      # Mover el archivo al directorio principal y renombrarlo
      file.rename(extracted_files, new_name)

      message("Archivo renombrado y movido: ", new_name)
    } else {
      message("Error: No se encontró un archivo CSV único en ", extract_dir)
    }
  }
}


Archivo ya descargado: data/2018_ns_viviendas.zip

Archivo renombrado y movido: data/ns_viviendas_2018.csv

Archivo ya descargado: data/2018_ns_poblacion.zip

Archivo renombrado y movido: data/ns_poblacion_2018.csv

Archivo ya descargado: data/2020_ns_viviendas.zip

Archivo renombrado y movido: data/ns_viviendas_2020.csv

Archivo ya descargado: data/2020_ns_poblacion.zip

Archivo renombrado y movido: data/ns_poblacion_2020.csv

Archivo ya descargado: data/2022_ns_viviendas.zip

Archivo renombrado y movido: data/ns_viviendas_2022.csv

Archivo ya descargado: data/2022_ns_poblacion.zip

Archivo renombrado y movido: data/ns_poblacion_2022.csv

Archivo ya descargado: data/2024_ns_viviendas.zip

Archivo renombrado y movido: data/ns_viviendas_2024.csv

Archivo ya descargado: data/2024_ns_poblacion.zip

Archivo renombrado y movido: data/ns_poblacion_2024.csv



### Función de estimación de pobreza de vivienda

In [9]:
estima_pobreza_vivi <- function(year, variable) {

#Procesar vivienda
  vivienda <- read_csv(paste0("data/ns_viviendas_", year, ".csv"), show_col_types = FALSE) %>%
  #Paredes
    mutate(
      Mj = as.numeric(mat_pared),
      AMj = case_when(
        Mj %in% c(1, 2) ~ 0,
        Mj > 2 & Mj < 6 ~ 0.25,
        Mj %in% c(6, 7) ~ 0.6,
        Mj == 8 ~ 1,
        TRUE ~ 0
      ),
 #Techos
      Tj = as.numeric(mat_techos),
      ATj = case_when(
        Tj %in% c(1, 2) ~ 0,
        Tj > 2 & Tj < 9 ~ 0.5,
        Tj %in% c(9, 10) ~ 1,
        TRUE ~ 0
      ),

 #Pisos
      Pj = as.numeric(mat_pisos),
      APj = case_when(
        Pj %in% c(0, 1) ~ 0,
        Pj == 2 ~ 0.5,
        Pj == 3 ~ 1,
        TRUE ~ NA_real_
      ),
  #Índice compuesto de calidad de la vivienda
      ACVj = (APj * 0.15) + (AMj * 0.55) + (ATj * 0.30),

   #Espacio disponible en la vivienda
      CTj = num_cuarto,
      Dhj = cuart_dorm,
      KEhj = case_when(
        cocina == "2" ~ 0,
        cocina == "1" & cocina_dor == "1" ~ 0.6,
        cocina == "1" & cocina_dor == "2" ~ 1,
        TRUE ~ 0
      ),
      CMj = CTj - (Dhj + KEhj),

  #Norma de cuartos para viviendas unipersonales
      CTj_N1 = ifelse(tot_resid == 1, 1, 0),

    #Norma de dormitorios y adecuación
      Dh_N = tot_resid / 2,
      ADh = Dhj / Dh_N,
      CMj_N = tot_resid / 4,
      DEh_N = (0.5) + Dh_N + (CMj_N * 1.5),
      DEh = (KEhj * 0.5) + Dhj + (CMj * 1.5),
   #Adecuación de espacios de la vivienda
      AEVh = ifelse(tot_resid == 1, CTj / CTj_N1, DEh / DEh_N),
      AEVh_P = case_when(
        AEVh > 1 ~ 1 + ((AEVh - 1) / 2),
        TRUE ~ AEVh
      ),
      AEVh_P = pmin(AEVh_P, 2),
      HMDh = 1 - AEVh_P,

   #############
    #Variable creada por IPDP para identificar únicamente el hacinamiento
    #La norma de HMDh es 0, por lo que se considera hacinamiento si es mayor a 0
    hacina = case_when(
          HMDh > 0 ~ 1,
            TRUE ~ 0
        ),
#########



   #Consolidado de cantidad y calidad de la vivienda
      ACEVj = ACVj * AEVh_P,
      CCEVj = 1 - ACEVj
    )%>%

   #Seleccionar las variables requeridas
    {
      if(year < 2022) select(., folioviv, AMj, ATj, APj, ACVj, CTj, Dhj, KEhj, CMj, CTj_N1, Dh_N, ADh, CMj_N, DEh_N, DEh, AEVh, AEVh_P, HMDh, ACEVj, CCEVj, factor, upm, est_dis,hacina) else
        select(., folioviv, AMj, ATj, APj, ACVj, CTj, Dhj, KEhj, CMj, CTj_N1, Dh_N, ADh, CMj_N, DEh_N, DEh, AEVh, AEVh_P, HMDh, ACEVj, CCEVj, hacina)}

vivihog<-vivienda%>%
   #Seleccionar las variables requeridas
    {
      if(year < 2022) select(., folioviv,  hacina) else
        select(., folioviv, hacina)}


  pob <- read_csv(paste0("data/ns_poblacion_", year, ".csv"), show_col_types = FALSE) %>%
    janitor::clean_names() %>%

    # Filtrar parentescos que no pertenecen al nucleo familiar
    filter(!(parentesco >= 400 & parentesco < 500) & !(parentesco >= 700 & parentesco < 800)) %>%

    #Crear clave de entidad
    mutate(
      cve_ent = case_when(
        nchar(folioviv) == 9 ~ paste0("0", substr(folioviv, 1, 1)),
        nchar(folioviv) == 10 ~ substr(folioviv, 1, 2)
      )
    ) %>%
    #Pegar vivienda
    left_join(vivienda, by = "folioviv") %>%

    #Crear estratos de calidad de espacio de la vivienda
    mutate(
      E_ccevj = case_when(
        CCEVj <= -0.5 ~ 6,
        CCEVj > -0.5 & CCEVj <= -0.1 ~ 5,
        CCEVj > -0.1 & CCEVj <= 0 ~ 4,
        CCEVj > 0 & CCEVj <= (1/3) ~ 3,
        CCEVj > (1/3) & CCEVj <= 0.5 ~ 2,
        CCEVj > 0.5 & CCEVj <= 1 ~ 1,
        TRUE ~ NA_real_
      ),
      #Crear variables de pobreza de vivienda
      pobreza_ccevj = ifelse(E_ccevj >= 4, 0, 1),
      pobre_ext_ccevj = ifelse(E_ccevj >= 3, 0, 1),
      year = year
    )


#Diseño muestral
  diseno <- pob %>%
    as_survey_design(
      ids = upm,
      strata = est_dis,
      weights = factor,
      nest = TRUE
    )


  pobrezavivi <- diseno %>%
    filter(cve_ent == "09") %>%
    group_by(pobreza_ccevj) %>%
    summarise(
      pob = survey_total(vartype = "cv"),
      porcentaje = survey_prop(vartype = "cv")
    ) %>%
    mutate(porcentaje = porcentaje * 100, year = year)%>%
    filter(pobreza_ccevj == 1)

hacinamiento<-diseno %>%
    filter(cve_ent == "09") %>%
    group_by(hacina) %>%
    summarise(
      pob = survey_total(vartype = "cv"),
      porcentaje=survey_prop(vartype = "cv")
    ) %>%
    mutate(porcentaje = porcentaje * 100,
    year = year,
    )%>%filter(hacina == 1)


hacinamiento_hog<-diseno %>%
    filter(cve_ent == "09") %>%
    filter(parentesco==101)%>%
    group_by(hacina) %>%
    summarise(
      hogares = survey_total(vartype = "cv"),
      porcentaje=survey_prop(vartype = "cv")
    ) %>%
    mutate(porcentaje = porcentaje * 100,
    year = year,
    )%>%filter(hacina == 1)


#Estimaciones de acuerdo a variable solicitada

if (variable == "pobreza_vivi"){
  return(pobrezavivi)
} else if (variable == "hacinamiento"){
  return(hacinamiento)
}
else if (variable == "hacinamiento_hog"){
  return(hacinamiento_hog)
}
else {
  return("Variable no reconocida")
}
}

### Estimar pobreza de vivienda para 2018, 2020 y 2022

In [10]:
tabla_pobreza <- map_dfr(years, estima_pobreza_vivi, variable = "pobreza_vivi")
tabla_pobreza

"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for details,
e.g.:
  dat <- vroom(...)
  problems(dat)"
"[1m[22mOne or more parsing issues, call `problems()` on your data frame for deta

pobreza_ccevj,pob,pob_cv,porcentaje,porcentaje_cv,year
<dbl>,<dbl>,<dbl>,<dbl>,<dbl>,<chr>
1,4510741,0.04025664,49.04972,0.0287311,2018
1,4445936,0.03849353,48.11284,0.02889217,2020
1,3968378,0.04693254,42.65005,0.03663865,2022
1,4043199,0.0425838,43.2633,0.03343185,2024


In [11]:
tabla_pobreza %>%
  select(-pobreza_ccevj) %>%
  rename(
    Año           = year,
    Personas      = pob,
    Personas_cv   = pob_cv,
    Porcentaje    = porcentaje,
    Porcentaje_cv = porcentaje_cv
  ) %>%
  relocate(Año, .before = Personas) %>%
  gt() %>%
  # textos de la segunda fila de encabezados
  cols_label(
    Personas      = "Valor",
    Personas_cv   = "Coeficiente de variación",
    Porcentaje    = "Valor",
    Porcentaje_cv = "Coeficiente de variación"
  ) %>%
  tab_spanner("Personas",   id = "sp_personas",   columns = c(Personas, Personas_cv)) %>%
  tab_spanner("Porcentaje", id = "sp_porcentaje", columns = c(Porcentaje, Porcentaje_cv)) %>%

  # --- Poppins + centrado ---
  opt_table_font(font = list(google_font("Poppins"), default_fonts())) %>%   # fuente
  tab_options(
    heading.align = "center",
    table.align   = "center",
    table.font.size = px(14),
    table.background.color = "white",
    table.border.top.color = "white",
    table.border.bottom.color = "white",
    data_row.padding = px(3),
    column_labels.font.weight = "bold",
    column_labels.border.top.color = "black",
    column_labels.border.bottom.color = "black",
    column_labels.border.bottom.width = px(2),
    table_body.hlines.color = "lightgrey",
    table_body.hlines.width = px(0.5),
    table_body.border.bottom.color = "black",
    table_body.border.bottom.width = px(2),
    source_notes.font.size = px(10),
    source_notes.padding = px(1)
  ) %>%
  # centrar celdas, labels y spanners
  cols_align(align = "center", columns = everything()) %>%
  tab_style(
    style = cell_text(align = "center"),
    locations = list(
      cells_column_labels(columns = everything()),
      cells_column_spanners(spanners = everything())
    )
  ) %>%

  fmt_number(columns = c(Personas, Personas_cv, Porcentaje, Porcentaje_cv), decimals = 2) %>%
  tab_header(
    title = md("**Pobreza de vivienda en CDMX**"),
    subtitle = md("**Personas en pobreza de vivienda (%)**")
  ) %>%
  tab_source_note(md("Nota: Resultados preliminares de acuerdo con la metodología de Evalúa CDMX")) %>%
  tab_source_note(md("Fuente: @claudiodanielpc con información de INEGI. Encuesta Nacional de Ingresos y Gastos de los Hogares (ENIGH)")) %>%
  gtsave("pobreza_vivienda.png")