In [6]:
import sys
import os

project_root = os.path.abspath('..')
if project_root not in sys.path:
    sys.path.append(project_root)
 
%load_ext autoreload
%autoreload 2

The autoreload extension is already loaded. To reload it, use:
  %reload_ext autoreload


In [19]:
import pandas as pd
import numpy as np

import matplotlib.pyplot as plt

from proyeccion_rdr.produccion.a00_poblaciones_ine_fonasa import procesar_poblaciones

plt.rcParams['figure.figsize'] = (12, 6)
pd.set_option('display.max_columns', None)

In [20]:
RUTA_INE = "../data/processed/df_ine.csv"
RUTA_FONASA = "../data/processed/df_fonasa.csv"
QUERY_STRINGS_INE = {
    "todos": "",  # Todo el pais
    "hombres": "hombre_mujer == 1",  # Hombres
    "mujeres": "hombre_mujer == 2",  # Mujeres
    "recien_nacidos_vivos_hombres": "Edad == 0 and hombre_mujer == 1",  # Recien Nacidos Vivos Hombres
    "recien_nacidos_vivos": "Edad == 0",  # Recien Nacidos Vivos
    "entre_1_y_14": "Edad >= 1 and Edad <= 14",  # Entre 1 y 14 anios de edad
    "entre_15_y_18": "Edad >= 15 and Edad <= 18",  # Entre 15 y 18 anios de edad
    "entre_0_y_19": "Edad <= 19",  # Entre los 0 y 19 anios
}
QUERY_STRINGS_FONASA = {
    "todos": "",  # Todo el pais
    "hombres": "SEXO == 'HOMBRE'",  # Hombres
    "mujeres": "SEXO == 'MUJER'",  # Mujeres
    "recien_nacidos_vivos_hombres": "EDAD_TRAMO == 0 and SEXO == 'HOMBRE'",  # RNV Hombres
    "recien_nacidos_vivos": "EDAD_TRAMO == 0",  # Recien Nacidos Vivos (Incluye los de 1 y 2 anios)
    "entre_1_y_14": "EDAD_TRAMO < 15",  # Entre 0 y 14 anios de edad
    "entre_15_y_18": "EDAD_TRAMO == 15",  # Entre 15 y 19 anios
    "entre_0_y_19": "EDAD_TRAMO < 20",  # Entre 0 y 19 anios
}

COMUNAS_SSMC = [
    "Cerrillos",
    "Estación Central",
    "Maipú",
    "Santiago",
]

COMUNAS_SSMN = [
    "Colina",
    "Conchalí",
    "Huechuraba",
    "Independencia",
    "Lampa",
    "Quilicura",
    "Recoleta",
    "Tiltil",
]

COMUNAS_SSMO = [
    "Isla De Pascua",
    "La Reina",
    "Las Condes",
    "Lo Barnechea",
    "Macul",
    "Ñuñoa",
    "Peñalolén",
    "Providencia",
    "Vitacura",
]

COMUNAS_SSMOC = [
    "Cerro Navia",
    "Lo Prado",
    "Melipilla",
    "Peñaflor",
    "Pudahuel",
    "Quinta Normal",
    "Renca",
    "Talagante",
]

COMUNAS_SSMS = [
    "Buin",
    "Calera De Tango",
    "El Bosque",
    "La Cisterna",
    "Lo Espejo",
    "Paine",
    "Pedro Aguirre Cerda",
    "San Bernardo",
    "San Joaquín",
    "San Miguel",
]

COMUNAS_SSMSO = [
    "La Florida",
    "La Granja",
    "La Pintana",
    "Pirque",
    "Puente Alto",
    "San José De Maipo",
    "San Ramón",
]

COMUNAS_RM_SIN_SS = [
    "Alhué",
    "Curacaví",
    "El Monte",
    "Isla De Maipo",
    "María Pinto",
    "Padre Hurtado",
    "San Pedro",
]

TODOS_LOS_SERVICIOS_RM = {
    "COMUNAS_SIN_SS_EN_RM": COMUNAS_RM_SIN_SS,
    "SSMC": COMUNAS_SSMC,
    "SSMN": COMUNAS_SSMN,
    "SSMO": COMUNAS_SSMO,
    "SSMOC": COMUNAS_SSMOC,
    "SSMS": COMUNAS_SSMS,
    "SSMSO": COMUNAS_SSMSO,
}

ANIO_INICIO = 2017
ANIO_TERMINO = 2035

COLUMNAS_POBLACION_INE = [f"{i}" for i in range(ANIO_INICIO, ANIO_TERMINO + 1)]
COLUMNAS_POBLACION_FONASA = ["2018", "2019", "2020", "2021", "2022", "2023"]

In [36]:
# Procesar datos
(
    df_ine,
    df_fonasa,
    poblacion_ine,
    poblacion_fonasa,
    porcentaje_fonasa,
    poblaciones_fonasa_extrapoladas,
) = procesar_poblaciones(
    RUTA_INE,
    RUTA_FONASA,
    TODOS_LOS_SERVICIOS_RM,
    QUERY_STRINGS_INE,
    QUERY_STRINGS_FONASA,
    COLUMNAS_POBLACION_INE,
)

> Cargando datos INE y FONASA
> Filtrando por estratos (Regiones, Servicios y Comunas) en INE
> Filtrando por estratos (Regiones, Servicios y Comunas) en FONASA
>> Procesando (Filtrar por edad y sexo) las consultas para cada uno de los estratos
>>> Filtro a realizar: todos - 
>>> Filtro a realizar: hombres - hombre_mujer == 1
>>> Filtro a realizar: mujeres - hombre_mujer == 2
>>> Filtro a realizar: recien_nacidos_vivos_hombres - Edad == 0 and hombre_mujer == 1
>>> Filtro a realizar: recien_nacidos_vivos - Edad == 0
>>> Filtro a realizar: entre_1_y_14 - Edad >= 1 and Edad <= 14
>>> Filtro a realizar: entre_15_y_18 - Edad >= 15 and Edad <= 18
>>> Filtro a realizar: entre_0_y_19 - Edad <= 19
>> Procesando (Filtrar por edad y sexo) las consultas para cada uno de los estratos
>>> Filtro a realizar: todos - 
>>> Filtro a realizar: hombres - SEXO == 'HOMBRE'
>>> Filtro a realizar: mujeres - SEXO == 'MUJER'
>>> Filtro a realizar: recien_nacidos_vivos_hombres - EDAD_TRAMO == 0 and SEXO == 'HOMB