## Estimación de población (CONAPO)

Como se mencionó, se utilizaran las proyecciones de población realizadas por la CONAPO para estimar mejor el KPI año con año.

In [1]:
import os
from pathlib import Path
from datetime import datetime
import urllib.request as ur
import zipfile

## 1. Establecer rutas base

In [4]:
# Definamos el path base donde almacenaremos nuestros datos
print(f"Directorio actual:\n{os.getcwd()}")
datos_path = Path(r"./data/") # Carpeta data desde el dir actual

# El nombre con el que se almacenarán los datos
nombre_csv_proyecciones = "datos_proyecciones.zip"

# La URL de donde descargamos los datos
url_proyecciones = 'https://conapo.segob.gob.mx/work/models/CONAPO/pry23/DB/ConDem50a19_ProyPob20a70.zip'

Directorio actual:
c:\Users\guill\OneDrive - Universidad de Sonora\Maestria\Ingenieria de Caracteristicas\Proyectos\semaforo-delictivo\ETL


## 2. Descargar archivos

In [5]:
# Una vez obtenido el enlace, descargar archivo .zip con urlretrieve
datos_path.mkdir(parents=True, exist_ok=True)
if os.path.exists(datos_path / nombre_csv_proyecciones):
    print(f"Ya existe el archivo {nombre_csv_proyecciones} en la ruta de datos {datos_path}")
else:
    ur.urlretrieve(url_proyecciones, str(datos_path / nombre_csv_proyecciones))

    # Descomprimir
    with zipfile.ZipFile(datos_path / nombre_csv_proyecciones, 'r') as file:
        file.extract(member = "ConDem50a19_ProyPob20a70/0_Pob_Inicio_1950_2070.xlsx", path = datos_path)

        # Movemos a la raiz de carpeta de datos
        if not os.path.exists(datos_path / '0_Pob_Inicio_1950_2070.xlsx'):
            os.rename(datos_path / 'ConDem50a19_ProyPob20a70/0_Pob_Inicio_1950_2070.xlsx',
                    datos_path / '0_Pob_Inicio_1950_2070.xlsx')
            # Removemos el folder vacío
            os.removedirs(datos_path / "ConDem50a19_ProyPob20a70")
        else:
            print(f"Ya existe el archivo {datos_path / '0_Pob_Inicio_1950_2070.xlsx'} en la ruta de datos {datos_path}")

    # Creamos un pequeño archivo .txt para dar detalles de la descarga
    with open(datos_path / "info_proyecciones.txt", 'w') as f:

        lista_archivos = [
            "0_Pob_Inicio_1950_2070.xlsx"
        ]

        fecha_hoy = datetime.now()
        fecha_hoy_str = fecha_hoy.strftime("%Y-%m-%d %H:%M:%S")

        f.write("Datos de proyección de población\n")
        info = """
Cifras de población desde el 1950 hasta 2070, realizada por CONAPO.
    """
        f.write(info + '\n')
        f.write(f"Descargado el {fecha_hoy_str} \n")
        f.write(f"Desde: {url_proyecciones}\n")
        f.write("Archivos descargados:\n")
        for i, a in enumerate(lista_archivos, start=1):
            f.write(f"\t{i}. {a}")

## 3. Comprobar descarga
Comprobar que se han almacenado los datos

In [9]:
print(f"Archivos en la ruta {datos_path}:")
for i, f in enumerate(os.listdir(datos_path), start=1):
    print(f"{i}. {f}")

Archivos en la ruta data:
1. 0_Pob_Inicio_1950_2070.xlsx
2. datos_proyecciones.zip
3. info_proyecciones.txt
