## Encuesta de percepción de inseguridad pública (INEGI)

Los datos que necesitamos se encuentran en distintos documentos de excel, así que primero descargaremos todos y despues juntaremos los datos en un solo DataFrame.

In [1]:
import os
from pathlib import Path
from datetime import datetime
import urllib.request as ur

## 1. Establecer rutas base

In [2]:
# Definamos el path base donde almacenaremos nuestros datos
print(f"Directorio actual:\n{os.getcwd()}")
datos_path = Path(r"./data/") # Carpeta data desde el dir actual
percepcion_path = datos_path / 'percepcion'

url_base = 'https://www.inegi.org.mx/contenidos/programas/envipe/'
urls = {
    url_base + '2011/tabulados/IV_percepcion_inseguridad_2011_est.xlsx':'2011',
    url_base + '2012/tabulados/V_percepcion_seguridad_2012_est.xlsx':'2012',
    url_base + '2013/tabulados/V_percepcion_seguridad_2013_est.xlsx':'2013',
    url_base + '2014/tabulados/V_percepcion_seguridad_2014_est.xlsx':'2014',
    url_base + '2015/tabulados/V_percepcion_seguridad_2015_est.xlsx':'2015',
    url_base + '2016/tabulados/V_percepcion_seguridad_2016_est.xlsx':'2016',
    url_base + '2017/tabulados/V_percepcion_seguridad_2017_est.xlsx':'2017',
    url_base + '2018/tabulados/V_percepcion_seguridad_2018_est.xlsx':'2018',
    url_base + '2019/Tabulados/V_percepcion_seguridad_2019_est.xlsx':'2019',
    url_base + '2020/Tabulados/V_percepcion_seguridad_2020_est.xlsx':'2020',
    url_base + '2021/tabulados/V_percepcion_seguridad_2021_est.xlsx':'2021',
    url_base + '2022/tabulados/V_percepcion_seguridad_2022_est.xlsx':'2022',
    url_base + '2023/tabulados/V_percepcion_seguridad_2023_est.xlsx':'2023',
}

Directorio actual:
c:\Users\mcd\Desktop\Semáforo Delitctivo\LocalWork\ETL


## 2. Descarga de los datos
Crea un folder llamado `percepcion` ya que se descargaran bastantes archivos y no queremos tener muchos archivos sin organizar. Si la carpeta ya existe se asume que ya se descargaron los datos.

In [3]:
if os.path.exists(percepcion_path):
  print(f"La ruta {percepcion_path} ya existe.")
else:
  percepcion_path.mkdir()
  # Descargamos los datos de cada enlace
  for url, anio in urls.items():
    if not os.path.exists(percepcion_path / f'percepcion_{anio}.xlsx'):
      ur.urlretrieve(url, percepcion_path / f'percepcion_{anio}.xlsx')
  
  # Creamos  archivo .txt para dar detalles de la descarga
  with open(percepcion_path / "info_02_percepcion.txt", 'w') as f:

      lista_archivos = ['percepcion_' + str(anio) +'.xlsx' for anio in range(2011, 2024) ]

      fecha_hoy = datetime.now()
      fecha_hoy_str = fecha_hoy.strftime("%Y-%m-%d %H:%M:%S")

      f.write("Datos de percepcion de inseguridad de mexico\n")
      info = """
  Datos de persion de seguridad a varios niveles de México, realizados por el INEGI
  """
      f.write(info + '\n')
      f.write(f"Descargado el {fecha_hoy_str} \n")
      f.write(f"Desde: https://www.inegi.org.mx/contenidos/programas/envipe\n")
      f.write("Archivos descargados:\n")
      for i, a in enumerate(lista_archivos, start=1):
          f.write(f"\t{i}. {a}")

## 3. Comprobar descarga
Comprobar que se han almacenado los datos

In [4]:
print(f"Archivos en la ruta {percepcion_path}:")
for i, f in enumerate(os.listdir(percepcion_path), start=1):
    print(f"{i}. {f}")

Archivos en la ruta data\percepcion:
1. info_02_percepcion.txt
2. percepcion_2011.xlsx
3. percepcion_2012.xlsx
4. percepcion_2013.xlsx
5. percepcion_2014.xlsx
6. percepcion_2015.xlsx
7. percepcion_2016.xlsx
8. percepcion_2017.xlsx
9. percepcion_2018.xlsx
10. percepcion_2019.xlsx
11. percepcion_2020.xlsx
12. percepcion_2021.xlsx
13. percepcion_2022.xlsx
14. percepcion_2023.xlsx
