# DEPURACION DEFUNCIONES 1992-1996

## 1. IMPORTAR LIBRERIAS

In [1]:
### IMPORTAR LIBRERIAS ###
import pandas as pd
import numpy as np
from pathlib import Path
from tqdm import tqdm
import warnings
warnings.filterwarnings('ignore')

## 2. Crear Funciones

### 2.1. FUNCION LLAMADO DE DATOS

In [2]:
def leer_archivos_defunciones(ruta_carpeta, año_inicio, año_fin):
    """Lee y unifica archivos de defunciones en un rango de años"""
    ruta = Path(ruta_carpeta)
    archivos = [arch for arch in ruta.glob("Defun*.txt") 
                if año_inicio <= int(arch.stem[-4:]) <= año_fin]
    
    dfs = []
    for archivo in tqdm(archivos, desc="Leyendo archivos"):
        try:
            df = pd.read_csv(archivo, sep='\t', encoding='utf-8', 
                           low_memory=False, dtype=str)
            df.columns = df.columns.str.upper()
            dfs.append(df)
        except Exception as e:
            print(f"Error en {archivo.name}: {e}")
    
    return pd.concat(dfs, ignore_index=True) if dfs else pd.DataFrame()

## 3. EJECUTAR PROCESO PRINCIPAL

In [3]:
# =============================================================================
# 2. PROCESO PRINCIPAL
# =============================================================================

print("=" * 60)
print("ANÁLISIS EXPLORATORIO DE DATOS - DEFUNCIONES 1979-1991")
print("=" * 60)

# 2.1. Leer archivos de defunciones
print("\n1. LEYENDO ARCHIVOS DE DEFUNCIONES...")
df_defun = leer_archivos_defunciones("data/raw/Muertes", 1992, 1996)
print(f"   Total registros: {len(df_defun):,}")
print(f"   Columnas: {list(df_defun.columns)}")

ANÁLISIS EXPLORATORIO DE DATOS - DEFUNCIONES 1979-1991

1. LEYENDO ARCHIVOS DE DEFUNCIONES...


Leyendo archivos: 100%|██████████| 5/5 [00:01<00:00,  4.13it/s]

   Total registros: 848,360
   Columnas: ['COD_DPTO', 'COD_MUNIC', 'A_DEFUN', 'ANO', 'MES', 'SEXO', 'GRU_ED1', 'GRU_ED2', 'EST_CIVIL', 'CODPTORE', 'CODMUNRE', 'AREA_RES', 'PERMAN_MUN', 'SIT_DEFUN', 'C_BAS1', 'CONS_EXP', 'CAU_HOMOL']



