In [3]:
import pandas as pd  # para manipulación de dataframes y tablas
from datetime import datetime, date, timedelta  # para trabajar con fechas y tiempos
import os  # para manejar rutas del sistema y operaciones relacionadas
from zipfile import ZipFile # para trabajar con archivos zip
import shutil  # para copiar y mover archivos y directorios
from pathlib import Path  # para trabajar de manera más cómoda con rutas en el sistema

# 1. Rutas

In [4]:
# Rutas EPS025
R_EPS025_AFILIACIONES = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Subsidiados\Historico\2025\20250427-HISTORICOS\AFILIACIONES_S_E.TXT.ZIP"
R_EPS025_AFILIADOS = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Subsidiados\Historico\2025\20250427-HISTORICOS\AFILIADOS_S_E.TXT.ZIP"
R_EPS025_CONDICIONES_AFILIACIONES = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Subsidiados\Historico\2025\20250427-HISTORICOS\CONDICIONES_AFILIACIONES_S_E.TXT.ZIP"
R_EPS025_CONDICIONES_AFILIACIONES_SUBSIDIADO = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Subsidiados\Historico\2025\20250427-HISTORICOS\CONDICIONES_AFILIACIONES_SUBSIDIADO_E.TXT.ZIP"
R_EPS025_HISTORIA_GRUPO_FAMILIAR = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Subsidiados\Historico\2025\20250427-HISTORICOS\HISTORIA_GRUPO_FAMILIAR_E.TXT.ZIP"
R_EPS025_HISTORICO_IDENTIFICACION = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Subsidiados\Historico\2025\20250427-HISTORICOS\HISTORICO_IDENTIFICACION_S_E.TXT.ZIP"

# Rutas EPS025
R_EPSC25_AFILIADOS = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\AFILIADOS.TXT.ZIP"
R_EPSC25_APORTANTES = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\APORTANTES.ZIP"
R_EPSC25_CONDICIONES_AFILIACIONES_SUBSIDIADO = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\CONDICIONES_AFILIACIONES_SUBSIDIADO_CT.TXT.ZIP"
R_EPSC25_HISTORIA_AFILIACION = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\HISTORIA_AFILIACION.TXT.ZIP"
R_EPSC25_HISTORIA_CONDICION_AFILIACION = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\HISTORIA_CONDICION_AFILIACION.TXT.ZIP"
R_EPSC25_HISTORIA_COTIZANTE_APORTANTE = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\HISTORIA_COTIZANTE_APORTANTE.TXT.ZIP"
R_EPSC25_HISTORIA_GRUPO_FAMILIAR = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\HISTORIA_GRUPO_FAMILIAR.TXT.ZIP"
R_EPSC25_HISTORICO_IDENTIFICACION = r"C:\Users\osmarrincon\OneDrive - uniminuto.edu\Capresoca\AlmostClear\Procesos BDUA\Contributivo\Historico\2025\20250427-HISTORICOS\HISTORIA_IDENTIFICACION.TXT.ZIP"

# 2. Historico Identificacion

In [5]:
new_columns = [
    "AFL_ID", "TPS_IDN_ID", "HST_IDN_NUMERO_IDENTIFICACION",
    "HST_IDN_FECHA_INICIO", "HST_IDN_FECHA_FIN", "ENT_ID"
]

def load_txt_from_zip(zip_path: str,
                      txt_name: str,
                      columns: list[str],
                      sep: str = ",",
                      encoding: str = "ANSI") -> pd.DataFrame:
    """
    Abre zip_path, extrae txt_name y lo carga en un DataFrame con las columnas dadas.
    """
    with ZipFile(zip_path) as z:
        with z.open(txt_name) as f:
            df = pd.read_csv(
                f,
                sep=sep,
                header=None,
                dtype=str,
                encoding=encoding
            )
    df.columns = columns
    return df

# ahora, para cada archivo ZIP basta con:
Df_H_I_EPS025 = load_txt_from_zip(
    R_EPS025_HISTORICO_IDENTIFICACION,
    "HISTORICO_IDENTIFICACION_S_E.TXT",
    new_columns
)

Df_H_I_EPSC25 = load_txt_from_zip(
    R_EPSC25_HISTORICO_IDENTIFICACION,
    "HISTORIA_IDENTIFICACION.TXT",
    new_columns
)

In [6]:
Df_H_I_EPSC25

Unnamed: 0,AFL_ID,TPS_IDN_ID,HST_IDN_NUMERO_IDENTIFICACION,HST_IDN_FECHA_INICIO,HST_IDN_FECHA_FIN,ENT_ID
0,94279948,CC,1118533710,27/10/2006,31/12/2999,EPSC25
1,91099353,RC,WXR0251486,15/12/2001,04/06/2009,EPSC25
2,90288196,CC,74857349,29/12/2005,31/12/2999,EPSC25
3,68522720,CC,47425460,01/04/2003,31/12/2999,EPSC25
4,26802035,TI,1006552688,29/07/2013,26/02/2019,EPSC25
...,...,...,...,...,...,...
160246,78541216,TI,88091678661,04/01/2001,04/10/2007,EPSC25
160247,72550894,CC,1006531786,12/01/2017,31/12/2999,EPSC25
160248,74421888,TI,96100305329,01/10/2001,28/05/2015,EPSC25
160249,84350882,CC,74753840,01/12/2006,31/12/2999,EPSC25
