In [1]:
import os
import time
import requests
import pandas as pd
import zipfile
import io
import re
import concurrent.futures
from datetime import datetime
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from selenium.common.exceptions import TimeoutException
from selenium.webdriver.common.action_chains import ActionChains
from selenium.webdriver.common.keys import Keys
import glob

def homologar_estado(nombre):
    if not isinstance(nombre, str): return nombre
    n = nombre.lower()
    
    if 'ciudad de m√©xico' in n or 'ciudad de mexico' in n or 'cdmx' in n or 'distrito federal' in n: return 'Ciudad de M√©xico'
    if 'baja california sur' in n: return 'Baja California Sur'
    if 'baja california' in n: return 'Baja California'
    if 'estado de m√©xico' in n or 'estado de mexico' in n or n.strip() == 'm√©xico' or n.strip() == 'mexico': return 'M√©xico'
    
    if 'coahuila' in n: return 'Coahuila'
    if 'michoac√°n' in n or 'michoacan' in n: return 'Michoac√°n'
    if 'veracruz' in n: return 'Veracruz'
    if 'nuevo le√≥n' in n or 'nuevo leon' in n: return 'Nuevo Le√≥n'
    if 'quer√©taro' in n or 'queretaro' in n: return 'Quer√©taro'
    if 'san luis' in n: return 'San Luis Potos√≠'
    if 'yucat√°n' in n or 'yucatan' in n: return 'Yucat√°n'
    
    estados = ['Aguascalientes', 'Campeche', 'Colima', 'Chiapas', 'Chihuahua', 
               'Durango', 'Guanajuato', 'Guerrero', 'Hidalgo', 'Jalisco', 
               'Morelos', 'Nayarit', 'Oaxaca', 'Puebla', 'Quintana Roo', 
               'Sinaloa', 'Sonora', 'Tabasco', 'Tamaulipas', 'Tlaxcala', 'Zacatecas']
    
    for est in estados:
        if est.lower() in n: return est
        
    return nombre

def limpiar_columna_estado(df):
    nombres_validos = ['estado', 'entidad', 'entidad federativa', 'estados', 'entidades']
    for col in df.columns:
        if str(col).lower().strip() in nombres_validos:
            df[col] = df[col].apply(homologar_estado)
    return df

# ==========================================
# 0. CONFIGURACI√ìN GLOBAL Y RUTAS
# ==========================================
TOKEN_INEGI = "129ac2e3-e8a6-72c7-58c1-acced5a601bd"

# Detecci√≥n robusta de directorios
try:
    SCRIPT_DIR = os.path.dirname(os.path.abspath(__file__))
    if os.path.basename(SCRIPT_DIR) == 'scripts':
        PROJECT_ROOT = os.path.dirname(SCRIPT_DIR)
    else:
        PROJECT_ROOT = SCRIPT_DIR
except NameError:
    PROJECT_ROOT = os.getcwd()
    if os.path.basename(PROJECT_ROOT) == 'scripts':
        PROJECT_ROOT = os.path.dirname(PROJECT_ROOT)

RAW_DIR = os.path.join(PROJECT_ROOT, "data", "raw")
INTERMEDIATE_DIR = os.path.join(PROJECT_ROOT, "data", "intermediate")

os.makedirs(INTERMEDIATE_DIR, exist_ok=True)

print(f"üìç Ra√≠z del Proyecto: {PROJECT_ROOT}")
print(f"üìÇ Datos Crudos: {RAW_DIR}")
print(f"üìÇ Datos Procesados: {INTERMEDIATE_DIR}")
print("-" * 80)

# ==========================================
# M√ìDULO 1: PIB (API)
# ==========================================
def procesar_pib():
    print("‚è≥ [PIB] Iniciando extracci√≥n exhaustiva...")
    indicadores = {
        "746097": "Total Nacional",
        "746196": "Actividades Primarias",
        "746229": "Agricultura, cr√≠a y explotaci√≥n de animales, aprovechamiento forestal, pesca y caza",
        "746262": "Agricultura",
        "746295": "Cr√≠a y explotaci√≥n de animales",
        "746328": "Pesca, caza y captura",
        "746361": "Aprovechamiento forestal",
        "746394": "Actividades Secundarias",
        "746427": "Miner√≠a",
        "746460": "Miner√≠a petrolera",
        "746493": "Miner√≠a no petrolera",
        "746526": "Generaci√≥n, transmisi√≥n y distribuci√≥n de energ√≠a el√©ctrica, agua y gas",
        "746559": "Construcci√≥n",
        "746592": "Industrias manufactureras",
        "746625": "Industria alimentaria",
        "746658": "Bebidas y tabaco",
        "746691": "Insumos, acabados y productos textiles",
        "746724": "Prendas de vestir y productos de cuero y piel",
        "746757": "Industria de la madera",
        "746790": "Industria del papel",
        "746823": "Productos derivados del petr√≥leo y carb√≥n, qu√≠mica, pl√°stico y hule",
        "746856": "Productos a base de minerales no met√°licos",
        "746889": "Met√°licas b√°sicas y productos met√°licos",
        "746922": "Maquinaria y equipo, computaci√≥n, electr√≥nicos y accesorios",
        "746955": "Muebles, colchones y persianas",
        "746988": "Otras industrias manufactureras",
        "747021": "Actividades Terciarias",
        "747054": "Comercio al por mayor",
        "747087": "Comercio al por menor",
        "747120": "Transportes, correos y almacenamiento",
        "747153": "Informaci√≥n en medios masivos",
        "747186": "Servicios financieros y de seguros",
        "747219": "Servicios inmobiliarios y de alquiler de bienes",
        "747252": "Servicios profesionales, cient√≠ficos y t√©cnicos",
        "747285": "Corporativos",
        "747318": "Servicios de apoyo a los negocios y manejo de residuos",
        "747351": "Servicios educativos",
        "747384": "Servicios de salud y de asistencia social",
        "747417": "Servicios de esparcimiento culturales y deportivos",
        "747450": "Servicios de alojamiento temporal y de preparaci√≥n de alimentos y bebidas",
        "747483": "Otros servicios excepto actividades gubernamentales",
        "747516": "Actividades legislativas, gubernamentales"
    }
    
    resultados = []
    
    for ind_clave, ind_nombre in indicadores.items():
        for i in range(0, 33): 
            clave_estado = f"{i:02d}"
            url = f"https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/{ind_clave}/es/{clave_estado}/false/BIE-BISE/2.0/{TOKEN_INEGI}?type=json"
            
            exito = False
            for intento in range(3):
                try:
                    r = requests.get(url, timeout=10)
                    if r.status_code == 200:
                        data = r.json()
                        if 'Series' in data and data['Series']:
                            serie = data['Series'][0].get('OBSERVATIONS', [])
                            serie_sorted = sorted(serie, key=lambda x: x.get('TIME_PERIOD', ''))
                            if len(serie_sorted) >= 2:
                                obs_list = serie_sorted[-2:]
                            else:
                                obs_list = serie_sorted
                                
                            for obs in obs_list:
                                resultados.append({
                                    'Indicador': ind_nombre,
                                    'Clave_Indicador': ind_clave,
                                    'Estado_ID': obs.get('COBER_GEO', clave_estado),
                                    'Periodo': int(obs.get('TIME_PERIOD')),
                                    'Valor': float(obs.get('OBS_VALUE', 0))
                                })
                        exito = True
                        break
                    else:
                        time.sleep(1)
                except Exception:
                    time.sleep(1)
            time.sleep(0.05)
            
    if resultados:
        df = pd.DataFrame(resultados)
        outfile = os.path.join(INTERMEDIATE_DIR, "pib_entidad.csv")
        df.to_csv(outfile, index=False)
        return f"‚úÖ [PIB] Completado ({len(df)} registros)."
    return "‚ö†Ô∏è [PIB] No se obtuvieron datos."

# ==========================================
# M√ìDULO 2: EXPORTACIONES (API)
# ==========================================
def procesar_exportaciones():
    print("‚è≥ [Exportaciones] Iniciando extracci√≥n detallada...")
    indicadores = {
        "629659": "Total",
        "696790": "Agricultura",
        "696791": "Cr√≠a y explotaci√≥n de animales",
        "697788": "Pesca, caza y captura",
        "629660": "Extracci√≥n de petr√≥leo y gas",
        "629661": "Miner√≠a de minerales met√°licos y no met√°licos",
        "629662": "Industria alimentaria",
        "629663": "Industria de las bebidas y del tabaco",
        "629664": "Fabricaci√≥n de insumos textiles y acabado de textiles",
        "629665": "Fabricaci√≥n de productos textiles, excepto prendas de vestir",
        "629666": "Fabricaci√≥n de prendas de vestir",
        "629667": "Curtido y acabado de cuero y piel, y fabricaci√≥n de productos de cuero",
        "629668": "Industria de la madera",
        "629669": "Industria del papel",
        "629670": "Impresi√≥n e industrias conexas",
        "629671": "Fabricaci√≥n de productos derivados del petr√≥leo y del carb√≥n",
        "629672": "Industria qu√≠mica",
        "629673": "Industria del pl√°stico y del hule",
        "629674": "Fabricaci√≥n de productos a base de minerales no met√°licos",
        "629675": "Industrias met√°licas b√°sicas",
        "629676": "Fabricaci√≥n de productos met√°licos",
        "629677": "Fabricaci√≥n de maquinaria y equipo",
        "629678": "Fabricaci√≥n de equipo de computaci√≥n, comunicaci√≥n, medici√≥n y otros equipos, componentes y accesorios electr√≥nicos",
        "629679": "Fabricaci√≥n de accesorios, aparatos el√©ctricos y equipo de generaci√≥n de energ√≠a el√©ctrica",
        "629680": "Fabricaci√≥n de equipo de transporte",
        "629681": "Fabricaci√≥n de muebles, colchones y persianas",
        "629682": "Otras industrias manufactureras",
        "629683": "No especificado"
    }
    
    resultados = []
    
    for ind_clave, ind_nombre in indicadores.items():
        for i in range(1, 33):
            clave_estado = f"{i:02d}"
            url = f"https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/{ind_clave}/es/{clave_estado}/false/BIE-BISE/2.0/{TOKEN_INEGI}?type=json"
            
            exito = False
            for intento in range(3):
                try:
                    r = requests.get(url, timeout=10)
                    if r.status_code == 200:
                        data = r.json()
                        if 'Series' in data and data['Series']:
                            serie = data['Series'][0].get('OBSERVATIONS', [])
                            serie_sorted = sorted(serie, key=lambda x: x.get('TIME_PERIOD', ''))
                            if serie_sorted:
                                max_year_str = serie_sorted[-1]['TIME_PERIOD'][:4]
                                try:
                                    max_year = int(max_year_str)
                                    min_year_target = max_year - 1
                                    for obs in serie_sorted:
                                        anio_obs = int(obs['TIME_PERIOD'][:4])
                                        if anio_obs >= min_year_target:
                                            resultados.append({
                                                'Sector': ind_nombre,
                                                'Clave_Indicador': ind_clave,
                                                'Estado_ID': clave_estado,
                                                'Periodo': obs.get('TIME_PERIOD'),
                                                'Valor': float(obs.get('OBS_VALUE', 0))
                                            })
                                except: pass
                        exito = True
                        break
                    else:
                        time.sleep(1)
                except Exception:
                    time.sleep(1)
            time.sleep(0.05)
            
    if resultados:
        df = pd.DataFrame(resultados)
        outfile = os.path.join(INTERMEDIATE_DIR, "exportaciones_entidad.csv")
        df.to_csv(outfile, index=False)
        return f"‚úÖ [Exportaciones] Completado ({len(df)} registros)."
    return "‚ö†Ô∏è [Exportaciones] No se obtuvieron datos."

# ==========================================
# M√ìDULO 3: POBLACI√ìN (API)
# ==========================================
def procesar_poblacion_api():
    print("‚è≥ [Poblaci√≥n] Iniciando extracci√≥n de pir√°mide completa...")
    indicadores = {
        # Hombres
        "1002000059": "0 a 4 a√±os (Hombres)",
        "1002000089": "5 a 9 a√±os (Hombres)",
        "1002000062": "10 a 14 a√±os (Hombres)",
        "1002000068": "15 a 19 a√±os (Hombres)",
        "1002000071": "20 a 24 a√±os (Hombres)",
        "1002000074": "25 a 29 a√±os (Hombres)",
        "1002000077": "30 a 34 a√±os (Hombres)",
        "1002000080": "35 a 39 a√±os (Hombres)",
        "1002000083": "40 a 44 a√±os (Hombres)",
        "1002000086": "45 a 49 a√±os (Hombres)",
        "1002000092": "50 a 54 a√±os (Hombres)",
        "1002000095": "55 a 59 a√±os (Hombres)",
        "1002000098": "60 a 64 a√±os (Hombres)",
        "1002000101": "65 a 69 a√±os (Hombres)",
        "1002000104": "70 a 74 a√±os (Hombres)",
        "1002000107": "75 a 79 a√±os (Hombres)",
        "1002000110": "80 a 84 a√±os (Hombres)",
        "1002000113": "85 a 89 a√±os (Hombres)",
        "1002000116": "90 a 94 a√±os (Hombres)",
        "1002000119": "95 a 99 a√±os (Hombres)",
        "1002000065": "100 a√±os y m√°s (Hombres)",

        # Mujeres
        "1002000060": "0 a 4 a√±os (Mujeres)",
        "1002000090": "5 a 9 a√±os (Mujeres)",
        "1002000063": "10 a 14 a√±os (Mujeres)",
        "1002000069": "15 a 19 a√±os (Mujeres)",
        "1002000072": "20 a 24 a√±os (Mujeres)",
        "1002000075": "25 a 29 a√±os (Mujeres)",
        "1002000078": "30 a 34 a√±os (Mujeres)",
        "1002000081": "35 a 39 a√±os (Mujeres)",
        "1002000084": "40 a 44 a√±os (Mujeres)",
        "1002000087": "45 a 49 a√±os (Mujeres)",
        "1002000093": "50 a 54 a√±os (Mujeres)",
        "1002000096": "55 a 59 a√±os (Mujeres)",
        "1002000099": "60 a 64 a√±os (Mujeres)",
        "1002000102": "65 a 69 a√±os (Mujeres)",
        "1002000105": "70 a 74 a√±os (Mujeres)",
        "1002000108": "75 a 79 a√±os (Mujeres)",
        "1002000111": "80 a 84 a√±os (Mujeres)",
        "1002000114": "85 a 89 a√±os (Mujeres)",
        "1002000117": "90 a 94 a√±os (Mujeres)",
        "1002000120": "95 a 99 a√±os (Mujeres)",
        "1002000066": "100 a√±os y m√°s (Mujeres)"
}
    
    resultados = []
    
    for ind_clave, desc in indicadores.items():
        for i in range(0, 33):
            url = f"https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/{ind_clave}/es/{i:02d}/true/BISE/2.0/{TOKEN_INEGI}?type=json"
            
            exito = False
            for intento in range(3):
                try:
                    r = requests.get(url, timeout=5)
                    if r.status_code == 200:
                        data = r.json()
                        if 'Series' in data and data['Series']:
                            obs = data['Series'][0]['OBSERVATIONS'][0]
                            resultados.append({
                                'Indicador': desc,
                                'Clave_Indicador': ind_clave,
                                'Estado_ID': f"{i:02d}",
                                'Periodo': obs.get('TIME_PERIOD'),
                                'Valor': float(obs.get('OBS_VALUE', 0))
                            })
                        exito = True
                        break
                    else:
                        time.sleep(0.5)
                except Exception:
                    time.sleep(0.5)
            time.sleep(0.02)
            
    if resultados:
        df = pd.DataFrame(resultados)
        outfile = os.path.join(INTERMEDIATE_DIR, "poblacion_edad.csv")
        df.to_csv(outfile, index=False)
        return f"‚úÖ [Poblaci√≥n] Completado ({len(df)} registros)."
    return "‚ö†Ô∏è [Poblaci√≥n] No se obtuvieron datos."

# ==========================================
# M√ìDULO 4: ENOE (Descarga + PEA Corregida)
# ==========================================
def procesar_enoe_auto():
    print("‚è≥ [ENOE] Iniciando descarga y procesamiento...")
    
    base_url = "https://www.inegi.org.mx/contenidos/programas/enoe/15ymas/tabulados/"
    anio_actual = datetime.now().year
    url_final, anio_found, trim_found = None, None, None
    
    encontrado = False
    for a in [anio_actual, anio_actual-1]:
        if encontrado: break
        for t in ["trim4", "trim3", "trim2", "trim1"]:
            test_url = f"{base_url}enoe_indicadores_estrategicos_{a}_{t}_xls.zip"
            try:
                r = requests.head(test_url, timeout=5)
                content_type = r.headers.get('Content-Type', '').lower()
                if r.status_code == 200 and ('zip' in content_type or 'octet-stream' in content_type):
                    url_final = test_url; anio_found = a; trim_found = t; encontrado = True
                    break
            except: pass
            
    if not url_final: return "‚ùå [ENOE] URL no encontrada."

    try:
        print(f"   üì• Descargando: {url_final}")
        r = requests.get(url_final)
        z = zipfile.ZipFile(io.BytesIO(r.content))
        
        archivos = [f for f in z.namelist() if ("Entidades/" in f or "Nacional/" in f) and (f.endswith('.xlsx') or f.endswith('.xls'))]
        
        datos = []
        
        config_enoe = {
            "Poblacion Total": ["", "Poblaci√≥n total"],
            "PEA": ["", "Poblaci√≥n econ√≥micamente activa (PEA)"],
            "Desocupada": ["Poblaci√≥n econ√≥micamente activa", "Desocupada"],
            "Edad Promedio PEA": ["Edad de la poblaci√≥n econ√≥micamente activa", "Promedio"],
            "Sector Primario": ["3.2 Sector de actividad", "Primario"],
            "Sector Secundario": ["3.2 Sector de actividad", "Secundario"],
            "Sector Terciario": ["3.2 Sector de actividad", "Terciario"],
            "No especificado": ["3.2 Sector de actividad", "No especificado"],
            "Educacion Sup": ["Nivel de instrucci√≥n", "Medio superior y superior"],
            "Informalidad TIL1": ["", "Tasa de informalidad laboral 1 (TIL1)"]
        }

        for arch in archivos:
            if "Nacional" in arch:
                estado = "Nacional"
            else:
                estado = arch.split("Entidad_")[-1].replace(".xlsx", "").replace(".xls", "").replace("_", " ").title()
                
            with z.open(arch) as f:
                df = pd.read_excel(f, header=None)
            
            registro = {'Estado': estado, 'Anio': anio_found, 'Trimestre': trim_found}
            
            col_val = 4 
            for idx, row in df.iterrows():
                txt = " ".join([str(x).lower() for x in row[:5]])
                if "poblaci√≥n total" in txt:
                    for c in range(4, min(15, len(row))):
                        try:
                            if float(str(row[c]).replace(",","").replace(" ", "")) > 1000: 
                                col_val = c; break
                        except: continue
                    break
            
            context = {i:"" for i in range(5)}
            sticky = {1:""}
            
            for idx, row in df.iterrows():
                cols = [str(row[i]).strip() if i < len(row) and pd.notna(row[i]) else "" for i in range(5)]
                indent = -1
                txt_row = ""
                
                for i, txt in enumerate(cols):
                    if txt:
                        indent = i; txt_row = txt; context[i] = txt
                        for j in range(i+1, 5): 
                            context[j] = ""; 
                            if j in sticky: sticky[j]=""
                        break
                
                if not txt_row: continue
                
                if indent == 1 and re.match(r'^(\d+\.?\d*)\s', txt_row): sticky[1] = txt_row
                
                path = [context[0]]
                if indent == 1 and not re.match(r'^(\d+\.?\d*)\s', txt_row) and sticky[1]:
                    path.append(sticky[1]); path.append(txt_row)
                else: path.append(context[1])
                path += [context[k] for k in range(2,5)]
                
                path_str = " | ".join([p.lower() for p in path if p])
                
                for kpi, (padre, target) in config_enoe.items():
                    if target.lower() in txt_row.lower() and padre.lower() in path_str:
                        try: 
                            val_str = str(row[col_val]).replace(",","").replace(" ", "")
                            registro[kpi] = float(val_str)
                        except: pass
            
            datos.append(registro)

        df_out = pd.DataFrame(datos)
        df_out = limpiar_columna_estado(df_out)
        outfile = os.path.join(INTERMEDIATE_DIR, "enoe_indicadores.csv")
        df_out.to_csv(outfile, index=False)
        return f"‚úÖ [ENOE] Completado ({anio_found}-{trim_found})."
        
    except Exception as e: return f"‚ùå [ENOE] Error: {e}"

# ==========================================
# M√ìDULO 5: EDUCACI√ìN (Local)
# ==========================================
def procesar_educacion():
    print("‚è≥ [Educaci√≥n] Procesando anuario (Generando Top 3 separados)...")
    
    archivos = [f for f in os.listdir(RAW_DIR) if f.startswith("base_anuario_") and f.endswith(".xlsx")]
    if not archivos:
        return "‚ö†Ô∏è [Educaci√≥n] Falta archivo base_anuario_####-####.xlsx"
    
    archivo_anuario = archivos[0]
    fpath = os.path.join(RAW_DIR, archivo_anuario)
    
    match = re.search(r'base_anuario_(\d{4}-\d{4})\.xlsx', archivo_anuario)
    ciclo_val = match.group(1) if match else "¬ø?"
    
    try:
        df = pd.read_excel(fpath, sheet_name="Base de datos")
        
        # Limpieza de columnas num√©ricas
        cols_num = ['Matr√≠cula Total', 'Egresados Total']
        for c in cols_num: 
            df[c] = pd.to_numeric(df[c], errors='coerce').fillna(0)
        
        mapa_niveles = {
            'T√âCNICO SUPERIOR': 'T√©cnico Superior', 'LICENCIATURA EN EDUCACI√ìN NORMAL': 'Licenciatura',
            'LICENCIATURA UNIVERSITARIA Y TECNOL√ìGICA': 'Licenciatura', 'ESPECIALIDAD': 'Licenciatura',
            'MAESTR√çA': 'Maestr√≠a', 'DOCTORADO': 'Doctorado'
        }
        df['Nivel_Agrupado'] = df['NIVEL'].str.upper().str.strip().map(mapa_niveles)
        df = limpiar_columna_estado(df)
        
        # --- 1. TOTALES (INTACTO) ---
        df_totales = df.groupby(['ENTIDAD', 'Nivel_Agrupado'])[cols_num].sum().reset_index()
        df_totales['Ciclo'] = ciclo_val
        df_totales.to_csv(os.path.join(INTERMEDIATE_DIR, "educacion_totales.csv"), index=False)
        
        df_campos = df.groupby(['ENTIDAD', 'Nivel_Agrupado', 'CAMPO AMPLIO'])[cols_num].sum().reset_index()
        
        df_nivels = df_campos.groupby(['ENTIDAD', 'Nivel_Agrupado'])[cols_num].sum().reset_index().rename(columns={
            'Matr√≠cula Total': 'Total_Mat', 
            'Egresados Total': 'Total_Egr'
        })
        df_campos = df_campos.merge(df_nivels, on=['ENTIDAD', 'Nivel_Agrupado'])
        
        df_campos['Participacion_Matricula'] = df_campos.apply(lambda x: (x['Matr√≠cula Total']/x['Total_Mat']*100) if x['Total_Mat']>0 else 0, axis=1)
        df_campos['Participacion_Egresados'] = df_campos.apply(lambda x: (x['Egresados Total']/x['Total_Egr']*100) if x['Total_Egr']>0 else 0, axis=1)
        
        top_mat = df_campos.sort_values(['ENTIDAD', 'Nivel_Agrupado', 'Matr√≠cula Total'], ascending=[True, True, False])
        top_mat = top_mat.groupby(['ENTIDAD', 'Nivel_Agrupado']).head(3).copy()
        top_mat['Ciclo'] = ciclo_val
        
        cols_mat = ['ENTIDAD', 'Nivel_Agrupado', 'CAMPO AMPLIO', 'Matr√≠cula Total', 'Participacion_Matricula', 'Ciclo']
        top_mat[cols_mat].to_csv(os.path.join(INTERMEDIATE_DIR, "educacion_top3_matricula.csv"), index=False)
        
        top_egr = df_campos.sort_values(['ENTIDAD', 'Nivel_Agrupado', 'Egresados Total'], ascending=[True, True, False])
        top_egr = top_egr.groupby(['ENTIDAD', 'Nivel_Agrupado']).head(3).copy()
        top_egr['Ciclo'] = ciclo_val
        
        cols_egr = ['ENTIDAD', 'Nivel_Agrupado', 'CAMPO AMPLIO', 'Egresados Total', 'Participacion_Egresados', 'Ciclo']
        top_egr[cols_egr].to_csv(os.path.join(INTERMEDIATE_DIR, "educacion_top3_egresados.csv"), index=False)
        
        return f"‚úÖ [Educaci√≥n] Completado (Totales + 2 Archivos Top3 - Ciclo {ciclo_val})."
        
    except Exception as e: return f"‚ùå [Educaci√≥n] Error: {e}"
# ==========================================
# M√ìDULO 6: IED (Local) - GRUPOS POR SECTOR Y SIN %
# ==========================================
def procesar_ied():
    print("‚è≥ [IED] Procesando datos complejos (Totales 3 D√≠gitos y Detalle)...")
    fpath = os.path.join(RAW_DIR, "2025_3T_Flujosporentidadfederativa_orig__11_A1.xlsx")
    
    if not os.path.exists(fpath): 
        return f"‚ö†Ô∏è [IED] Falta {fpath}"
    
    try:
        # 1. MAPEO DE COLUMNAS
        df_head = pd.read_excel(fpath, sheet_name='Actividad econ√≥mica_SCIAN 2023', header=None, nrows=10)
        
        header_idx = None
        for idx, row in df_head.iterrows():
            if "Entidad Federativa" in str(row[0]):
                header_idx = idx
                break
        
        if header_idx is None: return "‚ùå [IED] Sin encabezados."
        
        years_row = df_head.iloc[header_idx].tolist()
        quarters_row = df_head.iloc[header_idx + 1].tolist()
        
        col_map = {}
        current_year = None
        for i in range(1, len(years_row)):
            if pd.notna(years_row[i]):
                try:
                    y = int(float(years_row[i]))
                    if y > 2000: current_year = y
                except: pass
            if current_year and pd.notna(quarters_row[i]):
                try:
                    q = int(float(quarters_row[i]))
                    if 1 <= q <= 4: col_map[i] = (current_year, q)
                except: pass
        
        if not col_map: return "‚ùå [IED] Error mapeo columnas."
        
        last_period = max(col_map.values()) # (A√±o, Trim)
        prev_period = (last_period[0]-1, last_period[1])
        
        idx_act = [k for k, v in col_map.items() if v == last_period][0]
        idx_prev = [k for k, v in col_map.items() if v == prev_period]
        idx_prev = idx_prev[0] if idx_prev else None
        
        # 2. EXTRACCI√ìN (Solo 3 d√≠gitos)
        df_data = pd.read_excel(fpath, sheet_name='Actividad econ√≥mica_SCIAN 2023', header=header_idx+2)
        
        def clean(x):
            if pd.isna(x): return 0.0
            s = str(x).strip().replace(',','')
            try: return float(s)
            except: return 0.0
            
        def clasificar(cod):
            if cod.startswith('1'): return 'Primaria'
            if cod.startswith(('2','3')): return 'Secundaria'
            return 'Terciaria'
            
        filas = []
        estado_act = None
        
        for i, row in df_data.iterrows():
            c = str(row.iloc[0]).strip()
            if not c or c == 'nan': continue
            
            match = re.match(r'^(\d{2,6}|31-33)\s+(.*)', c)
            if match:
                cod, desc = match.groups()
                # Filtro Estricto: Solo 3 d√≠gitos
                if len(cod) == 3 and cod != '31-33':
                    val_act = clean(row.iloc[idx_act])
                    val_prev = clean(row.iloc[idx_prev]) if idx_prev else 0.0
                    
                    filas.append({
                        'Estado': estado_act,
                        'Codigo': cod,
                        'Actividad': desc,
                        'Sector': clasificar(cod), 
                        'Inversion': val_act, 
                        'Inversion_Anterior': val_prev
                    })
            elif not c[0].isdigit() and "total" not in c.lower() and "nota" not in c.lower():
                estado_act = c
        
        df_clean = pd.DataFrame(filas)
        if not df_clean.empty:
            df_clean = limpiar_columna_estado(df_clean)

        if not df_clean.empty:
            df_totales = df_clean.groupby(['Estado', 'Sector'])[['Inversion', 'Inversion_Anterior']].sum().reset_index()
            
            df_totales['Anio'] = last_period[0]
            df_totales['Trimestre'] = last_period[1]
            
            df_totales.to_csv(os.path.join(INTERMEDIATE_DIR, "ied_totales.csv"), index=False)
            
            tops = []
            for est in df_clean['Estado'].unique():
                d_est = df_clean[df_clean['Estado'] == est]
                for sec in ['Primaria', 'Secundaria', 'Terciaria']:
                    d_sec = d_est[d_est['Sector'] == sec]
                    top3 = d_sec.sort_values('Inversion', ascending=False).head(3).copy()
                    tops.append(top3)
            
            if tops:
                df_tops = pd.concat(tops)
                
                df_tops['Anio'] = last_period[0]
                df_tops['Trimestre'] = last_period[1]
                
                df_tops.to_csv(os.path.join(INTERMEDIATE_DIR, "ied_top3_sectores.csv"), index=False)
                return f"‚úÖ [IED] Completado (Periodo {last_period})."
        
        return "‚ö†Ô∏è [IED] Sin datos extra√≠dos."
        
    except Exception as e: return f"‚ùå [IED] Error: {e}"

# ==========================================
# M√ìDULO 7: SAIC (Local)
# ==========================================
def procesar_saic():
    print("‚è≥ [SAIC] Procesando censo...")
    fpath = os.path.join(RAW_DIR, "SAIC.xlsx")
    if not os.path.exists(fpath): return f"‚ö†Ô∏è [SAIC] Falta {fpath}"
    
    try:
        df = pd.read_excel(fpath, header=4)
        df = df.iloc[:, [0, 1, 3, 4]]
        df.columns = ['Anio_Censal', 'Entidad', 'Personal_Ocupado', 'Produccion_Bruta']
        
        df = df.dropna(how='all')
        df = df[~df['Anio_Censal'].astype(str).str.lower().str.startswith('nota')]
        df = df.dropna(subset=['Entidad'])
        
        def clean_entidad(val):
            return re.sub(r'^\d+\s+', '', str(val).strip())

        def clean_numeric(val):
            if pd.isna(val): return 0.0
            if isinstance(val, str):
                val = val.replace(',', '').strip()
                if val == '' or val == '-': return 0.0
            return float(val)

        df['Entidad'] = df['Entidad'].apply(clean_entidad)
        df = limpiar_columna_estado(df)
        df['Personal_Ocupado'] = df['Personal_Ocupado'].apply(clean_numeric)
        df['Produccion_Bruta'] = df['Produccion_Bruta'].apply(clean_numeric)

        df['Indicador_Productividad'] = df.apply(
            lambda row: (row['Produccion_Bruta'] / row['Personal_Ocupado']) * 1000
            if row['Personal_Ocupado'] != 0 else 0.0, 
            axis=1
        )
        
        cols_finales = ['Anio_Censal', 'Entidad', 'Personal_Ocupado', 'Produccion_Bruta', 'Indicador_Productividad']
        df = df[cols_finales]
        
        df.to_csv(os.path.join(INTERMEDIATE_DIR, "saic_productividad.csv"), index=False)
        return "‚úÖ [SAIC] Completado."
        
    except Exception as e: return f"‚ùå [SAIC] Error: {e}"

# ==========================================
# M√ìDULO 8: IMCO (Local)
# ==========================================
def procesar_imco():
    print("‚è≥ [IMCO] Procesando competitividad...")
    f_gen = os.path.join(RAW_DIR, "imco_general.csv")
    f_des = os.path.join(RAW_DIR, "imco_desagregado.csv")
    if not os.path.exists(f_gen) or not os.path.exists(f_des): return "‚ö†Ô∏è [IMCO] Faltan archivos."
    
    try:
        # General
        try: df_g = pd.read_csv(f_gen, encoding='utf-8')
        except: df_g = pd.read_csv(f_gen, encoding='latin-1')
        cols_map = {c: 'A√±o' if 'A√É¬±o' in c else 'Cambio' if 'posici√É¬≥n' in c else c for c in df_g.columns}
        df_g.rename(columns=cols_map, inplace=True)
        df_g = df_g[df_g['A√±o'] == df_g['A√±o'].max()]
        df_g = limpiar_columna_estado(df_g)
        df_g.to_csv(os.path.join(INTERMEDIATE_DIR, "imco_general_final.csv"), index=False)
        
        # Desagregado
        try: df_d = pd.read_csv(f_des, encoding='utf-8')
        except: df_d = pd.read_csv(f_des, encoding='latin-1')
        cols_map_d = {c: 'Sub√≠ndice' if 'Sub√É¬≠ndice' in c else c for c in df_d.columns}
        df_d.rename(columns=cols_map_d, inplace=True)
        df_d = limpiar_columna_estado(df_d)
        
        fechas = sorted(df_d['Date'].unique(), reverse=True)[:2]
        df_d = df_d[df_d['Date'].isin(fechas)].copy()
        df_d['Rank'] = df_d.groupby(['Date', 'Indicador'])['Value'].rank(ascending=False, method='min')
        
        if len(fechas) >= 2:
            df_curr = df_d[df_d['Date'] == fechas[0]].copy()
            df_prev = df_d[df_d['Date'] == fechas[1]][['Entidad', 'Indicador', 'Rank']].rename(columns={'Rank': 'Rank_Prev'})
            df_fin = df_curr.merge(df_prev, on=['Entidad', 'Indicador'], how='left')
            df_fin['Cambio_Posicion'] = df_fin['Rank_Prev'] - df_fin['Rank']
            df_fin['Cambio_Posicion'] = df_fin['Cambio_Posicion'].fillna(0)
        else:
            df_fin = df_d; df_fin['Cambio_Posicion'] = 0
            
        df_fin.to_csv(os.path.join(INTERMEDIATE_DIR, "imco_desagregado_final.csv"), index=False)
        return "‚úÖ [IMCO] Completado."
    except Exception as e: return f"‚ùå [IMCO] Error: {e}"

# ==========================================
# M√ìDULO 9: SALARIOS IMSS (Selenium)
# ==========================================
def procesar_salarios_imss():
    print("‚è≥ [Salarios IMSS] Iniciando extracci√≥n de 32 estados con Selenium...")
    tiempo_inicio_script = time.time() - 2
    
    # Inicializamos el driver como None para poder cerrarlo de forma segura en caso de error
    driver = None 
    try:
        opciones = webdriver.ChromeOptions()
        prefs = {"download.default_directory" : RAW_DIR}
        opciones.add_experimental_option("prefs", prefs)
        opciones.add_argument("--lang=es-MX") 
        
        driver = webdriver.Chrome(options=opciones)
        driver.get("https://public.tableau.com/app/profile/imss.cpe/viz/Histrico_4/Empleo_h?publish=yes")
        wait = WebDriverWait(driver, 20)
        df_master = pd.DataFrame()

        # A. Manejar el banner de cookies
        try:
            btn_cookies = wait.until(EC.element_to_be_clickable((By.ID, "onetrust-accept-btn-handler")))
            btn_cookies.click()
            time.sleep(1) 
        except: pass

        # B. Entrar al iFrame y Pesta√±a
        iframe = wait.until(EC.presence_of_element_located((By.TAG_NAME, "iframe")))
        driver.switch_to.frame(iframe)
        
        xpath_pestana = "//div[contains(@class, 'tabStoryPointContent') and contains(normalize-space(), 'Cifras de salario')]"
        tab_salario = wait.until(EC.element_to_be_clickable((By.XPATH, xpath_pestana)))
        tab_salario.click()
        time.sleep(2)

        # D y E. Filtro Entidad y (Todo)
        xpath_filtro_entidad = "(//span[@role='combobox'])[1]"
        filtro_entidad = wait.until(EC.element_to_be_clickable((By.XPATH, xpath_filtro_entidad)))
        filtro_entidad.click()
        time.sleep(2)
        
        xpath_todo_box = "//div[@role='checkbox' and .//a[@title='(Todo)' or @title='(All)']]//div[@class='fakeCheckBox']"
        try:
            box_todo = wait.until(EC.presence_of_element_located((By.XPATH, xpath_todo_box)))
            ActionChains(driver).move_to_element(box_todo).click().perform()
        except: pass
        time.sleep(2) 

        estados = [
            "Aguascalientes", "Baja California", "Baja California Sur", "Campeche", "Chiapas", 
            "Chihuahua", "Ciudad de M√©xico", "Coahuila de Zaragoza", "Colima", "Durango", 
            "Guanajuato", "Guerrero", "Hidalgo", "Jalisco", "M√©xico", "Michoac√°n de Ocampo", 
            "Morelos", "Nayarit", "Nuevo Le√≥n", "Oaxaca", "Puebla", "Quer√©taro", 
            "Quintana Roo", "San Luis Potos√≠", "Sinaloa", "Sonora", "Tabasco", 
            "Tamaulipas", "Tlaxcala", "Veracruz de Ignacio de la Llave", "Yucat√°n", "Zacatecas"
        ]
        xpath_search = "//textarea[contains(@class, 'QueryBox')]"

        for estado in estados:
            try:
                search_box = wait.until(EC.presence_of_element_located((By.XPATH, xpath_search)))
                search_box.send_keys(Keys.CONTROL, "a")
                search_box.send_keys(Keys.DELETE)
                search_box.send_keys(estado)
                time.sleep(1) 
                
                xpath_estado_box = f"//div[@role='checkbox' and .//a[@title='{estado}']]//div[@class='fakeCheckBox']"
                box_estado = wait.until(EC.presence_of_element_located((By.XPATH, xpath_estado_box)))
                ActionChains(driver).move_to_element(box_estado).pause(0.5).click().perform()
                ActionChains(driver).send_keys(Keys.ESCAPE).perform()
                time.sleep(2) 
                
                # Proceso de Descarga
                xpath_btn_descarga = "//button[@data-tb-test-id='viz-viewer-toolbar-button-download']"
                btn_descarga = wait.until(EC.presence_of_element_located((By.XPATH, xpath_btn_descarga)))
                driver.execute_script("arguments[0].click();", btn_descarga)
                time.sleep(1) 

                xpath_crosstab = "//div[@data-tb-test-id='download-flyout-download-crosstab-MenuItem']"
                btn_crosstab = wait.until(EC.presence_of_element_located((By.XPATH, xpath_crosstab)))
                driver.execute_script("arguments[0].click();", btn_crosstab)
                
                xpath_csv_label = "//label[@data-tb-test-id='crosstab-options-dialog-radio-csv-Label']"
                btn_csv = wait.until(EC.presence_of_element_located((By.XPATH, xpath_csv_label)))
                driver.execute_script("arguments[0].click();", btn_csv)
                time.sleep(1) 

                xpath_descarga_final = "//button[@data-tb-test-id='export-crosstab-export-Button']"
                btn_descarga_final = wait.until(EC.presence_of_element_located((By.XPATH, xpath_descarga_final)))
                driver.execute_script("arguments[0].click();", btn_descarga_final)
                time.sleep(3) 
                
                # Procesamiento con Pandas
                prefijo_descarga = "Salario" 
                patron_busqueda = os.path.join(RAW_DIR, f"{prefijo_descarga}*.csv")
                archivos_candidatos = glob.glob(patron_busqueda)
                archivos_validos = [f for f in archivos_candidatos if os.path.getmtime(f) >= tiempo_inicio_script]
                
                if archivos_validos:
                    archivo_reciente = max(archivos_validos, key=os.path.getmtime)
                    df_temp = pd.read_csv(
                        archivo_reciente, skiprows=1, header=None, usecols=[0, 1], 
                        names=['Fecha', estado], encoding='utf-16', sep='\t'
                    )
                    df_temp['Fecha'] = df_temp['Fecha'].astype(str).str.replace(' de ', ' ', regex=False).str.strip()
                    
                    if df_master.empty: df_master = df_temp
                    else: df_master = pd.merge(df_master, df_temp, on='Fecha', how='outer')
                        
                    try: os.remove(archivo_reciente)
                    except: pass

                # Reset
                filtro_entidad = wait.until(EC.presence_of_element_located((By.XPATH, xpath_filtro_entidad)))
                driver.execute_script("arguments[0].scrollIntoView({block: 'center'});", filtro_entidad)
                time.sleep(1) 
                
                ActionChains(driver).move_to_element(filtro_entidad).pause(0.5).click().perform()
                time.sleep(1) 
                
                search_box = wait.until(EC.presence_of_element_located((By.XPATH, xpath_search)))
                search_box.send_keys(Keys.CONTROL, "a")
                search_box.send_keys(Keys.DELETE)
                search_box.send_keys(estado)
                time.sleep(1)
                
                box_estado_limpiar = wait.until(EC.presence_of_element_located((By.XPATH, xpath_estado_box)))
                ActionChains(driver).move_to_element(box_estado_limpiar).pause(0.5).click().perform()
                time.sleep(1) 
                
                search_box.send_keys(Keys.CONTROL, "a")
                search_box.send_keys(Keys.DELETE)
                time.sleep(1)
                
            except Exception as e:
                print(f"‚ùå [Salarios IMSS] Error procesando {estado}: {e}")

        # Ordenar Cronol√≥gicamente y Guardar
        if not df_master.empty:
            meses = {
                'enero': '01', 'febrero': '02', 'marzo': '03', 'abril': '04',
                'mayo': '05', 'junio': '06', 'julio': '07', 'agosto': '08',
                'septiembre': '09', 'octubre': '10', 'noviembre': '11', 'diciembre': '12'
            }
            df_master['Fecha_Temp'] = df_master['Fecha'].str.lower().str.strip()
            for mes_nombre, mes_numero in meses.items():
                df_master['Fecha_Temp'] = df_master['Fecha_Temp'].str.replace(mes_nombre, f"{mes_numero}/", regex=False)
            df_master['Fecha_Temp'] = df_master['Fecha_Temp'].str.replace(' ', '', regex=False)
            df_master['Fecha_Temp'] = pd.to_datetime(df_master['Fecha_Temp'], format='%m/%Y', errors='coerce')
            df_master = df_master.sort_values(by='Fecha_Temp', ascending=True).reset_index(drop=True)
            df_master = df_master.drop(columns=['Fecha_Temp'])
            
            ruta_salida = os.path.join(INTERMEDIATE_DIR, "salarios_imss.csv")
            df_master.to_csv(ruta_salida, index=False, encoding='utf-8-sig')
            
            driver.quit()
            return f"‚úÖ [Salarios IMSS] Completado. Archivo consolidado guardado."
        else:
            driver.quit()
            return "‚ö†Ô∏è [Salarios IMSS] El DataFrame maestro est√° vac√≠o."
            
    except Exception as e:
        if driver: driver.quit()
        return f"‚ùå [Salarios IMSS] Error general: {e}"


# ==========================================
# M√ìDULO 10: PUESTOS IMSS (Selenium)
# ==========================================
def procesar_puestos_imss():
    print("‚è≥ [Puestos IMSS] Iniciando extracci√≥n directa con Selenium...")
    tiempo_inicio_script = time.time() - 2
    driver = None
    
    try:
        opciones = webdriver.ChromeOptions()
        prefs = {"download.default_directory" : RAW_DIR}
        opciones.add_experimental_option("prefs", prefs)
        opciones.add_argument("--lang=es-MX") 
        
        driver = webdriver.Chrome(options=opciones)
        driver.get("https://public.tableau.com/app/profile/imss.cpe/viz/Histrico_4/Empleo_h?publish=yes")
        wait = WebDriverWait(driver, 20)

        try:
            btn_cookies = wait.until(EC.element_to_be_clickable((By.ID, "onetrust-accept-btn-handler")))
            btn_cookies.click()
            time.sleep(1) 
        except: pass

        iframe = wait.until(EC.presence_of_element_located((By.TAG_NAME, "iframe")))
        driver.switch_to.frame(iframe)
        time.sleep(5) 

        # Proceso de Descarga
        xpath_btn_descarga = "//button[@data-tb-test-id='viz-viewer-toolbar-button-download']"
        btn_descarga = wait.until(EC.presence_of_element_located((By.XPATH, xpath_btn_descarga)))
        driver.execute_script("arguments[0].click();", btn_descarga)
        time.sleep(1) 

        xpath_crosstab = "//div[@data-tb-test-id='download-flyout-download-crosstab-MenuItem']"
        btn_crosstab = wait.until(EC.presence_of_element_located((By.XPATH, xpath_crosstab)))
        driver.execute_script("arguments[0].click();", btn_crosstab)
        time.sleep(2)
        
        xpath_csv_label = "//label[@data-tb-test-id='crosstab-options-dialog-radio-csv-Label']"
        btn_csv = wait.until(EC.presence_of_element_located((By.XPATH, xpath_csv_label)))
        driver.execute_script("arguments[0].click();", btn_csv)
        time.sleep(1) 

        xpath_descarga_final = "//button[@data-tb-test-id='export-crosstab-export-Button']"
        btn_descarga_final = wait.until(EC.presence_of_element_located((By.XPATH, xpath_descarga_final)))
        driver.execute_script("arguments[0].click();", btn_descarga_final)
        time.sleep(5) 

        # B√∫squeda quir√∫rgica y limpieza
        prefijo_descarga = "Nacional" 
        patron_busqueda = os.path.join(RAW_DIR, f"{prefijo_descarga}*.csv")
        archivos_candidatos = glob.glob(patron_busqueda)
        archivos_validos = [f for f in archivos_candidatos if os.path.getmtime(f) >= tiempo_inicio_script]

        if archivos_validos:
            archivo_reciente = max(archivos_validos, key=os.path.getmtime)
            df = pd.read_csv(archivo_reciente, skiprows=1, encoding='utf-16', sep='\t')
            
            nuevos_nombres = {df.columns[0]: 'A√±o', df.columns[1]: 'Mes'}
            df.rename(columns=nuevos_nombres, inplace=True)
            
            try: os.remove(archivo_reciente)
            except: pass
                
            ruta_salida = os.path.join(INTERMEDIATE_DIR, "puestos_imss.csv") 
            df.to_csv(ruta_salida, index=False, encoding='utf-8-sig')
            
            driver.quit()
            return f"‚úÖ [Puestos IMSS] Completado. Archivo guardado."
        else:
            driver.quit()
            return "‚ö†Ô∏è [Puestos IMSS] No se detect√≥ ning√∫n archivo CSV descargado."
            
    except Exception as e:
        if driver: driver.quit()
        return f"‚ùå [Puestos IMSS] Error general: {e}"

# ==========================================
# ORQUESTADOR
# ==========================================
def main():
    inicio = time.time()
    print("\nüöÄ INICIANDO ETL ESTATAL UNIFICADO üöÄ\n")
    
    tareas = [
        procesar_pib, procesar_exportaciones, procesar_poblacion_api, 
        procesar_enoe_auto, procesar_educacion, procesar_ied, 
        procesar_saic, procesar_imco, procesar_salarios_imss, procesar_puestos_imss
    ]
    
    with concurrent.futures.ThreadPoolExecutor(max_workers=8) as executor:
        futuros = {executor.submit(t): t.__name__ for t in tareas}
        for futuro in concurrent.futures.as_completed(futuros):
            print(f"{futuro.result()}")
                
    print(f"\n‚ú® PROCESO TERMINADO EN {time.time()-inicio:.2f} SEGUNDOS ‚ú®")
    print(f"üìÇ Archivos en: {INTERMEDIATE_DIR}")

if __name__ == "__main__":
    main()

üìç Ra√≠z del Proyecto: c:\Users\Edward\Desktop\Bancomext\Estatales
üìÇ Datos Crudos: c:\Users\Edward\Desktop\Bancomext\Estatales\data\raw
üìÇ Datos Procesados: c:\Users\Edward\Desktop\Bancomext\Estatales\data\intermediate
--------------------------------------------------------------------------------

üöÄ INICIANDO ETL ESTATAL UNIFICADO üöÄ

‚è≥ [PIB] Iniciando extracci√≥n exhaustiva...
‚è≥ [Exportaciones] Iniciando extracci√≥n detallada...
‚è≥ [Poblaci√≥n] Iniciando extracci√≥n de pir√°mide completa...
‚è≥ [ENOE] Iniciando descarga y procesamiento...
‚è≥ [Educaci√≥n] Procesando anuario (Generando Top 3 separados)...
‚è≥ [IED] Procesando datos complejos (Totales 3 D√≠gitos y Detalle)...
‚è≥ [SAIC] Procesando censo...
‚è≥ [IMCO] Procesando competitividad...
‚è≥ [Salarios IMSS] Iniciando extracci√≥n de 32 estados con Selenium...
‚úÖ [IMCO] Completado.
‚è≥ [Puestos IMSS] Iniciando extracci√≥n directa con Selenium...
‚úÖ [SAIC] Completado.
   üì• Descargando: https://www.inegi.org.