In [13]:
# === IMPORTACIÓN DE LIBRERÍAS ===
import os                   
import requests             
import pandas as pd         
import json                 
from dotenv import load_dotenv  

In [14]:
load_dotenv()
URL = "https://cramer.buk.cl/apidocs#!/Inasistencias/get_absences_absence"

In [15]:
# === AUTENTICACIÓN Y HEADERS ===
# Obtiene el token de autenticación desde variable de entorno (más seguro)
TOKEN = os.getenv("TOKEN")
if not TOKEN:
    # Si no encuentra el token, termina el programa con mensaje de error
    raise SystemExit("ERROR: Define la variable de entorno BUK_AUTH_TOKEN con tu token")

print("✅ Token encontrado exitosamente")

# Configura los headers que se enviarán en cada petición HTTP
HEADERS = {
    "auth_token": TOKEN,           # Token de autenticación para la API
    "Accept": "application/json",  # Le dice al servidor que esperamos respuesta en JSON
    "Content-Type": "application/json"  # Especifica el tipo de contenido que enviamos
}

✅ Token encontrado exitosamente


In [16]:
# === FUNCIÓN MEJORADA PARA MÚLTIPLES ENDPOINTS CON FILTRO DE FECHAS ===
from datetime import datetime, date

def fetch_data_from_multiple_endpoints(fecha_inicio="2025-05-01", fecha_fin=None):
    """
    Obtiene datos de múltiples endpoints de BUK con filtro de fechas y los combina.
    Maneja paginación automáticamente para cada endpoint.
    
    Args:
        fecha_inicio (str): Fecha de inicio en formato 'YYYY-MM-DD'. Por defecto '2025-05-01'
        fecha_fin (str): Fecha de fin en formato 'YYYY-MM-DD'. Si es None, usa fecha actual
    
    Returns:
        tuple: (datos_combinados, datos_por_endpoint, info_fechas)
    """
    
    # Procesar fechas
    if fecha_fin is None:
        fecha_fin = date.today().strftime('%Y-%m-%d')
    
    # Validar formato de fechas
    try:
        datetime.strptime(fecha_inicio, '%Y-%m-%d')
        datetime.strptime(fecha_fin, '%Y-%m-%d')
    except ValueError as e:
        raise ValueError(f"Formato de fecha inválido. Usa 'YYYY-MM-DD'. Error: {e}")
    
    # Información de fechas para retornar
    info_fechas = {
        'fecha_inicio': fecha_inicio,
        'fecha_fin': fecha_fin,
        'fecha_extraccion': datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    }
    
    # Configuración de endpoints
    base_url = "https://cramer.buk.cl/api/v1/chile"
    endpoints = {
        "inasistencias": "/absences/absence",
        "licencias": "/absences/licence", 
        "permisos": "/absences/permission"
    }
    
    # Diccionario para almacenar datos de cada endpoint
    all_data = {}
    combined_records = []
    
    print("INICIANDO EXTRACCIÓN DE MÚLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS")
    print("=" * 70)
    print(f"Período: {fecha_inicio} a {fecha_fin}")
    print("=" * 70)
    
    # Iterar por cada endpoint
    for endpoint_name, endpoint_path in endpoints.items():
        print(f"\nPROCESANDO ENDPOINT: {endpoint_name.upper()}")
        print(f"URL: {base_url}{endpoint_path}")
        print("-" * 50)
        
        # Construir URL completa con parámetros de fecha
        url = f"{base_url}{endpoint_path}"
        records_from_endpoint = []
        page_count = 0
        
        # Bucle de paginación para cada endpoint
        while url:
            try:
                print(f"📄 Página {page_count + 1}...")
                
                # Preparar parámetros de la petición con filtro de fechas
                params = {
                    'from': fecha_inicio,
                    'to': fecha_fin
                }
                
                # Realizar petición con parámetros de fecha
                response = requests.get(url, headers=HEADERS, params=params, timeout=15)
                response.raise_for_status()
                
                # Procesar respuesta
                json_data = response.json()
                
                # Extraer datos (estructura típica de BUK)
                page_data = json_data.get("data", [])
                
                if not page_data:
                    print(f"   ℹ️ No hay datos en esta página para el período especificado")
                    break
                
                # Agregar metadatos a cada registro
                for record in page_data:
                    if isinstance(record, dict):
                        record['_source_endpoint'] = endpoint_name
                        record['_source_url'] = f"{base_url}{endpoint_path}"
                        record['_fecha_extraccion'] = info_fechas['fecha_extraccion']
                
                records_from_endpoint.extend(page_data)
                print(f"   ✅ {len(page_data)} registros obtenidos (período: {fecha_inicio} a {fecha_fin})")
                
                # Buscar siguiente página
                pagination_info = json_data.get("pagination", {})
                next_url = pagination_info.get("next")
                
                if next_url:
                    # Mantener los parámetros de fecha en la siguiente página
                    url = next_url
                else:
                    url = None  # No hay más páginas
                
                page_count += 1
                
            except requests.HTTPError as e:
                print(f"❌ Error HTTP: {e}")
                print(f"📊 Status Code: {getattr(e.response, 'status_code', 'N/A')}")
                if hasattr(e.response, 'text'):
                    print(f"📄 Respuesta: {e.response.text[:300]}...")
                break
                
            except requests.RequestException as e:
                print(f"🌐 Error de conexión: {e}")
                break
                
            except ValueError as e:
                print(f"📋 Error JSON: {e}")
                if 'response' in locals():
                    print(f"📄 Respuesta: {response.text[:300]}...")
                break
        
        # Guardar resultados del endpoint
        all_data[endpoint_name] = records_from_endpoint
        combined_records.extend(records_from_endpoint)
        
        print(f"📊 Total {endpoint_name}: {len(records_from_endpoint)} registros en {page_count} páginas")
        print(f"📅 Período procesado: {fecha_inicio} a {fecha_fin}")
    
    # Resumen final
    print(f"\n" + "="*70)
    print(f"📈 RESUMEN DE EXTRACCIÓN COMPLETA CON FILTRO DE FECHAS:")
    print(f"📅 Período extraído: {fecha_inicio} a {fecha_fin}")
    print(f"🔢 Total endpoints procesados: {len(endpoints)}")
    
    for endpoint_name, records in all_data.items():
        print(f"   📊 {endpoint_name.capitalize()}: {len(records)} registros")
    
    print(f"🎯 TOTAL COMBINADO: {len(combined_records)} registros")
    print(f"⏰ Fecha de extracción: {info_fechas['fecha_extraccion']}")
    print(f"="*70)
    
    return combined_records, all_data, info_fechas

In [17]:
# === INFORMACIÓN DETALLADA DE LOS ENDPOINTS ===
print("📊 DETALLES DE LOS ENDPOINTS CONFIGURADOS")
print("=" * 60)

# Información sobre los endpoints (sin modificar la variable original)
base_url = "https://cramer.buk.cl/api/v1/chile"
endpoint_info = {
    "inasistencias": {
        "path": "/absences/absence",
        "method": "GET",
        "descripcion": "Obtiene registros de inasistencias/ausencias",
        "filtros_fecha": "Soporta parámetros 'from' y 'to'",
        "paginacion": "Sí (automática)"
    },
    "licencias": {
        "path": "/absences/licence",
        "method": "GET", 
        "descripcion": "Obtiene registros de licencias médicas",
        "filtros_fecha": "Soporta parámetros 'from' y 'to'",
        "paginacion": "Sí (automática)"
    },
    "permisos": {
        "path": "/absences/permission",
        "method": "GET",
        "descripcion": "Obtiene registros de permisos",
        "filtros_fecha": "Soporta parámetros 'from' y 'to'",
        "paginacion": "Sí (automática)"
    }
}

for nombre, info in endpoint_info.items():
    print(f"\n🔗 ENDPOINT: {nombre.upper()}")
    print(f"   📍 URL completa: {base_url}{info['path']}")
    print(f"   🔧 Método HTTP: {info['method']}")
    print(f"   📝 Descripción: {info['descripcion']}")
    print(f"   📅 Filtros de fecha: {info['filtros_fecha']}")
    print(f"   📄 Paginación: {info['paginacion']}")

print(f"\n✅ CONFIRMACIÓN:")
print(f"   • Todos los endpoints utilizan método GET")
print(f"   • Todos soportan filtros de fecha via query parameters")
print(f"   • La autenticación se realiza via header 'auth_token'")
print(f"   • Los parámetros de fecha van en la URL como ?from=YYYY-MM-DD&to=YYYY-MM-DD")

print(f"\n🌐 EJEMPLO DE URL COMPLETA CON FILTROS:")
ejemplo_fecha_inicio = "2025-05-01"
ejemplo_fecha_fin = "2025-08-25"
print(f"   {base_url}/absences/absence?from={ejemplo_fecha_inicio}&to={ejemplo_fecha_fin}")
print(f"\n📋 ESTRUCTURA DE LA PETICIÓN:")
print(f"   • Método: GET")
print(f"   • Headers: auth_token, Accept, Content-Type")
print(f"   • Query Params: from, to")
print(f"   • Timeout: 15 segundos")
print("=" * 60)

📊 DETALLES DE LOS ENDPOINTS CONFIGURADOS

🔗 ENDPOINT: INASISTENCIAS
   📍 URL completa: https://cramer.buk.cl/api/v1/chile/absences/absence
   🔧 Método HTTP: GET
   📝 Descripción: Obtiene registros de inasistencias/ausencias
   📅 Filtros de fecha: Soporta parámetros 'from' y 'to'
   📄 Paginación: Sí (automática)

🔗 ENDPOINT: LICENCIAS
   📍 URL completa: https://cramer.buk.cl/api/v1/chile/absences/licence
   🔧 Método HTTP: GET
   📝 Descripción: Obtiene registros de licencias médicas
   📅 Filtros de fecha: Soporta parámetros 'from' y 'to'
   📄 Paginación: Sí (automática)

🔗 ENDPOINT: PERMISOS
   📍 URL completa: https://cramer.buk.cl/api/v1/chile/absences/permission
   🔧 Método HTTP: GET
   📝 Descripción: Obtiene registros de permisos
   📅 Filtros de fecha: Soporta parámetros 'from' y 'to'
   📄 Paginación: Sí (automática)

✅ CONFIRMACIÓN:
   • Todos los endpoints utilizan método GET
   • Todos soportan filtros de fecha via query parameters
   • La autenticación se realiza via header 'auth_

In [18]:
# === EXTRACCIÓN COMBINADA CON RANGO DE FECHAS ===
print("🚀 EXTRAYENDO DATOS DE MÚLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS")
print("=" * 70)

try:
    # CONFIGURAR FECHAS AQUÍ:
    fecha_inicio = "2025-05-01"  
    fecha_fin = None             
    
    print(f" Configuración de fechas:")
    print(f"   • Fecha inicio: {fecha_inicio}")
    print(f"   • Fecha fin: {'Fecha actual' if fecha_fin is None else fecha_fin}")
    
    # Paso 1: Extraer de todos los endpoints CON RANGO DE FECHAS
    print(f"\n📡 Obteniendo datos desde múltiples APIs con filtro de fechas...")
    datos_combinados, datos_por_endpoint, info_fechas = fetch_data_from_multiple_endpoints(
        fecha_inicio=fecha_inicio, 
        fecha_fin=fecha_fin
    )
    
    if datos_combinados:
        print(f"\n✅ EXTRACCIÓN EXITOSA!")
        print(f"   📊 Total registros combinados: {len(datos_combinados)}")
        print(f"   📅 Período real extraído: {info_fechas['fecha_inicio']} a {info_fechas['fecha_fin']}")
        
        # Paso 2: Convertir a DataFrame combinado
        print(f"\n🔄 Creando DataFrame combinado...")
        df_combinado = pd.json_normalize(datos_combinados, sep="_")
        
        print(f"   📊 DataFrame combinado: {df_combinado.shape[0]} filas × {df_combinado.shape[1]} columnas")
        
        # Paso 3: Mostrar información por endpoint
        print(f"\n📋 DESGLOSE POR ENDPOINT:")
        if '_source_endpoint' in df_combinado.columns:
            conteo_por_endpoint = df_combinado['_source_endpoint'].value_counts()
            for endpoint, cantidad in conteo_por_endpoint.items():
                porcentaje = (cantidad / len(df_combinado)) * 100
                print(f"   • {endpoint.capitalize()}: {cantidad} registros ({porcentaje:.1f}%)")
        
        # Paso 4: Mostrar columnas disponibles
        print(f"\n📋 COLUMNAS DISPONIBLES ({len(df_combinado.columns)}):")
        columnas_por_fila = 3
        columnas = list(df_combinado.columns)
        
        for i in range(0, len(columnas), columnas_por_fila):
            fila_columnas = columnas[i:i+columnas_por_fila]
            print(f"   {i+1:2d}-{min(i+columnas_por_fila, len(columnas)):2d}. {' | '.join(fila_columnas)}")
        
        # Paso 5: Mostrar muestra de datos
        print(f"\n📄 MUESTRA DE DATOS COMBINADOS:")
        display(df_combinado.head())
        
        # Paso 6: Procesar campos de fecha
        print(f"\n📅 Procesando campos de fecha...")
        date_keywords = ["start_date", "end_date", "application_date", "created_at", "updated_at"]
        fechas_convertidas = 0
        for column in df_combinado.columns:
            if any(keyword in column.lower() for keyword in date_keywords):
                df_combinado[column] = pd.to_datetime(df_combinado[column], errors="coerce")
                fechas_convertidas += 1
                print(f"   ✅ Campo '{column}' convertido a fecha")
        
        print(f"   📊 Total campos de fecha convertidos: {fechas_convertidas}")
        
        # Paso 7: Validar rango de fechas en los datos
        if 'start_date' in df_combinado.columns:
            df_fechas_validas = df_combinado.dropna(subset=['start_date'])
            if len(df_fechas_validas) > 0:
                fecha_min_datos = df_fechas_validas['start_date'].min()
                fecha_max_datos = df_fechas_validas['start_date'].max()
                print(f"\n📈 VALIDACIÓN DE RANGO DE FECHAS:")
                print(f"   • Fecha mínima en datos: {fecha_min_datos.date()}")
                print(f"   • Fecha máxima en datos: {fecha_max_datos.date()}")
                print(f"   • Registros con fechas válidas: {len(df_fechas_validas):,}")
        
        # Paso 8: Guardar en variables globales
        globals()['df_buk_combinado'] = df_combinado
        globals()['datos_por_endpoint'] = datos_por_endpoint
        globals()['info_extraccion'] = info_fechas
        
        print(f"\n💾 DATOS GUARDADOS:")
        print(f"   • Variable 'df_buk_combinado': DataFrame con todos los datos")
        print(f"   • Variable 'datos_por_endpoint': Diccionario separado por endpoint")
        print(f"   • Variable 'info_extraccion': Información del rango de fechas usado")
        
        # Paso 9: Estadísticas finales
        print(f"\n📈 ESTADÍSTICAS FINALES:")
        print(f"   • Total registros: {len(df_combinado):,}")
        print(f"   • Total columnas: {len(df_combinado.columns)}")
        print(f"   • Período: {info_fechas['fecha_inicio']} a {info_fechas['fecha_fin']}")
        print(f"   • Memoria utilizada: {df_combinado.memory_usage(deep=True).sum() / 1024**2:.2f} MB")
        
        # Mostrar campos únicos por endpoint
        if '_source_endpoint' in df_combinado.columns:
            print(f"\n🔍 CAMPOS PRINCIPALES POR ENDPOINT:")
            for endpoint in df_combinado['_source_endpoint'].unique():
                df_endpoint = df_combinado[df_combinado['_source_endpoint'] == endpoint]
                campos_no_nulos = df_endpoint.notna().sum()
                campos_principales = campos_no_nulos[campos_no_nulos > 0].head(5)
                print(f"   • {endpoint.capitalize()}:")
                for campo, cantidad in campos_principales.items():
                    if campo not in ['_source_endpoint', '_source_url', '_fecha_extraccion']:
                        print(f"     - {campo}: {cantidad} registros")
        
    else:
        print("❌ No se pudieron obtener datos de ningún endpoint")
        print("💡 Posibles causas:")
        print("   • Tu token de autenticación no es válido")
        print("   • Las URLs de los endpoints no son correctas")
        print("   • No hay datos en el rango de fechas especificado")
        print("   • Problemas de conectividad")
        print(f"\n🔧 Sugerencias:")
        print(f"   • Verifica tu token en la variable de entorno")
        print(f"   • Prueba con un rango de fechas diferente")
        print(f"   • Revisa los logs de error arriba")
        
except Exception as e:
    print(f"💥 Error inesperado: {e}")
    print(f"   Tipo de error: {type(e).__name__}")
    import traceback
    print(f"   Detalles: {traceback.format_exc()}")
    
    # Información para debugging
    print(f"\n🔧 Para debugging:")
    print(f"   • Verifica que HEADERS esté definido")
    print(f"   • Confirma que tienes conexión a internet")
    print(f"   • Ejecuta las celdas anteriores primero")

🚀 EXTRAYENDO DATOS DE MÚLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS
 Configuración de fechas:
   • Fecha inicio: 2025-05-01
   • Fecha fin: Fecha actual

📡 Obteniendo datos desde múltiples APIs con filtro de fechas...
INICIANDO EXTRACCIÓN DE MÚLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS
Período: 2025-05-01 a 2025-08-25

PROCESANDO ENDPOINT: INASISTENCIAS
URL: https://cramer.buk.cl/api/v1/chile/absences/absence
--------------------------------------------------
📄 Página 1...
   ✅ 25 registros obtenidos (período: 2025-05-01 a 2025-08-25)
📄 Página 2...
   ✅ 25 registros obtenidos (período: 2025-05-01 a 2025-08-25)
📄 Página 2...
   ✅ 11 registros obtenidos (período: 2025-05-01 a 2025-08-25)
📊 Total inasistencias: 36 registros en 2 páginas
📅 Período procesado: 2025-05-01 a 2025-08-25

PROCESANDO ENDPOINT: LICENCIAS
URL: https://cramer.buk.cl/api/v1/chile/absences/licence
--------------------------------------------------
📄 Página 1...
   ✅ 11 registros obtenidos (período: 2025-05-01 a 2025-08

Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,medic_name,risk_type,sequela,incapacities_control,permission_type_id,permission_type_code,paid,time_measure,start_time,end_time
0,105184,2025-05-05,2025-05-05,1.0,1.0,0.0,full_working_day,2025-05-05,2025-05-05,Ausencia sin licencia médica,...,,,,,,,,,,
1,105185,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,Ausencia sin licencia,...,,,,,,,,,,
2,105250,2025-05-02,2025-05-02,1.0,1.0,0.0,full_working_day,2025-05-02,2025-05-02,"Tramite personal, informado por Manuel Gamboa",...,,,,,,,,,,
3,105283,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,"Fallecimiento abuelita, se regaló 2 días y el ...",...,,,,,,,,,,
4,105547,2025-05-11,2025-05-13,3.0,1.0,0.0,full_working_day,2025-05-14,2025-05-16,,...,,,,,,,,,,



📅 Procesando campos de fecha...
   ✅ Campo 'start_date' convertido a fecha
   ✅ Campo 'end_date' convertido a fecha
   ✅ Campo 'application_date' convertido a fecha
   ✅ Campo 'application_end_date' convertido a fecha
   ✅ Campo 'created_at' convertido a fecha
   ✅ Campo 'updated_at' convertido a fecha
   📊 Total campos de fecha convertidos: 6

📈 VALIDACIÓN DE RANGO DE FECHAS:
   • Fecha mínima en datos: 2025-02-14
   • Fecha máxima en datos: 2025-08-25
   • Registros con fechas válidas: 233

💾 DATOS GUARDADOS:
   • Variable 'df_buk_combinado': DataFrame con todos los datos
   • Variable 'datos_por_endpoint': Diccionario separado por endpoint
   • Variable 'info_extraccion': Información del rango de fechas usado

📈 ESTADÍSTICAS FINALES:
   • Total registros: 233
   • Total columnas: 37
   • Período: 2025-05-01 a 2025-08-25
   • Memoria utilizada: 0.28 MB

🔍 CAMPOS PRINCIPALES POR ENDPOINT:
   • Inasistencias:
     - id: 36 registros
     - start_date: 36 registros
     - end_date: 36 

  df_combinado[column] = pd.to_datetime(df_combinado[column], errors="coerce")
  df_combinado[column] = pd.to_datetime(df_combinado[column], errors="coerce")


In [19]:
# === ANÁLISIS SEPARADO POR ENDPOINT ===
if 'datos_por_endpoint' in globals() and 'df_buk_combinado' in globals():
    print("ANÁLISIS DETALLADO POR ENDPOINT")
    print("=" * 50)
    
    for endpoint_name, registros in datos_por_endpoint.items():
        if registros:  # Solo si hay datos
            print(f"\nANÁLISIS: {endpoint_name.upper()}")
            print("-" * 30)
            
            # Crear DataFrame específico del endpoint
            df_endpoint = pd.json_normalize(registros, sep="_")
            
            print(f"Registros: {len(df_endpoint):,}")
            print(f"Columnas: {len(df_endpoint.columns)}")
            
            # Mostrar primeras 5 columnas más importantes
            print(f"Columnas principales:")
            for i, col in enumerate(df_endpoint.columns[:5], 1):
                valores_unicos = df_endpoint[col].nunique() if col in df_endpoint.columns else 0
                print(f"      {i}. {col} ({valores_unicos} valores únicos)")
            
            # Mostrar muestra
            print(f"Muestra de datos:")
            display(df_endpoint.head(3))
            
            # Guardar DataFrame individual
            globals()[f'df_{endpoint_name}'] = df_endpoint
            print(f"Guardado en variable: df_{endpoint_name}")
    
    print(f"\nANÁLISIS COMPLETADO")
    print(f"Variables disponibles:")
    print(f"   • df_buk_combinado: Todos los datos juntos")
    for endpoint_name in datos_por_endpoint.keys():
        if datos_por_endpoint[endpoint_name]:
            print(f"   • df_{endpoint_name}: Datos solo de {endpoint_name}")

else:
    print("Primero ejecuta la celda de extracción combinada")

ANÁLISIS DETALLADO POR ENDPOINT

ANÁLISIS: INASISTENCIAS
------------------------------
Registros: 36
Columnas: 19
Columnas principales:
      1. id (36 valores únicos)
      2. start_date (28 valores únicos)
      3. end_date (28 valores únicos)
      4. days_count (4 valores únicos)
      5. day_percent (1 valores únicos)
Muestra de datos:


Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,employee_id,status,created_at,updated_at,absence_type_id,absence_type_code,_source_endpoint,_source_url,_fecha_extraccion
0,105184,2025-05-05,2025-05-05,1.0,1,0.0,full_working_day,2025-05-05,2025-05-05,Ausencia sin licencia médica,6237,approved,2025-05-08T12:41:23.366-04:00,2025-05-08T12:41:23.366-04:00,2,ausencia,inasistencias,https://cramer.buk.cl/api/v1/chile/absences/ab...,2025-08-25 16:53:46
1,105185,2025-05-08,2025-05-08,1.0,1,0.0,full_working_day,2025-05-08,2025-05-08,Ausencia sin licencia,4918,approved,2025-05-08T12:42:26.143-04:00,2025-05-08T12:42:26.143-04:00,2,ausencia,inasistencias,https://cramer.buk.cl/api/v1/chile/absences/ab...,2025-08-25 16:53:46
2,105250,2025-05-02,2025-05-02,1.0,1,0.0,full_working_day,2025-05-02,2025-05-02,"Tramite personal, informado por Manuel Gamboa",4191,approved,2025-05-09T12:04:20.199-04:00,2025-05-09T12:04:20.199-04:00,2,ausencia,inasistencias,https://cramer.buk.cl/api/v1/chile/absences/ab...,2025-08-25 16:53:46


Guardado en variable: df_inasistencias

ANÁLISIS: LICENCIAS
------------------------------
Registros: 161
Columnas: 29
Columnas principales:
      1. id (161 valores únicos)
      2. start_date (86 valores únicos)
      3. end_date (87 valores únicos)
      4. days_count (22 valores únicos)
      5. day_percent (1 valores únicos)
Muestra de datos:


Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,format,licence_number,medic_rut,medic_name,risk_type,sequela,incapacities_control,_source_endpoint,_source_url,_fecha_extraccion
0,102676,2025-02-14,2025-05-08,84.0,1,0.0,full_working_day,2025-02-14,2025-05-08,,...,electronica,,,,,,,licencias,https://cramer.buk.cl/api/v1/chile/absences/li...,2025-08-25 16:53:46
1,104029,2025-04-02,2025-05-01,30.0,1,0.0,full_working_day,2025-04-02,2025-05-01,Licencia común,...,electronica,,,,,,,licencias,https://cramer.buk.cl/api/v1/chile/absences/li...,2025-08-25 16:53:46
2,104129,2025-04-05,2025-05-04,30.0,1,0.0,full_working_day,2025-04-05,2025-05-04,Licencia normal,...,electronica,,,,,,,licencias,https://cramer.buk.cl/api/v1/chile/absences/li...,2025-08-25 16:53:46


Guardado en variable: df_licencias

ANÁLISIS: PERMISOS
------------------------------
Registros: 36
Columnas: 23
Columnas principales:
      1. id (36 valores únicos)
      2. start_date (29 valores únicos)
      3. end_date (28 valores únicos)
      4. days_count (8 valores únicos)
      5. day_percent (2 valores únicos)
Muestra de datos:


Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,updated_at,permission_type_id,permission_type_code,paid,time_measure,start_time,end_time,_source_endpoint,_source_url,_fecha_extraccion
0,104986,2025-05-06,2025-05-07,2.0,1.0,0.0,full_working_day,2025-05-06,2025-05-07,Fallecimiento del abuelito,...,2025-05-06T09:13:56.325-04:00,9,permiso_fallecimiento_cramer,True,per_day,,,permisos,https://cramer.buk.cl/api/v1/chile/absences/pe...,2025-08-25 16:53:46
1,105448,2025-05-22,2025-05-22,1.0,1.0,0.0,full_working_day,2025-05-22,2025-05-22,Compensación día domingo 30-03-2025. Respaldo ...,...,2025-05-14T16:07:47.375-04:00,74,compensacion_por_viaje,True,per_day,,,permisos,https://cramer.buk.cl/api/v1/chile/absences/pe...,2025-08-25 16:53:46
2,105449,2025-05-12,2025-05-15,4.0,1.0,0.0,full_working_day,2025-05-12,2025-05-15,Fallecimiento hermana,...,2025-05-14T16:27:10.517-04:00,8,permiso_fallecimiento_legal,True,per_day,,,permisos,https://cramer.buk.cl/api/v1/chile/absences/pe...,2025-08-25 16:53:46


Guardado en variable: df_permisos

ANÁLISIS COMPLETADO
Variables disponibles:
   • df_buk_combinado: Todos los datos juntos
   • df_inasistencias: Datos solo de inasistencias
   • df_licencias: Datos solo de licencias
   • df_permisos: Datos solo de permisos


In [20]:
display(df_combinado)

Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,medic_name,risk_type,sequela,incapacities_control,permission_type_id,permission_type_code,paid,time_measure,start_time,end_time
0,105184,2025-05-05,2025-05-05,1.0,1.0,0.0,full_working_day,2025-05-05,2025-05-05,Ausencia sin licencia médica,...,,,,,,,,,,
1,105185,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,Ausencia sin licencia,...,,,,,,,,,,
2,105250,2025-05-02,2025-05-02,1.0,1.0,0.0,full_working_day,2025-05-02,2025-05-02,"Tramite personal, informado por Manuel Gamboa",...,,,,,,,,,,
3,105283,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,"Fallecimiento abuelita, se regaló 2 días y el ...",...,,,,,,,,,,
4,105547,2025-05-11,2025-05-13,3.0,1.0,0.0,full_working_day,2025-05-14,2025-05-16,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
228,108418,2025-08-18,2025-08-19,2.0,1.0,0.0,full_working_day,2025-08-18,2025-08-19,Compensación de horas por feria informada por ...,...,,,,,4.0,permiso_con_goce,True,per_day,,
229,108485,2025-08-19,2025-08-19,1.0,0.5,0.0,end_working_day,2025-08-19,2025-08-19,,...,,,,,3.0,permiso,False,per_day,,
230,108586,2025-08-12,2025-08-12,1.0,1.0,0.0,full_working_day,2025-08-12,2025-08-12,Permiso por fallecimiento de tío,...,,,,,4.0,permiso_con_goce,True,per_day,,
231,108682,2025-08-21,2025-08-22,2.0,1.0,0.0,full_working_day,2025-08-19,2025-08-20,Permiso por fallecimiento de madre pt1,...,,,,,8.0,permiso_fallecimiento_legal,True,per_day,,


In [26]:
#Exportar datos
ruta = "C:/Users/bgacitua/Desktop/Repositorio_GitHub/Scripts de Python/Solicitud API/Datos Buk"
if not os.path.exists(ruta):
    os.makedirs(ruta)

df_combinado.to_excel(os.path.join(ruta, "datos_buk_combinado.xlsx"), index=False)

ValueError: Excel does not support datetimes with timezones. Please ensure that datetimes are timezone unaware before writing to Excel.