In [13]:
# === IMPORTACI√ìN DE LIBRER√çAS ===
import os                   
import requests             
import pandas as pd         
import json                 
from dotenv import load_dotenv  

In [14]:
load_dotenv()
URL = "https://cramer.buk.cl/apidocs#!/Inasistencias/get_absences_absence"

In [15]:
# === AUTENTICACI√ìN Y HEADERS ===
# Obtiene el token de autenticaci√≥n desde variable de entorno (m√°s seguro)
TOKEN = os.getenv("TOKEN")
if not TOKEN:
    # Si no encuentra el token, termina el programa con mensaje de error
    raise SystemExit("ERROR: Define la variable de entorno BUK_AUTH_TOKEN con tu token")

print("‚úÖ Token encontrado exitosamente")

# Configura los headers que se enviar√°n en cada petici√≥n HTTP
HEADERS = {
    "auth_token": TOKEN,           # Token de autenticaci√≥n para la API
    "Accept": "application/json",  # Le dice al servidor que esperamos respuesta en JSON
    "Content-Type": "application/json"  # Especifica el tipo de contenido que enviamos
}

‚úÖ Token encontrado exitosamente


In [16]:
# === FUNCI√ìN MEJORADA PARA M√öLTIPLES ENDPOINTS CON FILTRO DE FECHAS ===
from datetime import datetime, date

def fetch_data_from_multiple_endpoints(fecha_inicio="2025-05-01", fecha_fin=None):
    """
    Obtiene datos de m√∫ltiples endpoints de BUK con filtro de fechas y los combina.
    Maneja paginaci√≥n autom√°ticamente para cada endpoint.
    
    Args:
        fecha_inicio (str): Fecha de inicio en formato 'YYYY-MM-DD'. Por defecto '2025-05-01'
        fecha_fin (str): Fecha de fin en formato 'YYYY-MM-DD'. Si es None, usa fecha actual
    
    Returns:
        tuple: (datos_combinados, datos_por_endpoint, info_fechas)
    """
    
    # Procesar fechas
    if fecha_fin is None:
        fecha_fin = date.today().strftime('%Y-%m-%d')
    
    # Validar formato de fechas
    try:
        datetime.strptime(fecha_inicio, '%Y-%m-%d')
        datetime.strptime(fecha_fin, '%Y-%m-%d')
    except ValueError as e:
        raise ValueError(f"Formato de fecha inv√°lido. Usa 'YYYY-MM-DD'. Error: {e}")
    
    # Informaci√≥n de fechas para retornar
    info_fechas = {
        'fecha_inicio': fecha_inicio,
        'fecha_fin': fecha_fin,
        'fecha_extraccion': datetime.now().strftime('%Y-%m-%d %H:%M:%S')
    }
    
    # Configuraci√≥n de endpoints
    base_url = "https://cramer.buk.cl/api/v1/chile"
    endpoints = {
        "inasistencias": "/absences/absence",
        "licencias": "/absences/licence", 
        "permisos": "/absences/permission"
    }
    
    # Diccionario para almacenar datos de cada endpoint
    all_data = {}
    combined_records = []
    
    print("INICIANDO EXTRACCI√ìN DE M√öLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS")
    print("=" * 70)
    print(f"Per√≠odo: {fecha_inicio} a {fecha_fin}")
    print("=" * 70)
    
    # Iterar por cada endpoint
    for endpoint_name, endpoint_path in endpoints.items():
        print(f"\nPROCESANDO ENDPOINT: {endpoint_name.upper()}")
        print(f"URL: {base_url}{endpoint_path}")
        print("-" * 50)
        
        # Construir URL completa con par√°metros de fecha
        url = f"{base_url}{endpoint_path}"
        records_from_endpoint = []
        page_count = 0
        
        # Bucle de paginaci√≥n para cada endpoint
        while url:
            try:
                print(f"üìÑ P√°gina {page_count + 1}...")
                
                # Preparar par√°metros de la petici√≥n con filtro de fechas
                params = {
                    'from': fecha_inicio,
                    'to': fecha_fin
                }
                
                # Realizar petici√≥n con par√°metros de fecha
                response = requests.get(url, headers=HEADERS, params=params, timeout=15)
                response.raise_for_status()
                
                # Procesar respuesta
                json_data = response.json()
                
                # Extraer datos (estructura t√≠pica de BUK)
                page_data = json_data.get("data", [])
                
                if not page_data:
                    print(f"   ‚ÑπÔ∏è No hay datos en esta p√°gina para el per√≠odo especificado")
                    break
                
                # Agregar metadatos a cada registro
                for record in page_data:
                    if isinstance(record, dict):
                        record['_source_endpoint'] = endpoint_name
                        record['_source_url'] = f"{base_url}{endpoint_path}"
                        record['_fecha_extraccion'] = info_fechas['fecha_extraccion']
                
                records_from_endpoint.extend(page_data)
                print(f"   ‚úÖ {len(page_data)} registros obtenidos (per√≠odo: {fecha_inicio} a {fecha_fin})")
                
                # Buscar siguiente p√°gina
                pagination_info = json_data.get("pagination", {})
                next_url = pagination_info.get("next")
                
                if next_url:
                    # Mantener los par√°metros de fecha en la siguiente p√°gina
                    url = next_url
                else:
                    url = None  # No hay m√°s p√°ginas
                
                page_count += 1
                
            except requests.HTTPError as e:
                print(f"‚ùå Error HTTP: {e}")
                print(f"üìä Status Code: {getattr(e.response, 'status_code', 'N/A')}")
                if hasattr(e.response, 'text'):
                    print(f"üìÑ Respuesta: {e.response.text[:300]}...")
                break
                
            except requests.RequestException as e:
                print(f"üåê Error de conexi√≥n: {e}")
                break
                
            except ValueError as e:
                print(f"üìã Error JSON: {e}")
                if 'response' in locals():
                    print(f"üìÑ Respuesta: {response.text[:300]}...")
                break
        
        # Guardar resultados del endpoint
        all_data[endpoint_name] = records_from_endpoint
        combined_records.extend(records_from_endpoint)
        
        print(f"üìä Total {endpoint_name}: {len(records_from_endpoint)} registros en {page_count} p√°ginas")
        print(f"üìÖ Per√≠odo procesado: {fecha_inicio} a {fecha_fin}")
    
    # Resumen final
    print(f"\n" + "="*70)
    print(f"üìà RESUMEN DE EXTRACCI√ìN COMPLETA CON FILTRO DE FECHAS:")
    print(f"üìÖ Per√≠odo extra√≠do: {fecha_inicio} a {fecha_fin}")
    print(f"üî¢ Total endpoints procesados: {len(endpoints)}")
    
    for endpoint_name, records in all_data.items():
        print(f"   üìä {endpoint_name.capitalize()}: {len(records)} registros")
    
    print(f"üéØ TOTAL COMBINADO: {len(combined_records)} registros")
    print(f"‚è∞ Fecha de extracci√≥n: {info_fechas['fecha_extraccion']}")
    print(f"="*70)
    
    return combined_records, all_data, info_fechas

In [17]:
# === INFORMACI√ìN DETALLADA DE LOS ENDPOINTS ===
print("üìä DETALLES DE LOS ENDPOINTS CONFIGURADOS")
print("=" * 60)

# Informaci√≥n sobre los endpoints (sin modificar la variable original)
base_url = "https://cramer.buk.cl/api/v1/chile"
endpoint_info = {
    "inasistencias": {
        "path": "/absences/absence",
        "method": "GET",
        "descripcion": "Obtiene registros de inasistencias/ausencias",
        "filtros_fecha": "Soporta par√°metros 'from' y 'to'",
        "paginacion": "S√≠ (autom√°tica)"
    },
    "licencias": {
        "path": "/absences/licence",
        "method": "GET", 
        "descripcion": "Obtiene registros de licencias m√©dicas",
        "filtros_fecha": "Soporta par√°metros 'from' y 'to'",
        "paginacion": "S√≠ (autom√°tica)"
    },
    "permisos": {
        "path": "/absences/permission",
        "method": "GET",
        "descripcion": "Obtiene registros de permisos",
        "filtros_fecha": "Soporta par√°metros 'from' y 'to'",
        "paginacion": "S√≠ (autom√°tica)"
    }
}

for nombre, info in endpoint_info.items():
    print(f"\nüîó ENDPOINT: {nombre.upper()}")
    print(f"   üìç URL completa: {base_url}{info['path']}")
    print(f"   üîß M√©todo HTTP: {info['method']}")
    print(f"   üìù Descripci√≥n: {info['descripcion']}")
    print(f"   üìÖ Filtros de fecha: {info['filtros_fecha']}")
    print(f"   üìÑ Paginaci√≥n: {info['paginacion']}")

print(f"\n‚úÖ CONFIRMACI√ìN:")
print(f"   ‚Ä¢ Todos los endpoints utilizan m√©todo GET")
print(f"   ‚Ä¢ Todos soportan filtros de fecha via query parameters")
print(f"   ‚Ä¢ La autenticaci√≥n se realiza via header 'auth_token'")
print(f"   ‚Ä¢ Los par√°metros de fecha van en la URL como ?from=YYYY-MM-DD&to=YYYY-MM-DD")

print(f"\nüåê EJEMPLO DE URL COMPLETA CON FILTROS:")
ejemplo_fecha_inicio = "2025-05-01"
ejemplo_fecha_fin = "2025-08-25"
print(f"   {base_url}/absences/absence?from={ejemplo_fecha_inicio}&to={ejemplo_fecha_fin}")
print(f"\nüìã ESTRUCTURA DE LA PETICI√ìN:")
print(f"   ‚Ä¢ M√©todo: GET")
print(f"   ‚Ä¢ Headers: auth_token, Accept, Content-Type")
print(f"   ‚Ä¢ Query Params: from, to")
print(f"   ‚Ä¢ Timeout: 15 segundos")
print("=" * 60)

üìä DETALLES DE LOS ENDPOINTS CONFIGURADOS

üîó ENDPOINT: INASISTENCIAS
   üìç URL completa: https://cramer.buk.cl/api/v1/chile/absences/absence
   üîß M√©todo HTTP: GET
   üìù Descripci√≥n: Obtiene registros de inasistencias/ausencias
   üìÖ Filtros de fecha: Soporta par√°metros 'from' y 'to'
   üìÑ Paginaci√≥n: S√≠ (autom√°tica)

üîó ENDPOINT: LICENCIAS
   üìç URL completa: https://cramer.buk.cl/api/v1/chile/absences/licence
   üîß M√©todo HTTP: GET
   üìù Descripci√≥n: Obtiene registros de licencias m√©dicas
   üìÖ Filtros de fecha: Soporta par√°metros 'from' y 'to'
   üìÑ Paginaci√≥n: S√≠ (autom√°tica)

üîó ENDPOINT: PERMISOS
   üìç URL completa: https://cramer.buk.cl/api/v1/chile/absences/permission
   üîß M√©todo HTTP: GET
   üìù Descripci√≥n: Obtiene registros de permisos
   üìÖ Filtros de fecha: Soporta par√°metros 'from' y 'to'
   üìÑ Paginaci√≥n: S√≠ (autom√°tica)

‚úÖ CONFIRMACI√ìN:
   ‚Ä¢ Todos los endpoints utilizan m√©todo GET
   ‚Ä¢ Todos soportan filt

In [18]:
# === EXTRACCI√ìN COMBINADA CON RANGO DE FECHAS ===
print("üöÄ EXTRAYENDO DATOS DE M√öLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS")
print("=" * 70)

try:
    # CONFIGURAR FECHAS AQU√ç:
    fecha_inicio = "2025-05-01"  
    fecha_fin = None             
    
    print(f" Configuraci√≥n de fechas:")
    print(f"   ‚Ä¢ Fecha inicio: {fecha_inicio}")
    print(f"   ‚Ä¢ Fecha fin: {'Fecha actual' if fecha_fin is None else fecha_fin}")
    
    # Paso 1: Extraer de todos los endpoints CON RANGO DE FECHAS
    print(f"\nüì° Obteniendo datos desde m√∫ltiples APIs con filtro de fechas...")
    datos_combinados, datos_por_endpoint, info_fechas = fetch_data_from_multiple_endpoints(
        fecha_inicio=fecha_inicio, 
        fecha_fin=fecha_fin
    )
    
    if datos_combinados:
        print(f"\n‚úÖ EXTRACCI√ìN EXITOSA!")
        print(f"   üìä Total registros combinados: {len(datos_combinados)}")
        print(f"   üìÖ Per√≠odo real extra√≠do: {info_fechas['fecha_inicio']} a {info_fechas['fecha_fin']}")
        
        # Paso 2: Convertir a DataFrame combinado
        print(f"\nüîÑ Creando DataFrame combinado...")
        df_combinado = pd.json_normalize(datos_combinados, sep="_")
        
        print(f"   üìä DataFrame combinado: {df_combinado.shape[0]} filas √ó {df_combinado.shape[1]} columnas")
        
        # Paso 3: Mostrar informaci√≥n por endpoint
        print(f"\nüìã DESGLOSE POR ENDPOINT:")
        if '_source_endpoint' in df_combinado.columns:
            conteo_por_endpoint = df_combinado['_source_endpoint'].value_counts()
            for endpoint, cantidad in conteo_por_endpoint.items():
                porcentaje = (cantidad / len(df_combinado)) * 100
                print(f"   ‚Ä¢ {endpoint.capitalize()}: {cantidad} registros ({porcentaje:.1f}%)")
        
        # Paso 4: Mostrar columnas disponibles
        print(f"\nüìã COLUMNAS DISPONIBLES ({len(df_combinado.columns)}):")
        columnas_por_fila = 3
        columnas = list(df_combinado.columns)
        
        for i in range(0, len(columnas), columnas_por_fila):
            fila_columnas = columnas[i:i+columnas_por_fila]
            print(f"   {i+1:2d}-{min(i+columnas_por_fila, len(columnas)):2d}. {' | '.join(fila_columnas)}")
        
        # Paso 5: Mostrar muestra de datos
        print(f"\nüìÑ MUESTRA DE DATOS COMBINADOS:")
        display(df_combinado.head())
        
        # Paso 6: Procesar campos de fecha
        print(f"\nüìÖ Procesando campos de fecha...")
        date_keywords = ["start_date", "end_date", "application_date", "created_at", "updated_at"]
        fechas_convertidas = 0
        for column in df_combinado.columns:
            if any(keyword in column.lower() for keyword in date_keywords):
                df_combinado[column] = pd.to_datetime(df_combinado[column], errors="coerce")
                fechas_convertidas += 1
                print(f"   ‚úÖ Campo '{column}' convertido a fecha")
        
        print(f"   üìä Total campos de fecha convertidos: {fechas_convertidas}")
        
        # Paso 7: Validar rango de fechas en los datos
        if 'start_date' in df_combinado.columns:
            df_fechas_validas = df_combinado.dropna(subset=['start_date'])
            if len(df_fechas_validas) > 0:
                fecha_min_datos = df_fechas_validas['start_date'].min()
                fecha_max_datos = df_fechas_validas['start_date'].max()
                print(f"\nüìà VALIDACI√ìN DE RANGO DE FECHAS:")
                print(f"   ‚Ä¢ Fecha m√≠nima en datos: {fecha_min_datos.date()}")
                print(f"   ‚Ä¢ Fecha m√°xima en datos: {fecha_max_datos.date()}")
                print(f"   ‚Ä¢ Registros con fechas v√°lidas: {len(df_fechas_validas):,}")
        
        # Paso 8: Guardar en variables globales
        globals()['df_buk_combinado'] = df_combinado
        globals()['datos_por_endpoint'] = datos_por_endpoint
        globals()['info_extraccion'] = info_fechas
        
        print(f"\nüíæ DATOS GUARDADOS:")
        print(f"   ‚Ä¢ Variable 'df_buk_combinado': DataFrame con todos los datos")
        print(f"   ‚Ä¢ Variable 'datos_por_endpoint': Diccionario separado por endpoint")
        print(f"   ‚Ä¢ Variable 'info_extraccion': Informaci√≥n del rango de fechas usado")
        
        # Paso 9: Estad√≠sticas finales
        print(f"\nüìà ESTAD√çSTICAS FINALES:")
        print(f"   ‚Ä¢ Total registros: {len(df_combinado):,}")
        print(f"   ‚Ä¢ Total columnas: {len(df_combinado.columns)}")
        print(f"   ‚Ä¢ Per√≠odo: {info_fechas['fecha_inicio']} a {info_fechas['fecha_fin']}")
        print(f"   ‚Ä¢ Memoria utilizada: {df_combinado.memory_usage(deep=True).sum() / 1024**2:.2f} MB")
        
        # Mostrar campos √∫nicos por endpoint
        if '_source_endpoint' in df_combinado.columns:
            print(f"\nüîç CAMPOS PRINCIPALES POR ENDPOINT:")
            for endpoint in df_combinado['_source_endpoint'].unique():
                df_endpoint = df_combinado[df_combinado['_source_endpoint'] == endpoint]
                campos_no_nulos = df_endpoint.notna().sum()
                campos_principales = campos_no_nulos[campos_no_nulos > 0].head(5)
                print(f"   ‚Ä¢ {endpoint.capitalize()}:")
                for campo, cantidad in campos_principales.items():
                    if campo not in ['_source_endpoint', '_source_url', '_fecha_extraccion']:
                        print(f"     - {campo}: {cantidad} registros")
        
    else:
        print("‚ùå No se pudieron obtener datos de ning√∫n endpoint")
        print("üí° Posibles causas:")
        print("   ‚Ä¢ Tu token de autenticaci√≥n no es v√°lido")
        print("   ‚Ä¢ Las URLs de los endpoints no son correctas")
        print("   ‚Ä¢ No hay datos en el rango de fechas especificado")
        print("   ‚Ä¢ Problemas de conectividad")
        print(f"\nüîß Sugerencias:")
        print(f"   ‚Ä¢ Verifica tu token en la variable de entorno")
        print(f"   ‚Ä¢ Prueba con un rango de fechas diferente")
        print(f"   ‚Ä¢ Revisa los logs de error arriba")
        
except Exception as e:
    print(f"üí• Error inesperado: {e}")
    print(f"   Tipo de error: {type(e).__name__}")
    import traceback
    print(f"   Detalles: {traceback.format_exc()}")
    
    # Informaci√≥n para debugging
    print(f"\nüîß Para debugging:")
    print(f"   ‚Ä¢ Verifica que HEADERS est√© definido")
    print(f"   ‚Ä¢ Confirma que tienes conexi√≥n a internet")
    print(f"   ‚Ä¢ Ejecuta las celdas anteriores primero")

üöÄ EXTRAYENDO DATOS DE M√öLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS
 Configuraci√≥n de fechas:
   ‚Ä¢ Fecha inicio: 2025-05-01
   ‚Ä¢ Fecha fin: Fecha actual

üì° Obteniendo datos desde m√∫ltiples APIs con filtro de fechas...
INICIANDO EXTRACCI√ìN DE M√öLTIPLES ENDPOINTS BUK CON FILTRO DE FECHAS
Per√≠odo: 2025-05-01 a 2025-08-25

PROCESANDO ENDPOINT: INASISTENCIAS
URL: https://cramer.buk.cl/api/v1/chile/absences/absence
--------------------------------------------------
üìÑ P√°gina 1...
   ‚úÖ 25 registros obtenidos (per√≠odo: 2025-05-01 a 2025-08-25)
üìÑ P√°gina 2...
   ‚úÖ 25 registros obtenidos (per√≠odo: 2025-05-01 a 2025-08-25)
üìÑ P√°gina 2...
   ‚úÖ 11 registros obtenidos (per√≠odo: 2025-05-01 a 2025-08-25)
üìä Total inasistencias: 36 registros en 2 p√°ginas
üìÖ Per√≠odo procesado: 2025-05-01 a 2025-08-25

PROCESANDO ENDPOINT: LICENCIAS
URL: https://cramer.buk.cl/api/v1/chile/absences/licence
--------------------------------------------------
üìÑ P√°gina 1...
   ‚úÖ 11

Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,medic_name,risk_type,sequela,incapacities_control,permission_type_id,permission_type_code,paid,time_measure,start_time,end_time
0,105184,2025-05-05,2025-05-05,1.0,1.0,0.0,full_working_day,2025-05-05,2025-05-05,Ausencia sin licencia m√©dica,...,,,,,,,,,,
1,105185,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,Ausencia sin licencia,...,,,,,,,,,,
2,105250,2025-05-02,2025-05-02,1.0,1.0,0.0,full_working_day,2025-05-02,2025-05-02,"Tramite personal, informado por Manuel Gamboa",...,,,,,,,,,,
3,105283,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,"Fallecimiento abuelita, se regal√≥ 2 d√≠as y el ...",...,,,,,,,,,,
4,105547,2025-05-11,2025-05-13,3.0,1.0,0.0,full_working_day,2025-05-14,2025-05-16,,...,,,,,,,,,,



üìÖ Procesando campos de fecha...
   ‚úÖ Campo 'start_date' convertido a fecha
   ‚úÖ Campo 'end_date' convertido a fecha
   ‚úÖ Campo 'application_date' convertido a fecha
   ‚úÖ Campo 'application_end_date' convertido a fecha
   ‚úÖ Campo 'created_at' convertido a fecha
   ‚úÖ Campo 'updated_at' convertido a fecha
   üìä Total campos de fecha convertidos: 6

üìà VALIDACI√ìN DE RANGO DE FECHAS:
   ‚Ä¢ Fecha m√≠nima en datos: 2025-02-14
   ‚Ä¢ Fecha m√°xima en datos: 2025-08-25
   ‚Ä¢ Registros con fechas v√°lidas: 233

üíæ DATOS GUARDADOS:
   ‚Ä¢ Variable 'df_buk_combinado': DataFrame con todos los datos
   ‚Ä¢ Variable 'datos_por_endpoint': Diccionario separado por endpoint
   ‚Ä¢ Variable 'info_extraccion': Informaci√≥n del rango de fechas usado

üìà ESTAD√çSTICAS FINALES:
   ‚Ä¢ Total registros: 233
   ‚Ä¢ Total columnas: 37
   ‚Ä¢ Per√≠odo: 2025-05-01 a 2025-08-25
   ‚Ä¢ Memoria utilizada: 0.28 MB

üîç CAMPOS PRINCIPALES POR ENDPOINT:
   ‚Ä¢ Inasistencias:
     - id: 36 reg

  df_combinado[column] = pd.to_datetime(df_combinado[column], errors="coerce")
  df_combinado[column] = pd.to_datetime(df_combinado[column], errors="coerce")


In [19]:
# === AN√ÅLISIS SEPARADO POR ENDPOINT ===
if 'datos_por_endpoint' in globals() and 'df_buk_combinado' in globals():
    print("AN√ÅLISIS DETALLADO POR ENDPOINT")
    print("=" * 50)
    
    for endpoint_name, registros in datos_por_endpoint.items():
        if registros:  # Solo si hay datos
            print(f"\nAN√ÅLISIS: {endpoint_name.upper()}")
            print("-" * 30)
            
            # Crear DataFrame espec√≠fico del endpoint
            df_endpoint = pd.json_normalize(registros, sep="_")
            
            print(f"Registros: {len(df_endpoint):,}")
            print(f"Columnas: {len(df_endpoint.columns)}")
            
            # Mostrar primeras 5 columnas m√°s importantes
            print(f"Columnas principales:")
            for i, col in enumerate(df_endpoint.columns[:5], 1):
                valores_unicos = df_endpoint[col].nunique() if col in df_endpoint.columns else 0
                print(f"      {i}. {col} ({valores_unicos} valores √∫nicos)")
            
            # Mostrar muestra
            print(f"Muestra de datos:")
            display(df_endpoint.head(3))
            
            # Guardar DataFrame individual
            globals()[f'df_{endpoint_name}'] = df_endpoint
            print(f"Guardado en variable: df_{endpoint_name}")
    
    print(f"\nAN√ÅLISIS COMPLETADO")
    print(f"Variables disponibles:")
    print(f"   ‚Ä¢ df_buk_combinado: Todos los datos juntos")
    for endpoint_name in datos_por_endpoint.keys():
        if datos_por_endpoint[endpoint_name]:
            print(f"   ‚Ä¢ df_{endpoint_name}: Datos solo de {endpoint_name}")

else:
    print("Primero ejecuta la celda de extracci√≥n combinada")

AN√ÅLISIS DETALLADO POR ENDPOINT

AN√ÅLISIS: INASISTENCIAS
------------------------------
Registros: 36
Columnas: 19
Columnas principales:
      1. id (36 valores √∫nicos)
      2. start_date (28 valores √∫nicos)
      3. end_date (28 valores √∫nicos)
      4. days_count (4 valores √∫nicos)
      5. day_percent (1 valores √∫nicos)
Muestra de datos:


Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,employee_id,status,created_at,updated_at,absence_type_id,absence_type_code,_source_endpoint,_source_url,_fecha_extraccion
0,105184,2025-05-05,2025-05-05,1.0,1,0.0,full_working_day,2025-05-05,2025-05-05,Ausencia sin licencia m√©dica,6237,approved,2025-05-08T12:41:23.366-04:00,2025-05-08T12:41:23.366-04:00,2,ausencia,inasistencias,https://cramer.buk.cl/api/v1/chile/absences/ab...,2025-08-25 16:53:46
1,105185,2025-05-08,2025-05-08,1.0,1,0.0,full_working_day,2025-05-08,2025-05-08,Ausencia sin licencia,4918,approved,2025-05-08T12:42:26.143-04:00,2025-05-08T12:42:26.143-04:00,2,ausencia,inasistencias,https://cramer.buk.cl/api/v1/chile/absences/ab...,2025-08-25 16:53:46
2,105250,2025-05-02,2025-05-02,1.0,1,0.0,full_working_day,2025-05-02,2025-05-02,"Tramite personal, informado por Manuel Gamboa",4191,approved,2025-05-09T12:04:20.199-04:00,2025-05-09T12:04:20.199-04:00,2,ausencia,inasistencias,https://cramer.buk.cl/api/v1/chile/absences/ab...,2025-08-25 16:53:46


Guardado en variable: df_inasistencias

AN√ÅLISIS: LICENCIAS
------------------------------
Registros: 161
Columnas: 29
Columnas principales:
      1. id (161 valores √∫nicos)
      2. start_date (86 valores √∫nicos)
      3. end_date (87 valores √∫nicos)
      4. days_count (22 valores √∫nicos)
      5. day_percent (1 valores √∫nicos)
Muestra de datos:


Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,format,licence_number,medic_rut,medic_name,risk_type,sequela,incapacities_control,_source_endpoint,_source_url,_fecha_extraccion
0,102676,2025-02-14,2025-05-08,84.0,1,0.0,full_working_day,2025-02-14,2025-05-08,,...,electronica,,,,,,,licencias,https://cramer.buk.cl/api/v1/chile/absences/li...,2025-08-25 16:53:46
1,104029,2025-04-02,2025-05-01,30.0,1,0.0,full_working_day,2025-04-02,2025-05-01,Licencia com√∫n,...,electronica,,,,,,,licencias,https://cramer.buk.cl/api/v1/chile/absences/li...,2025-08-25 16:53:46
2,104129,2025-04-05,2025-05-04,30.0,1,0.0,full_working_day,2025-04-05,2025-05-04,Licencia normal,...,electronica,,,,,,,licencias,https://cramer.buk.cl/api/v1/chile/absences/li...,2025-08-25 16:53:46


Guardado en variable: df_licencias

AN√ÅLISIS: PERMISOS
------------------------------
Registros: 36
Columnas: 23
Columnas principales:
      1. id (36 valores √∫nicos)
      2. start_date (29 valores √∫nicos)
      3. end_date (28 valores √∫nicos)
      4. days_count (8 valores √∫nicos)
      5. day_percent (2 valores √∫nicos)
Muestra de datos:


Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,updated_at,permission_type_id,permission_type_code,paid,time_measure,start_time,end_time,_source_endpoint,_source_url,_fecha_extraccion
0,104986,2025-05-06,2025-05-07,2.0,1.0,0.0,full_working_day,2025-05-06,2025-05-07,Fallecimiento del abuelito,...,2025-05-06T09:13:56.325-04:00,9,permiso_fallecimiento_cramer,True,per_day,,,permisos,https://cramer.buk.cl/api/v1/chile/absences/pe...,2025-08-25 16:53:46
1,105448,2025-05-22,2025-05-22,1.0,1.0,0.0,full_working_day,2025-05-22,2025-05-22,Compensaci√≥n d√≠a domingo 30-03-2025. Respaldo ...,...,2025-05-14T16:07:47.375-04:00,74,compensacion_por_viaje,True,per_day,,,permisos,https://cramer.buk.cl/api/v1/chile/absences/pe...,2025-08-25 16:53:46
2,105449,2025-05-12,2025-05-15,4.0,1.0,0.0,full_working_day,2025-05-12,2025-05-15,Fallecimiento hermana,...,2025-05-14T16:27:10.517-04:00,8,permiso_fallecimiento_legal,True,per_day,,,permisos,https://cramer.buk.cl/api/v1/chile/absences/pe...,2025-08-25 16:53:46


Guardado en variable: df_permisos

AN√ÅLISIS COMPLETADO
Variables disponibles:
   ‚Ä¢ df_buk_combinado: Todos los datos juntos
   ‚Ä¢ df_inasistencias: Datos solo de inasistencias
   ‚Ä¢ df_licencias: Datos solo de licencias
   ‚Ä¢ df_permisos: Datos solo de permisos


In [20]:
display(df_combinado)

Unnamed: 0,id,start_date,end_date,days_count,day_percent,contribution_days,workday_stage,application_date,application_end_date,justification,...,medic_name,risk_type,sequela,incapacities_control,permission_type_id,permission_type_code,paid,time_measure,start_time,end_time
0,105184,2025-05-05,2025-05-05,1.0,1.0,0.0,full_working_day,2025-05-05,2025-05-05,Ausencia sin licencia m√©dica,...,,,,,,,,,,
1,105185,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,Ausencia sin licencia,...,,,,,,,,,,
2,105250,2025-05-02,2025-05-02,1.0,1.0,0.0,full_working_day,2025-05-02,2025-05-02,"Tramite personal, informado por Manuel Gamboa",...,,,,,,,,,,
3,105283,2025-05-08,2025-05-08,1.0,1.0,0.0,full_working_day,2025-05-08,2025-05-08,"Fallecimiento abuelita, se regal√≥ 2 d√≠as y el ...",...,,,,,,,,,,
4,105547,2025-05-11,2025-05-13,3.0,1.0,0.0,full_working_day,2025-05-14,2025-05-16,,...,,,,,,,,,,
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
228,108418,2025-08-18,2025-08-19,2.0,1.0,0.0,full_working_day,2025-08-18,2025-08-19,Compensaci√≥n de horas por feria informada por ...,...,,,,,4.0,permiso_con_goce,True,per_day,,
229,108485,2025-08-19,2025-08-19,1.0,0.5,0.0,end_working_day,2025-08-19,2025-08-19,,...,,,,,3.0,permiso,False,per_day,,
230,108586,2025-08-12,2025-08-12,1.0,1.0,0.0,full_working_day,2025-08-12,2025-08-12,Permiso por fallecimiento de t√≠o,...,,,,,4.0,permiso_con_goce,True,per_day,,
231,108682,2025-08-21,2025-08-22,2.0,1.0,0.0,full_working_day,2025-08-19,2025-08-20,Permiso por fallecimiento de madre pt1,...,,,,,8.0,permiso_fallecimiento_legal,True,per_day,,


In [26]:
#Exportar datos
ruta = "C:/Users/bgacitua/Desktop/Repositorio_GitHub/Scripts de Python/Solicitud API/Datos Buk"
if not os.path.exists(ruta):
    os.makedirs(ruta)

df_combinado.to_excel(os.path.join(ruta, "datos_buk_combinado.xlsx"), index=False)

ValueError: Excel does not support datetimes with timezones. Please ensure that datetimes are timezone unaware before writing to Excel.