<a href="https://colab.research.google.com/github/MicaelaRomeroC3/COPs/blob/main/06_Tablacategorias.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [2]:
from google.colab import drive
drive.mount('/content/drive', force_remount=True)

Mounted at /content/drive


In [3]:
import pandas as pd
import os
import numpy as np

In [4]:
ruta_historical ='/content/drive/MyDrive/COPS/DATA/3.HISTORICAL/llamadas.parquet'
ruta_salida = '/content/drive/MyDrive/COPS/OUTPUT/TABLA_CATEGORIAS.xlsx'
os.makedirs(os.path.dirname(ruta_salida), exist_ok=True)

# === Cargar hist√≥rico ===
if os.path.exists(ruta_historical):
    df = pd.read_parquet(ruta_historical)
    print(f"üìä Hist√≥rico cargado con {len(df)} registros.")
else:
    print("‚ö†Ô∏è No se encontr√≥ el archivo hist√≥rico.")
    exit()

üìä Hist√≥rico cargado con 9992 registros.


In [5]:
# ANTIGUO

# === Variables de cada tipo ===
columnas_eval_1 = ['P1', 'P2', 'P3', 'P4', 'P5', 'P6', 'S1', 'S2', 'S3', 'S4', 'S5M', 'C1M', 'C2M', 'T1M', 'T2M', 'T3']
ponderacion_dict = {
    'P1': 0.02, 'P2': 0.10, 'P3': 0.03, 'P4': 0.03, 'P5': 0.05, 'P6': 0.02,
    'S1': 0.03, 'S2': 0.02, 'S3': 0.10, 'S4': 0.10, 'S5M': 0.05,
    'C1M': 0.10, 'C2M': 0.10, 'T1M': 0.05, 'T2M': 0.10, 'T3': 0.10
}

# === Lista de dimensiones ===
dimensiones = ['PRODUCTO', 'SEGMENTO', 'R_NR', 'PERIMETRO']
tablas_por_dimension = []

# === Funci√≥n para generar an√°lisis por dimensi√≥n ===
for dim in dimensiones:
    errores = df.groupby(['FECHA_EVALUACI√ìN', dim])[columnas_eval_1].apply(lambda x: (x == False).sum()).reset_index()
    llamadas = df.groupby(['FECHA_EVALUACI√ìN', dim]).size().reset_index(name='NUM_LLAMADAS')
    resultado = pd.merge(errores, llamadas, on=['FECHA_EVALUACI√ìN', dim])

    resultado = resultado.melt(
        id_vars=['FECHA_EVALUACI√ìN', dim, 'NUM_LLAMADAS'],
        value_vars=columnas_eval_1,
        var_name='VARIABLE',
        value_name='N_FALSOS'
    )

    resultado['%_CUMPLIMIENTO'] = ((1 - resultado['N_FALSOS'] / resultado['NUM_LLAMADAS']) * 100).round(2)
    resultado['PONDERACION'] = resultado['VARIABLE'].map(ponderacion_dict)

    resultado['DIMENSI√ìN'] = dim.capitalize()
    resultado['VALOR_DIMENSI√ìN'] = resultado[dim]
    resultado.drop(columns=[dim], inplace=True)

    tablas_por_dimension.append(resultado)

# === Concatenar todas las tablas por dimensi√≥n en una tabla general ===
tabla_general = pd.concat(tablas_por_dimension, ignore_index=True)

# === C√°lculo %_CUMPLIMIENTO_P, C, S, T ===
def calcular_cumplimiento_grupo(df, grupo, divisor):
    variables_grupo = {
        'P': ['P1', 'P2', 'P3', 'P4', 'P5', 'P6'],
        'S': ['S1', 'S2', 'S3', 'S4', 'S5M'],
        'C': ['C1M', 'C2M'],
        'T': ['T1M', 'T2M', 'T3']
    }
    temp = df[df['VARIABLE'].isin(variables_grupo[grupo])].copy()
    temp['PON_CUMP'] = temp['%_CUMPLIMIENTO'] * temp['PONDERACION']
    resultado = (
        temp.groupby(['VALOR_DIMENSI√ìN', 'FECHA_EVALUACI√ìN'])['PON_CUMP'].sum().reset_index()
    )
    resultado[f'%_CUMPLIMIENTO_{grupo}'] = (resultado['PON_CUMP'] / divisor).round(2)
    resultado.drop(columns='PON_CUMP', inplace=True)
    return resultado

cumplimiento_P = calcular_cumplimiento_grupo(tabla_general, 'P', 0.25)
cumplimiento_S = calcular_cumplimiento_grupo(tabla_general, 'S', 0.30)
cumplimiento_C = calcular_cumplimiento_grupo(tabla_general, 'C', 0.20)
cumplimiento_T = calcular_cumplimiento_grupo(tabla_general, 'T', 0.25)

# === A√±adir a tabla_general ===
for df_cumpl in [cumplimiento_P, cumplimiento_S, cumplimiento_C, cumplimiento_T]:
    tabla_general = pd.merge(tabla_general, df_cumpl, on=['VALOR_DIMENSI√ìN', 'FECHA_EVALUACI√ìN'], how='left')

# === A√±adir %_CUMPLIMIENTO_G (global) ===
def calcular_cumplimiento_global(df):
    temp = df[df['VARIABLE'].isin(columnas_eval_1)].copy()
    temp['PON_CUMP'] = temp['PONDERACION'] * temp['%_CUMPLIMIENTO']
    resultado = (
        temp.groupby(['VALOR_DIMENSI√ìN', 'FECHA_EVALUACI√ìN'])['PON_CUMP'].sum()
        .reset_index()
        .rename(columns={'PON_CUMP': '%_CUMPLIMIENTO_G'})
    )
    return resultado

cumplimiento_global = calcular_cumplimiento_global(tabla_general)
tabla_general = pd.merge(tabla_general, cumplimiento_global, on=['VALOR_DIMENSI√ìN', 'FECHA_EVALUACI√ìN'], how='left')


In [6]:
# === Tablas para hojas resumen globales ===
columnas_eval_1 = ['P1', 'P2', 'P3', 'P4', 'P5', 'P6',
                   'S1', 'S2', 'S3', 'S4', 'S5M',
                   'C1M', 'C2M',
                   'T1M', 'T2M', 'T3']

ponderacion_dict = {
    'P1': 0.02, 'P2': 0.10, 'P3': 0.03, 'P4': 0.03, 'P5': 0.05, 'P6': 0.02,
    'S1': 0.03, 'S2': 0.02, 'S3': 0.10, 'S4': 0.10, 'S5M': 0.05,
    'C1M': 0.10, 'C2M': 0.10,
    'T1M': 0.05, 'T2M': 0.10, 'T3': 0.10
}

dimensiones_resumen = ['PRODUCTO', 'SEGMENTO', 'R_NR', 'PERIMETRO']
resumen_globales = {}

for dim in dimensiones_resumen:
    # Empezamos desde cero, sobre df crudo
    errores = df.groupby(dim)[columnas_eval_1].apply(lambda x: (x == False).sum()).reset_index()
    llamadas = df.groupby(dim).size().reset_index(name='NUM_LLAMADAS')
    temp = pd.merge(errores, llamadas, on=dim)

    temp = temp.melt(
        id_vars=[dim, 'NUM_LLAMADAS'],
        value_vars=columnas_eval_1,
        var_name='VARIABLE',
        value_name='N_FALSOS'
    )

    temp['%_CUMPLIMIENTO'] = ((1 - temp['N_FALSOS'] / temp['NUM_LLAMADAS']) * 100).round(2)
    temp['PONDERACION'] = temp['VARIABLE'].map(ponderacion_dict)
    temp['PON_CUMP'] = (temp['%_CUMPLIMIENTO'] / 100) * temp['PONDERACION']

    resumen = temp.groupby(dim, as_index=False)['PON_CUMP'].sum()
    resumen['%_CUMPLIMIENTO_GLOBAL'] = (resumen['PON_CUMP'] * 100).round(2)
    resumen_globales[dim] = resumen[[dim, '%_CUMPLIMIENTO_GLOBAL']]


print(resumen_globales[dim])

  PERIMETRO  %_CUMPLIMIENTO_GLOBAL
0      0-30                  99.47
1   180-365                  99.06
2     30-90                  99.66
3      365m                  99.72
4    90-180                  99.33


In [7]:
import pandas as pd

# === Variables y ponderaciones ===
columnas_eval_1 = ['P1', 'P2', 'P3', 'P4', 'P5', 'P6',
                   'S1', 'S2', 'S3', 'S4', 'S5M',
                   'C1M', 'C2M',
                   'T1M', 'T2M', 'T3']

ponderacion_dict = {
    'P1': 0.02, 'P2': 0.10, 'P3': 0.03, 'P4': 0.03, 'P5': 0.05, 'P6': 0.02,
    'S1': 0.03, 'S2': 0.02, 'S3': 0.10, 'S4': 0.10, 'S5M': 0.05,
    'C1M': 0.10, 'C2M': 0.10,
    'T1M': 0.05, 'T2M': 0.10, 'T3': 0.10
}

# === Asegurar que FECHA_EVALUACI√ìN sea datetime ===
df['FECHA_EVALUACI√ìN'] = pd.to_datetime(df['FECHA_EVALUACI√ìN'], dayfirst=True)

# === Funci√≥n para calcular primer d√≠a h√°bil despu√©s de la evaluaci√≥n ===
def siguiente_dia_habil(fecha):
    dia = fecha + pd.Timedelta(days=1)
    while dia.weekday() >= 5:  # 5=s√°bado, 6=domingo
        dia += pd.Timedelta(days=1)
    return dia

df['FECHA_INFORME'] = df['FECHA_EVALUACI√ìN'].apply(siguiente_dia_habil)

# === Preparar tabla para c√°lculo ===
tabla = df.copy()
tabla['NUM_LLAMADAS'] = 1  # cada fila representa una llamada

tabla_melt = tabla.melt(
    id_vars=['FECHA_EVALUACI√ìN', 'FECHA_INFORME', 'SEGMENTO'],
    value_vars=columnas_eval_1,
    var_name='VARIABLE',
    value_name='ACIERTO'
)

# Transformar a 0/1: True = 1, False = 0
tabla_melt['ACIERTO'] = tabla_melt['ACIERTO'].astype(int)
tabla_melt['PONDERACION'] = tabla_melt['VARIABLE'].map(ponderacion_dict)
tabla_melt['PON_CUMP'] = tabla_melt['ACIERTO'] * tabla_melt['PONDERACION']

# === Filtrar por SEGMENTO 'mas90' y 'menos90' ===
tabla_filtrada = tabla_melt[tabla_melt['SEGMENTO'].isin(['mas90', 'menos90'])].copy()

# === % de cumplimiento ponderado por FECHA_EVALUACI√ìN, FECHA_INFORME y SEGMENTO ===
cumplimiento_fecha_dim = (
    tabla_filtrada
    .groupby(['FECHA_EVALUACI√ìN', 'FECHA_INFORME', 'SEGMENTO'], as_index=False)
    .agg({'PON_CUMP':'sum', 'PONDERACION':'sum'})
)
cumplimiento_fecha_dim['%_CUMPLIMIENTO_GLOBAL'] = ((cumplimiento_fecha_dim['PON_CUMP'] / cumplimiento_fecha_dim['PONDERACION']) * 100).round(2)
cumplimiento_fecha_dim.rename(columns={'SEGMENTO':'VALOR_DIMENSI√ìN'}, inplace=True)

# === Calcular GLOBAL por FECHA_EVALUACI√ìN y FECHA_INFORME ===
cumplimiento_global = (
    cumplimiento_fecha_dim
    .groupby(['FECHA_EVALUACI√ìN', 'FECHA_INFORME'], as_index=False)
    .agg({'PON_CUMP':'sum', 'PONDERACION':'sum'})
)
cumplimiento_global['%_CUMPLIMIENTO_GLOBAL'] = ((cumplimiento_global['PON_CUMP'] / cumplimiento_global['PONDERACION']) * 100).round(2)
cumplimiento_global['VALOR_DIMENSI√ìN'] = 'GLOBAL'

# === Unir ambos resultados ===
tabla_cumplimiento_final = pd.concat([cumplimiento_fecha_dim, cumplimiento_global], ignore_index=True)

# === Ordenar y limpiar columnas finales ===
tabla_cumplimiento_final = tabla_cumplimiento_final.sort_values(['FECHA_EVALUACI√ìN', 'FECHA_INFORME', 'VALOR_DIMENSI√ìN'])
tabla_cumplimiento_final = tabla_cumplimiento_final[['FECHA_EVALUACI√ìN', 'FECHA_INFORME', 'VALOR_DIMENSI√ìN', '%_CUMPLIMIENTO_GLOBAL']]

tabla_cumplimiento_final.head(20)


Unnamed: 0,FECHA_EVALUACI√ìN,FECHA_INFORME,VALOR_DIMENSI√ìN,%_CUMPLIMIENTO_GLOBAL
44,2025-04-01,2025-04-02,GLOBAL,99.44
0,2025-04-01,2025-04-02,mas90,99.8
1,2025-04-01,2025-04-02,menos90,99.06
45,2025-04-02,2025-04-03,GLOBAL,99.42
2,2025-04-02,2025-04-03,mas90,99.76
3,2025-04-02,2025-04-03,menos90,99.07
46,2025-04-03,2025-04-04,GLOBAL,99.62
4,2025-04-03,2025-04-04,mas90,99.86
5,2025-04-03,2025-04-04,menos90,99.41
47,2025-04-04,2025-04-07,GLOBAL,99.27


In [8]:
# === Calcular % de cumplimiento total por tipo de variable (P, S, C, T) ===

# Agregar columna que identifica el tipo de variable (la primera letra)
tabla_melt['TIPO_VARIABLE'] = tabla_melt['VARIABLE'].str[0]

# Calcular cumplimiento total ponderado por tipo
cumplimiento_tipo_total = (
    tabla_melt
    .groupby('TIPO_VARIABLE', as_index=False)
    .agg({'PON_CUMP': 'sum', 'PONDERACION': 'sum'})
)

cumplimiento_tipo_total['%_CUMPLIMIENTO_GLOBAL'] = (
    (cumplimiento_tipo_total['PON_CUMP'] / cumplimiento_tipo_total['PONDERACION']) * 100
).round(2)

# Dejar solo columnas finales
cumplimiento_tipo_total = cumplimiento_tipo_total[['TIPO_VARIABLE', '%_CUMPLIMIENTO_GLOBAL']]

# Mostrar resultado
print(cumplimiento_tipo_total)


  TIPO_VARIABLE  %_CUMPLIMIENTO_GLOBAL
0             C                  99.69
1             P                  99.77
2             S                  98.84
3             T                  99.49


In [9]:
# === Exportar a Excel ===
with pd.ExcelWriter(ruta_salida, engine='openpyxl', mode='w') as writer:

    # 1Ô∏è‚É£ Guardar hojas detalladas por dimensi√≥n (c√≥digo viejo)
    for dim in dimensiones:
        df_dim = tabla_general[tabla_general['DIMENSI√ìN'] == dim.capitalize()]
        df_dim.to_excel(writer, sheet_name=dim.capitalize(), index=False)

    # 2Ô∏è‚É£ Guardar tabla general concatenada
    tabla_general.to_excel(writer, sheet_name='TABLA_GENERALCATEG', index=False)

    # 3Ô∏è‚É£ Guardar resultados globales calculados desde cero
    for dim, df_resumen in resumen_globales.items():
        df_resumen.to_excel(writer, sheet_name=f'{dim.capitalize()}_GLOBAL', index=False)

    # 4Ô∏è‚É£ Guardar nueva tabla con cumplimiento mas90 / menos90 + global por fecha
    tabla_cumplimiento_final.to_excel(writer, sheet_name='CUMPLIMIENTO_90', index=False)

    # 5Ô∏è‚É£ Guardar tabla con % de cumplimiento total por tipo de variable (P, S, C, T)
    cumplimiento_tipo_total.to_excel(writer, sheet_name='CUMPLIMIENTO_TIPOS', index=False)

print(f"‚úÖ Excel generado correctamente en: {ruta_salida}")


‚úÖ Excel generado correctamente en: /content/drive/MyDrive/COPS/OUTPUT/TABLA_CATEGORIAS.xlsx
