In [1]:
import pandas as pd
import numpy as np


In [2]:
def categorizar_valores_faltantes(categorias):
    categorias = categorias.copy()

    # Reemplazar valores faltantes en EstadoCobro
    categorias["EstadoCobro"] = categorias["EstadoCobro"].replace([np.nan, "N/A", "NULL"], "Sin gestión")

    # Reemplazar valores faltantes en Factura
    categorias["Factura"] = categorias["Factura"].replace([np.nan, "N/A", "NULL"], "Sin factura")

    return categorias



In [3]:
cobranza_final = pd.read_excel("data/tabla_ejemplo_clientes.xlsx")

cobranza_final = categorizar_valores_faltantes(cobranza_final)


In [5]:
print(cobranza_final["EstadoCobro"].value_counts(dropna=False))
print("Fechas faltantes:", cobranza_final["FechaFactura"].isna().sum())

EstadoCobro
Sin gestión             608
Pagado                  261
Facturado                51
Validar beneficio        14
Solicitar aprobación      3
Cobrar luego              1
Name: count, dtype: int64
Fechas faltantes: 626


In [10]:
# Se calculan los días desde la fecha de factura
hoy = pd.to_datetime("today")
cobranza_final["DiasDesdeFactura"] = (hoy - cobranza_final["FechaFactura"]).dt.days

condiciones = [
    (cobranza_final["EstadoCobro"] == "Pagado"), 
    (cobranza_final["EstadoCobro"] == "Solicitar aprobación") & (cobranza_final["FechaFactura"].isna()),
    (cobranza_final["ValorFacturado"].notna()) & 
    (cobranza_final["ValorFacturado"] > 0) & 
    (cobranza_final["FechaFactura"].isna()) & 
    (~cobranza_final["EstadoCobro"].isin(["Pagado", "Facturado"])),
    (cobranza_final["FechaFactura"].notna()) & 
    (cobranza_final["DiasDesdeFactura"] > 20) & 
    (cobranza_final["EstadoCobro"] != "Pagado"),
    (cobranza_final["FechaFactura"].notna()) & 
    (cobranza_final["DiasDesdeFactura"].between(15, 20)) & 
    (cobranza_final["EstadoCobro"] != "Pagado")
]

resultados = [
    "Pagado",  
    "Solicitar aprobación",
    "Sin fecha ni estado",
    "Factura vencida",
    "Próxima a vencer"
]

cobranza_final["TipoGestion"] = np.select(condiciones, resultados, default="Sin gestión")


In [11]:
# Conteo por tipo de gestión
print(cobranza_final["TipoGestion"].value_counts())

TipoGestion
Sin gestión             619
Pagado                  261
Factura vencida          43
Sin fecha ni estado       8
Próxima a vencer          4
Solicitar aprobación      3
Name: count, dtype: int64


In [12]:
comprobar = cobranza_final.groupby("TipoGestion").head(2)
display(comprobar)

Unnamed: 0,ID,IDRef,ValorFacturado,ValorRecuperado,EstadoCobro,Factura,FechaFactura,DiasDesdeFactura,TipoGestion
0,720,1,403608.5,1009023.0,Facturado,FVE168,2025-06-17,10.0,Sin gestión
1,715,1,506353.5,1265883.0,Facturado,FVE166,2025-06-13,14.0,Sin gestión
4,704,1,812360.2,2030901.0,Facturado,FVE162,2025-06-09,18.0,Próxima a vencer
5,710,1,1532956.0,6144995.0,Facturado,FVE162,2025-06-09,18.0,Próxima a vencer
8,706,1,475305.6,2127837.0,Facturado,FVE159,2025-06-05,22.0,Factura vencida
9,707,1,108373.4,270932.8,Facturado,FVE159,2025-06-05,22.0,Factura vencida
20,709,1,570309.9,1425776.0,Pagado,FVE154,2025-05-19,39.0,Pagado
24,579,1,124496.7,1867449.0,Pagado,FVE155,2025-05-19,39.0,Pagado
399,236,1,8012.294,40060.24,Sin gestión,Sin factura,NaT,,Sin fecha ni estado
400,236,2,6488.847,32445.47,Sin gestión,Sin factura,NaT,,Sin fecha ni estado


In [14]:
cobranza_final.to_excel("cobranza_final.xlsx", index=False)
