# Caso Práctico - Análisis de Morosidad

## Premisa

Se desea evaluar cómo es que la morosidad de los principales productos dentro del sistema financiero nacional.

A partir de la información disponible en la SBS respecto de riesgo crediticio, se realiza un análisis de la información para conocer tendencias y realizar un diagnóstico y opinión sobre los resultados más relevantes

## Ataque al Problema

Para este caso, se plantea la siguiente estrategia de abordaje:
 - Análisis de la morosidad en los productos financieros más utilizados por los clientes dentro del sistema financiero dentro del marco de los créditos de consumo (perspectiva del cliente) para medir capacidad de endeudamiento y comportamientos.
 - Análisis homólogo a la morosidad a nivel corporativa (tanto de empresas grandes como de pequeñas y medianas)
 - Se realizará el análisis tomando como consideración el 'market share' de los principales bancos a nivel nacional (top-5). Fuente: https://prensaregional.pe/los-bancos-con-mas-poder-en-enero-del-2024/


Consideraciones Adicionales
 - No se considera vivienda, dado que nos interesa saber cómo interactua la morosidad cliente vs empresa (B2C) y empresa vs empresa (B2B)

## Programación - Primer Bullet

### Parte 1: Preparación de la Data

In [None]:
# Librerías
import glob  # Librería para navegación de carpetas, se usará para lectura masiva de archivos

import pandas as pd  # Librería de lectura de datos tabulares
import datetime  # Librería para trabajar con información tipo fecha

import plotly.graph_objects as go  # Librería Gráfica

#### Clientes B2C

Aquí se toma la información correspondiente a créditos personales.

##### Periodo 1: 2023 - 2024

In [None]:
df_creditos_1 = pd.DataFrame()  # Base de Datos en blanco para unir toda la data

for file in glob.glob('C:/Users/ryanh/Downloads/DataFC/Análisis de Morosidad/2023-2024/*.xls'):

    df = pd.read_excel(file, header=None, engine='xlrd')  # Lectura masiva de archivos
    df = df.fillna(0)  # Completa los valores faltantes con 0
    df = df.replace("-", 0)  # Reemplaza el caracter '-' con 0

    # Hay archivos que en los encabezados se cuenta con * por lo que se colocan los encabezados para homologar la data
    bancos = ['Concepto','BBVA Perú','BANCOM','B. de Crédito del Perú','B. Pichincha','B. Interamericano de Finanzas','Scotiabank Perú','Citibank','Interbank','Mibanco','B. GNB','B. Falabella Perú','B. Santander Perú ','B. Ripley ','Alfin Banco','B. ICBC','B. of China','B. BCI Perú','TOTAL BANCA MÚLTIPLE']  # Nombres de los bancos

    df = df.iloc[51:59]  # Sección de créditos de consumo por entidad bancaria
    df.columns = bancos
    df = df.reset_index(drop = True)  # Ordenamiento de la Informacion

    periodo = file[64:71]  # Extraccion del mes de referencia, SUSTITUIRLO de acuerdo al nombre de la carpeta de origen
    df['Mes'] = pd.to_datetime(periodo, format = '%Y-%m') + pd.offsets.MonthEnd(0)  # Coloca la cadena de texto en formato fecha con el último día de cada mes 

    # Desdinamización de la tabla (aquí se coloca el encabezado de la tabla como una columna con los nombres de los bancos)
    bancos_cols = list(bancos)[1:]  # Se crea una lista con los nombres de los bancos en la fila 6
    creditos_vals = [col for col in df.columns if col not in bancos_cols]  # Esta sentencia ayuda a fijar los valores para los respectivos bancos

    df = df.melt(
    id_vars = creditos_vals,        
    value_vars = bancos_cols,
    var_name = 'Banco',
    value_name = 'Morosidad (%)'    
    )  # Esto desdinamiza la tabla y ayuda a presentar la información de forma más ordenada

    df_creditos_1 = pd.concat([df_creditos_1, df], axis = 0)  # Unión de todas las bases de datos por las filas

df_creditos_1 = df_creditos_1.reset_index(drop = True)
df_creditos_1 = df_creditos_1.fillna(0)  # Completa los valores faltantes con 0
df_creditos_1 = df_creditos_1.replace("-", 0)  # Reemplaza el caracter '-' con 0

print(df_creditos_1)

##### Periodo 2: 2025 (Se incluye aquí Compartamos Banco)

In [None]:
df_creditos_2 = pd.DataFrame()  # Base de Datos en blanco para unir toda la data

for file in glob.glob('C:/Users/ryanh/Downloads/DataFC/Análisis de Morosidad/2025/*.xls'):

    df = pd.read_excel(file, header=None, engine='xlrd')  # Lectura masiva de archivos
    df = df.fillna(0)  # Completa los valores faltantes con 0
    df = df.replace("-", 0)  # Reemplaza el caracter '-' con 0

    # Hay archivos que en los encabezados se cuenta con * por lo que se colocan los encabezados para homologar la data
    bancos = ['Concepto','BBVA Perú','BANCOM','B. de Crédito del Perú','B. Pichincha','B. Interamericano de Finanzas','Scotiabank Perú','Citibank','Interbank','Mibanco','B. GNB','B. Falabella Perú','B. Santander Perú ','B. Ripley ','Alfin Banco','B. ICBC','B. of China','B. BCI Perú','Compartamos Banco','TOTAL BANCA MÚLTIPLE']  # Nombres de los bancos

    df = df.iloc[51:59]  # Sección de créditos de consumo por entidad bancaria
    df.columns = bancos
    df = df.reset_index(drop = True)  # Ordenamiento de la Informacion

    periodo = file[59:66]  # Extraccion del mes de referencia, SUSTITUIRLO de acuerdo al nombre de la carpeta de origen
    df['Mes'] = pd.to_datetime(periodo, format = '%Y-%m') + pd.offsets.MonthEnd(0)  # Coloca la cadena de texto en formato fecha con el último día de cada mes 

    # Desdinamización de la tabla (aquí se coloca el encabezado de la tabla como una columna con los nombres de los bancos)
    bancos_cols = list(bancos)[1:]  # Se crea una lista con los nombres de los bancos en la fila 6
    creditos_vals = [col for col in df.columns if col not in bancos_cols]  # Esta sentencia ayuda a fijar los valores para los respectivos bancos

    df = df.melt(
    id_vars = creditos_vals,        
    value_vars = bancos_cols,
    var_name = 'Banco',
    value_name = 'Morosidad (%)'    
    )  # Esto desdinamiza la tabla y ayuda a presentar la información de forma más ordenada

    df_creditos_2 = pd.concat([df_creditos_2, df], axis = 0)  # Unión de todas las bases de datos por las filas

df_creditos_2 = df_creditos_2.reset_index(drop = True)
df_creditos_2 = df_creditos_2.fillna(0)  # Completa los valores faltantes con 0
df_creditos_2 = df_creditos_2.replace("-", 0)  # Reemplaza el caracter '-' con 0

print(df_creditos_2)

In [None]:
df_creditos = pd.concat([df_creditos_1, df_creditos_2], axis = 0)
df_creditos = df_creditos.reset_index(drop = True)
df_creditos = df_creditos.fillna(0)  # Completa los valores faltantes con 0
df_creditos = df_creditos.replace("-", 0)  # Reemplaza el caracter '-' con 0

#### Clientes B2B

Aquí se toma la información de créditos PyME.

##### Periodo 1: 2023 - 2024

In [None]:
df_creditos_3 = pd.DataFrame()  # Base de Datos en blanco para unir toda la data

for file in glob.glob('C:/Users/ryanh/Downloads/DataFC/Análisis de Morosidad/2023-2024/*.xls'):

    df = pd.read_excel(file, header=None, engine='xlrd')  # Lectura masiva de archivos
    df = df.fillna(0)  # Completa los valores faltantes con 0
    df = df.replace("-", 0)  # Reemplaza el caracter '-' con 0

    # Hay archivos que en los encabezados se cuenta con * por lo que se colocan los encabezados para homologar la data
    bancos = ['Concepto','BBVA Perú','BANCOM','B. de Crédito del Perú','B. Pichincha','B. Interamericano de Finanzas','Scotiabank Perú','Citibank','Interbank','Mibanco','B. GNB','B. Falabella Perú','B. Santander Perú ','B. Ripley ','Alfin Banco','B. ICBC','B. of China','B. BCI Perú','TOTAL BANCA MÚLTIPLE']  # Nombres de los bancos

    df_1 = df.iloc[24:30]  # Sección de créditos por entidad bancaria para la pequeña empresa
    df_1.columns = bancos
    df_1['Segmento'] = 'Clientes B2B - Pequeña Empresa'
    df_1 = df_1.reset_index(drop = True)  # Ordenamiento de la Informacion

    df_2 = df.iloc[33:39]  # Sección de créditos por entidad bancaria para la pequeña empresa
    df_2.columns = bancos
    df_2['Segmento'] = 'Clientes B2B - Mediana Empresa'
    df_2 = df_2.reset_index(drop = True)  # Ordenamiento de la Informacion

    periodo = file[64:71]  # Extraccion del mes de referencia, SUSTITUIRLO de acuerdo al nombre de la carpeta de origen
    df_1['Mes'] = pd.to_datetime(periodo, format = '%Y-%m') + pd.offsets.MonthEnd(0)  # Coloca la cadena de texto en formato fecha con el último día de cada mes
    df_2['Mes'] = pd.to_datetime(periodo, format = '%Y-%m') + pd.offsets.MonthEnd(0)  # Coloca la cadena de texto en formato fecha con el último día de cada mes

    df = pd.concat([df_1, df_2], axis = 0)
    df = df.reset_index(drop = True)

    # Desdinamización de la tabla (aquí se coloca el encabezado de la tabla como una columna con los nombres de los bancos)
    bancos_cols = list(bancos)[1:]  # Se crea una lista con los nombres de los bancos en la fila 6
    creditos_vals = [col for col in df.columns if col not in bancos_cols]  # Esta sentencia ayuda a fijar los valores para los respectivos bancos

    df = df.melt(
    id_vars = creditos_vals,        
    value_vars = bancos_cols,
    var_name = 'Banco',
    value_name = 'Morosidad (%)'    
    )  # Esto desdinamiza la tabla y ayuda a presentar la información de forma más ordenada

    df_creditos_3 = pd.concat([df_creditos_3, df], axis = 0)  # Unión de todas las bases de datos por las filas

df_creditos_3 = df_creditos_3.reset_index(drop = True)
df_creditos_3 = df_creditos_3.fillna(0)  # Completa los valores faltantes con 0
df_creditos_3 = df_creditos_3.replace("-", 0)  # Reemplaza el caracter '-' con 0

print(df_creditos_3)

##### Periodo 2: 2025 (Se incluye aquí Compartamos Banco)

In [None]:
df_creditos_4 = pd.DataFrame()  # Base de Datos en blanco para unir toda la data

for file in glob.glob('C:/Users/ryanh/Downloads/DataFC/Análisis de Morosidad/2025/*.xls'):

    df = pd.read_excel(file, header=None, engine='xlrd')  # Lectura masiva de archivos
    df = df.fillna(0)  # Completa los valores faltantes con 0
    df = df.replace("-", 0)  # Reemplaza el caracter '-' con 0

    # Hay archivos que en los encabezados se cuenta con * por lo que se colocan los encabezados para homologar la data
    bancos = ['Concepto','BBVA Perú','BANCOM','B. de Crédito del Perú','B. Pichincha','B. Interamericano de Finanzas','Scotiabank Perú','Citibank','Interbank','Mibanco','B. GNB','B. Falabella Perú','B. Santander Perú ','B. Ripley ','Alfin Banco','B. ICBC','B. of China','B. BCI Perú','Compartamos Banco','TOTAL BANCA MÚLTIPLE']  # Nombres de los bancos

    df_1 = df.iloc[24:30]  # Sección de créditos por entidad bancaria para la pequeña empresa
    df_1.columns = bancos
    df_1['Segmento'] = 'Clientes B2B - Pequeña Empresa'
    df_1 = df_1.reset_index(drop = True)  # Ordenamiento de la Informacion

    df_2 = df.iloc[33:39]  # Sección de créditos por entidad bancaria para la pequeña empresa
    df_2.columns = bancos
    df_2['Segmento'] = 'Clientes B2B - Mediana Empresa'
    df_2 = df_2.reset_index(drop = True)  # Ordenamiento de la Informacion

    periodo = file[59:66]  # Extraccion del mes de referencia, SUSTITUIRLO de acuerdo al nombre de la carpeta de origen
    df_1['Mes'] = pd.to_datetime(periodo, format = '%Y-%m') + pd.offsets.MonthEnd(0)  # Coloca la cadena de texto en formato fecha con el último día de cada mes
    df_2['Mes'] = pd.to_datetime(periodo, format = '%Y-%m') + pd.offsets.MonthEnd(0)  # Coloca la cadena de texto en formato fecha con el último día de cada mes

    df = pd.concat([df_1, df_2], axis = 0)
    df = df.reset_index(drop = True)

    # Desdinamización de la tabla (aquí se coloca el encabezado de la tabla como una columna con los nombres de los bancos)
    bancos_cols = list(bancos)[1:]  # Se crea una lista con los nombres de los bancos en la fila 6
    creditos_vals = [col for col in df.columns if col not in bancos_cols]  # Esta sentencia ayuda a fijar los valores para los respectivos bancos

    df = df.melt(
    id_vars = creditos_vals,        
    value_vars = bancos_cols,
    var_name = 'Banco',
    value_name = 'Morosidad (%)'    
    )  # Esto desdinamiza la tabla y ayuda a presentar la información de forma más ordenada

    df_creditos_4 = pd.concat([df_creditos_4, df], axis = 0)  # Unión de todas las bases de datos por las filas

df_creditos_4 = df_creditos_4.reset_index(drop = True)
df_creditos_4 = df_creditos_4.fillna(0)  # Completa los valores faltantes con 0
df_creditos_4 = df_creditos_4.replace("-", 0)  # Reemplaza el caracter '-' con 0

print(df_creditos_4)

In [None]:
df_creditos_pyme = pd.concat([df_creditos_3, df_creditos_4], axis = 0)
df_creditos_pyme = df_creditos_pyme.reset_index(drop = True)
df_creditos_pyme = df_creditos_pyme.fillna(0)  # Completa los valores faltantes con 0
df_creditos_pyme = df_creditos_pyme.replace("-", 0)  # Reemplaza el caracter '-' con 0

### Parte 2: Análisis Gráfico de la Información

#### Morosidad B2C

##### Morosidad en Tarjeta de Crédito por Mes - Top 5 Market Share

Como se comentó anteriormente, se elige el top 5 debido al market share que estas instituciones cuenta dentro del mercado peruano (80% del market share total, aproximadamente).
Para esta parte, se excluirá a Mibanco dado que no cuenta con información de morosidad por TC

In [None]:
# Seccionamiento de la base de datos con las entidades de mayor market share y para el producto tarjeta de crédito
top_5 = ['B. de Crédito del Perú', 'BBVA Perú', 'Scotiabank Perú', 'Interbank']
df_grandesbancos = df_creditos[(df_creditos['Banco'].isin(top_5)) & (df_creditos['Concepto'] == 'Tarjetas de crédito')]
df_grandesbancos = df_grandesbancos.reset_index(drop = True)

# Para facilitar la vista gráfica, se opta por construir una tabla dinámica
df_dinamico = df_grandesbancos.pivot(index='Mes', columns='Banco', values='Morosidad (%)')



# Estilos de líneas y marcadores para mejor visualización de la gráfica
linestyles = ['solid', 'dash', 'dashdot', 'dot']
markers    = ['circle', 'square', 'triangle-up', 'diamond']


# Creación del lienzo
fig = go.Figure()

# Creación de la serie para visualizar la morosidad en el tiempo para los 4 principales bancos
for i, banco in enumerate(top_5):
    fig.add_trace(go.Scatter(
        x = df_dinamico.index,
        y = df_dinamico[banco],
        mode = 'lines+markers',
        name = banco,
        line   = dict(dash = linestyles[i % len(linestyles)]),
        marker = dict(symbol = markers[i % len(markers)], size = 8)
    ))

# Aspectos de forma
fig.update_layout(
    title = "Evolución de la morosidad por tarjeta de crédito<br>Bancos con mayor market share",
    width = 1700, height = 600,
    xaxis=dict(
        title="Mes",
        tickmode="array",
        tickvals = list(df_dinamico.index),
        ticktext = [d.strftime("%Y-%m") for d in df_dinamico.index],
        tickangle = 45
    ),
    yaxis_title = "Morosidad (%)",
    legend_title = "Banco",
    margin = dict(l = 40, r = 40, t = 80, b = 80)
)

# Visualización
fig.show()

##### Morosidad en Créditos Personales (créditos revolventes)

Como se comentó anteriormente, se elige el top 5 debido al market share que estas instituciones cuenta dentro del mercado peruano (80% del market share total, aproximadamente).
Para esta parte, se excluirá a Mibanco dado que no cuenta con información de morosidad por TC

In [None]:
# Seccionamiento de la base de datos con las entidades de mayor market share y para el producto tarjeta de crédito
top_5 = ['B. de Crédito del Perú', 'BBVA Perú', 'Scotiabank Perú', 'Interbank', 'Mibanco']
df_revolvente = df_creditos[(df_creditos['Banco'].isin(top_5)) & (df_creditos['Concepto'] == '   Préstamos revolventes')]
df_revolvente = df_revolvente.reset_index(drop = True)

# Para facilitar la vista gráfica, se opta por construir una tabla dinámica
df_dinamico = df_revolvente.pivot(index='Mes', columns='Banco', values='Morosidad (%)')



# Estilos de líneas y marcadores para mejor visualización de la gráfica
linestyles = ['solid', 'dash', 'dashdot', 'dot']
markers    = ['circle', 'square', 'triangle-up', 'diamond']


# Creación del lienzo
fig = go.Figure()

# Creación de la serie para visualizar la morosidad en el tiempo para los 4 principales bancos
for i, banco in enumerate(top_5):
    fig.add_trace(go.Scatter(
        x = df_dinamico.index,
        y = df_dinamico[banco],
        mode = 'lines+markers',
        name = banco,
        line   = dict(dash = linestyles[i % len(linestyles)]),
        marker = dict(symbol = markers[i % len(markers)], size = 8)
    ))

# Aspectos de forma
fig.update_layout(
    title = "Evolución de la morosidad por crédito revolvente<br>Bancos con mayor market share",
    width = 1700, height = 600,
    xaxis=dict(
        title="Mes",
        tickmode="array",
        tickvals = list(df_dinamico.index),
        ticktext = [d.strftime("%Y-%m") for d in df_dinamico.index],
        tickangle = 45
    ),
    yaxis_title = "Morosidad (%)",
    legend_title = "Banco",
    margin = dict(l = 40, r = 40, t = 80, b = 80)
)

# Visualización
fig.show()

#### Morosidad B2B

Se tomará como referencia el apartado de préstamos y el factoring como medidas de financiamiento para analizar el estado de morosidad de estos clientes respecto de los bancos especializados en banca empresarial y emprendedora (BBVA, BCP, Mibanco, Alfin Banco).

##### Morosidad en Créditos

In [None]:
# Filtrar solo 'Préstamo'
top_4 = ['B. de Crédito del Perú', 'BBVA Perú', 'Mibanco', 'Alfin Banco']
df_prestamo = df_creditos_pyme[(df_creditos_pyme['Concepto'] == 'Préstamos') & (df_creditos_pyme['Banco'].isin(top_4))]

# Segmentos a graficar
segmentos = ['Clientes B2B - Pequeña Empresa', 'Clientes B2B - Mediana Empresa']

for segmento in segmentos:
    df_seg = df_prestamo[df_prestamo['Segmento'] == segmento]
    # Crear pivote: índice Mes, columnas Banco, valores promedio de Morosidad (%)
    df_pivot = (
        df_seg
        .groupby(['Mes', 'Banco'])['Morosidad (%)']
        .mean()
        .reset_index()
        .pivot(index='Mes', columns='Banco', values='Morosidad (%)')
    )

    fig = go.Figure()
    linestyles = ['solid', 'dash', 'dashdot', 'dot']
    markers    = ['circle', 'square', 'triangle-up', 'diamond']

    for i, banco in enumerate(df_pivot.columns):
        fig.add_trace(go.Scatter(
            x = df_pivot.index,
            y = df_pivot[banco],
            mode = 'lines+markers',
            name = banco,
            line = dict(dash=linestyles[i % len(linestyles)]),
            marker = dict(symbol=markers[i % len(markers)], size=8)
        ))

    fig.update_layout(
        title = f"Evolución de Morosidad (%) por Créditos — {segmento}",
        width = 1700, height = 500,
        xaxis = dict(
            title = "Mes",
            tickmode = "array",
            tickvals = list(df_pivot.index),
            ticktext = [d.strftime("%Y-%m") for d in df_pivot.index],
            tickangle = 45
        ),
        yaxis_title = "Morosidad (%)",
        legend_title = "Banco",
        margin = dict(l = 40, r = 40, t = 80, b = 80)
    )

    fig.show()

##### Morosidad en Factoring

In [None]:
# Filtrar solo 'Préstamo'
top_4 = ['B. de Crédito del Perú', 'BBVA Perú', 'Mibanco', 'Alfin Banco']
df_prestamo = df_creditos_pyme[(df_creditos_pyme['Concepto'] == 'Préstamos') & (df_creditos_pyme['Banco'].isin(top_4))]

# Segmentos a graficar
segmentos = ['Clientes B2B - Pequeña Empresa']

for segmento in segmentos:
    df_seg = df_prestamo[df_prestamo['Segmento'] == segmento]
    # Crear pivote: índice Mes, columnas Banco, valores promedio de Morosidad (%)
    df_pivot = (
        df_seg
        .groupby(['Mes', 'Banco'])['Morosidad (%)']
        .mean()
        .reset_index()
        .pivot(index='Mes', columns='Banco', values='Morosidad (%)')
    )

    fig = go.Figure()
    linestyles = ['solid', 'dash', 'dashdot', 'dot']
    markers    = ['circle', 'square', 'triangle-up', 'diamond']

    for i, banco in enumerate(df_pivot.columns):
        fig.add_trace(go.Scatter(
            x = df_pivot.index,
            y = df_pivot[banco],
            mode = 'lines+markers',
            name = banco,
            line = dict(dash=linestyles[i % len(linestyles)]),
            marker = dict(symbol=markers[i % len(markers)], size=8)
        ))

    fig.update_layout(
        title = f"Evolución de Morosidad (%) por Factoring — {segmento}",
        width = 1700, height = 500,
        xaxis = dict(
            title = "Mes",
            tickmode = "array",
            tickvals = list(df_pivot.index),
            ticktext = [d.strftime("%Y-%m") for d in df_pivot.index],
            tickangle = 45
        ),
        yaxis_title = "Morosidad (%)",
        legend_title = "Banco",
        margin = dict(l = 40, r = 40, t = 80, b = 80)
    )

    fig.show()

### Parte 3: Conclusiones

 - Sobre los clientes B2C, se puede apreciar que la morosidad por concepto de tarjetas de crédito presenta un ligero incremento en los primeros 4 meses del 2025, con un crecimiento del 5% aproximadamente. Para el caso del crédito revolvente, se visualiza una tendencia creciente aunque irregular en el tiempo para el caso de Interbank mientras que otras entidades mantienen un valor casi nulo, a excepción de Mibanco que mantiene una tendencia irregular pero por debajo del 0.01%. 
 - Sobre los clientes B2B, para el caso de los créditos personales, los valores de morosidad mantienen una tendencia relativamente _flat_, salvo el caso de Alfin Banco, el cual muestra valores irregulares en el tiempo, pero con cierta tendencia al alza. Por el lado del uso del factoring como medio de financiamiento, el comportamiento es similar, salvo el caso de BBVA cuya morosidad ha deterioriado (siendo el salto más fuerte de 18% entre setiembre y octubre 2024) la cual aún no ha podido reducirse del todo.