### Review of the paper `The Population Accuracy Index: A New Measure of Population Stability for Model Monitoring`

Resumen: Los modelos de riesgo desarrollados en un conjunto de datos a menudo se aplican a nuevos datos y, en tales casos,
es prudente comprobar que el modelo es adecuado para los nuevos datos. 
Una aplicación importante está en
la industria bancaria, donde se aplican modelos estadísticos a los préstamos para determinar provisiones y
requisitos de capital. Estos modelos se desarrollan sobre datos históricos, y la normativa exige su
monitoreo para garantizar que sigan siendo válidos en las carteras actuales, a menudo años desde que los modelos fueron
desarrollado. 

El Índice de Estabilidad de la Población (PSI) es un estándar de la industria para medir si la
distribución de los datos actuales ha cambiado significativamente de la distribución de datos utilizados para desarrollar
el modelo. Este artículo explora varias desventajas del PSI y propone la Precisión de Predicción
Índice (PAI) como alternativa. Las propiedades superiores y la interpretación del PAI se discuten y
se concluye que el PAI puede resumir con mayor precisión el nivel de estabilidad de la población, ayudando
los analistas y administradores de riesgos a determinar si el modelo sigue siendo adecuado para su propósito.



1. Introducción

Para los bancos, sus préstamos no son solo activos, ya que producen ingresos, sino también pasivos cuando
los clientes incumplen y no pagan su deuda. En muchas jurisdicciones, estos pasivos se miden por
procedimientos en regulaciones como el Acuerdo de Basilea (Comité de Supervisión Bancaria de Basilea 2006) para
capital y las Normas Internacionales de Información Financiera (NIIF 9) para provisiones (International
Consejo de Normas de Contabilidad 2014). Se requiere capital en caso de una grave recesión económica, mientras que
las provisiones reflejan las pérdidas esperadas en las condiciones económicas actuales. Como estas valoraciones forman parte del
valor de la empresa, su precisión es importante para muchas partes interesadas. Estas partes interesadas incluyen la
el propio banco (por ejemplo, para tomar decisiones de adquisición rentables para nuevos préstamos); auditores externos (que
evaluar la exactitud y confiabilidad de los estados financieros); reguladores (que evalúan la sostenibilidad de
el Banco); e inversores (que confían en esta información para tomar decisiones de inversión).
Tanto el Acuerdo de Basilea como la NIIF 9 adoptan un enfoque estándar de evaluación del riesgo de préstamos con
tres componentes: probabilidad de incumplimiento (PD), exposición en caso de incumplimiento (EAD) y pérdida en caso de incumplimiento (LGD).

El desarrollo de modelos en la industria bancaria está bien cubierto en la literatura (Siddiqi 2005), pero un
actividad regulada igualmente importante es el control continuo de si el modelo sigue siendo adecuado
(adecuado para el propósito). 


La estabilidad y el rendimiento (es decir, la precisión de la predicción) son extremadamente importantes ya que proporcionan
información sobre la calidad de los modelos de puntuación. Como tales, deben ser rastreados y
analizada al menos mensualmente por los bancos, independientemente del ejercicio de validación. 

Este aspecto generalmente lo realizan interna y externamente banqueros, auditores y reguladores.

El monitoreo es importante porque un modelo desarrollado años antes puede que ya no sea adecuado para
la cartera actual. Una razón de esto es que el tipo de clientes dentro de la cartera puede diferir de
los tipos de clientes disponibles para desarrollar el modelo.

La estabilidad de la población se refiere a si las características de la cartera (especialmente la distribución
de variables explicativas) está cambiando con el tiempo. Cuando esta distribución cambia (baja población
estabilidad) existe más preocupación sobre si el modelo es actualmente adecuado para su propósito ya que los datos utilizados
para desarrollar el modelo difiere de los datos a los que se aplica el modelo. Aplicando el modelo a estos
los nuevos tipos de clientes pueden implicar la extrapolación y, por lo tanto, una menor confianza en los resultados del modelo.

Hay otras características de un modelo que requieren monitoreo para asegurar que el modelo sea
adecuado para el propósito. Estos incluyen calibración (si el modelo es imparcial) y discriminación (si
el modelo clasifica correctamente los préstamos de mejor a peor). Si bien estas medidas son importantes,
requieren resultados conocidos. 

Por ejemplo, un modelo de PD que predice incumplimientos en una ventana de un año
debe evaluar los préstamos de al menos un año de antigüedad para determinar la calibración y la discriminación. 

Por lo tanto,
las conclusiones de estas medidas tienen al menos un año de atraso en comparación con la cartera actual.

La estabilidad de la población es importante ya que no requiere retrasos; se puede medir con la corriente
cartera ya que no se requiere el resultado. Por lo tanto, es importante monitorear la estabilidad de la población.
para obtener información sobre si la cartera actual (en lugar de la cartera de hace un año)
es apto para el propósito.

Este trabajo se enfoca en la medición de la estabilidad de la población, especialmente la Estabilidad de la Población
(PSI) que se ha convertido en un estándar de la industria. Se exploran las deficiencias en el PSI y se
Se introduce una alternativa que tiene propiedades superiores y cuyos valores son más directamente interpretables.

También existen pruebas estadísticas para probar la hipótesis nula de que la distribución de los datos de desarrollo y
la distribución de los datos de revisión son iguales. Los ejemplos incluyen la prueba de Kolmogorov-Smirnov para
datos numéricos o una prueba de chi-cuadrado para datos categóricos. No los consideramos apropiados porque
resumen la cantidad de evidencia contra la hipótesis nula y dependen demasiado del tamaño de la muestra.
En muestras grandes, las diferencias pequeñas y sin importancia en las distribuciones pueden ser estadísticamente significativas,
mientras que en muestras pequeñas, las diferencias grandes e importantes pueden ser estadísticamente insignificantes. Nosotros por lo tanto
no los considere más en este documento.


1.1. Modelos y Notación

Las tareas de desarrollo de modelos son extensas y están bien cubiertas en la literatura, de la cual Siddiqi (2005)
es particularmente relevante para la industria bancaria. Brevemente, se utilizan datos históricos empíricos para estimar
relaciones entre un resultado (como el incumplimiento en el caso de un modelo PD) y las variables explicativas
(como la situación laboral del cliente). Los modelos de PD típicamente estiman las probabilidades de incumplimiento
dentro de un año, por lo que para el desarrollo del modelo, las variables explicativas deben tener al menos un año de antigüedad (por lo que el
se conoce el resultado). El desarrollo del modelo luego busca y captura en forma matemática,
relaciones en los datos entre las variables explicativas y el resultado. Por ejemplo, esto puede
toman la forma de un modelo de regresión logística o probit que predice el incumplimiento. Esta forma matemática a menudo
toma la forma de una regresión donde alguna medida (posiblemente transformada) del resultado es igual a
0xi0 + 1xi1 + : : : + kxik (1)
Riesgos 2019, 7, 53 3 de 11
donde 0 a k son coeficientes estimados y xi0 a xik son los valores de los coeficientes explicativos (numéricos)
variables para la i-ésima observación (típicamente, xi0 se define como siempre igual a 1, en cuyo caso 0 es un
interceptar). Por ejemplo, una regresión logística utilizada para predecir el incumplimiento utiliza la Ecuación (1) para predecir el
log-odds of default (definido como el logaritmo natural de la relación entre la probabilidad de incumplimiento y la
probabilidad de no incumplimiento).
Las variables explicativas tienen varios tipos básicos cuyos tratamientos se resumen aquí porque
estos afectan los detalles presentados más adelante (ver Pyle (1999) para más detalles de estos temas y tratamientos).
En particular, las variables pueden ser categóricas o numéricas. Variables categóricas (como ocupación
categoría) toman valores de una lista (como comercio, profesional, jubilado, estudiante, etc.) y normalmente tienen
sin ordenamiento natural ni valor numérico. El modelado podría crear n  1 

(donde n es el número de
categorías) variables ficticias (que toman valores numéricos de 0 o 1) o por numeración donde un número
valor (el peso de la evidencia) se asigna a cada categoría (Siddiqi 2005). Por ejemplo, numérico
los valores pueden determinarse a partir de la tasa de incumplimiento observada dentro de cada categoría.
Las variables numéricas se definen en términos numéricos. Por ejemplo, la relación préstamo-valor (LVR)
se define como el valor del préstamo dividido por el valor del activo que garantiza el préstamo. Modelado
podría usar este valor numérico directamente, después de una transformación numérica simple (como logaritmos o
Winsorizing) o dividiéndolos en un pequeño número de categorías (como 0 a 0,5; 0,5 a 0,8; 0,8 a 1; y >1). Así, la segmentación transforma una variable numérica en una variable categórica (que a su vez puede ser
numerados con peso de evidencia o variables ficticias durante el desarrollo del modelo). Como ampliado
a continuación, este es un tema clave no solo porque el depósito es una práctica común en la banca, sino porque
el PSI solo se define para variables categóricas (o variables numéricas agrupadas).




1.2. El Índice de Estabilidad de la Población (PSI)

El PSI está estrechamente relacionado con medidas de entropía bien establecidas y, esencialmente, es un sistema simétrico.
medida de la diferencia entre dos distribuciones estadísticas. El índice llamado específicamente ‘Población
índice de estabilidad” (PSI) se encuentra en Karakoulas (2004), como una “técnica de diagnóstico para monitorear cambios
en distribuciones características”. También se describe en Siddiqi (2005), quien explica su uso para
monitorear la estabilidad general de la puntuación de la población ("Representante de estabilidad del sistema").
ort”) o, como posible seguimiento, la
estabilidad de las variables explicativas individuales (“informe de análisis de características”) en la modelización del riesgo de crédito
cuadros de mando para la industria bancaria. La misma formulación ha aparecido en la literatura estadística.
como la "divergencia J" (Lin 1991, quien a su vez hace referencia a Je reys 1946), y está estrechamente relacionado con la
Divergencia de Jensen-Shannon.
La fórmula para el PSI asume que hay K categorías mutuamente excluyentes, numeradas del 1 al K, con:
psi =
XK
yo=1
(Oi ?? Ei) ln
 
Oye
ei
!
(2)
donde Oi es la frecuencia relativa observada de cuentas en la categoría i en revisión; Ei es el relativo
frecuencia de las cuentas en la categoría i en desarrollo (se espera que la frecuencia relativa de revisión sea
similar a la frecuencia relativa de desarrollo); i es la categoría, tomando valores de 1 a K; y ln() es
el logaritmo natural.
Un valor PSI de 0 implica que las distribuciones observadas y esperadas son idénticas al PSI
aumentando su valor a medida que las dos distribuciones divergen. Siddiqi (2005) interpretó los valores de PSI de la siguiente manera:
menos del 10% no muestran cambios significativos; valores entre 10% y 25% muestran un pequeño cambio que requiere
investigación; y valores superiores al 25% muestran un cambio significativo. Tenga en cuenta que el PSI es grande cuando un
categoría tiene la frecuencia relativa observada o esperada cercana a cero y no está definida si
o la frecuencia relativa es igual a 0. Por lo tanto, un argumento de límite sugiere que el PSI podría interpretarse como
que tiene un valor infinito cuando una de las frecuencias relativas es igual a cero.
El cálculo del PSI se ilustra con un ejemplo hipotético en la Tabla 1. Un PSI de 0.25 da como resultado
principalmente de las altas frecuencias observadas del 21% en las categorías 1 y 10. Por lo tanto, la interpretación
Riesgos 2019, 7, 53 4 de 11
recomendado por Siddiqi (2005) sugiere que la distribución de los datos ha cambiado significativamente de
desarrollo a revisar.