# 📌 Taller: Análisis de riesgo en cartera de microcréditos

## 📖 Tabla de Contenidos  

1. **Introducción**  
   - 1.1 Generalidades del reto y problema de interés.
   - 1.2 Objetivo claro - Pregunta SMART 
   - 1.3 Revisión de la bibliografía 
   - 1.4 Objetivo del taller   
   - 1.5 Diccionario de datos
2. **Análisis Exploratorio**  
   - 3.1 Análisis de estructura  
   - 3.2 Análisis de variables categóricas  
   - 3.3 Análisis de variables enteras  
   - 3.4 Análisis de variables continuas  
     - 3.4.1 Análisis de outliers  
       - 3.4.1.1 Outliers de ingresos  
       - 3.4.1.2 Outliers de deudas y créditos  
     - 3.4.2 Conclusiones Outliers  
3. **Limpieza de Datos**  
   - 4.1 División de datasets  
   - 4.2 Ingreso bruto menor a ingreso líquido  
   - 4.3 Estandarización  
   - 4.4 Imputación  
4. **Feature Engineering**  
   - 5.1 Dummificar variables  
   - 5.2 PCA  
   - 5.3 LDA  
   - 5.4 Clustering  
5. **Lasso para selección de variables**  
6. **Data Pipeline**  
7. **Modelamiento**  
   - 8.1 Baseline  
   - 8.2 SVM  
     - 8.2.1 Kernel RBF - 0.8984  
     - 8.2.2 Kernel Lineal - 0.6819  
     - 8.2.3 Kernel Sigmoide - 0.8241  
   - 8.3 Lasso - 0.9219  
   - 8.4 Ridge - 0.9444  
   - 8.5 ElasticNet - 0.9538  
   - 8.6 LDA  
     - 8.6.1 SVD Solver - 0.9265  
     - 8.6.2 LSQR Solver - 0.9461  
     - 8.6.3 EIGEN Solver - 0.9434  
   - 8.7 QDA - 0.9225  
   - 8.8 Redes Neuronales - 0.9498  
8. **Modelos Finales**  
   - 9.1 LDA con LSQR - 0.9859  
   - 9.2 ElasticNet - 1.057  
   - 9.3 Redes Neuronales - 0.996  
9. **Mejor Modelo**  


## Introducción
#### 1.1. Generalidades del reto y problema de interés. 

<p align="justify">
  Este análisis se enmarca en el Reto de Analítica de Datos, Inteligencia Artificial y Machine 
Learning del Banco W, cuyo objetivo es desarrollar un modelo que permita identificar y 
clasificar a los clientes y agencias con alto riesgo financiero en microcréditos. Para ello, se 
aplicarán técnicas de análisis de datos e IA, que permitan mejorar la toma de decisiones en 
la asignación de analistas de auditoría. 
El proceso de auditoría en microcréditos requiere evaluar el riesgo de los créditos otorgados 
en campo, identificando patrones de conducta inusual, fraudes y perfiles de alto riesgo en 
clientes y agencias. En el sector de las microfinanzas, la gestión del riesgo financiero es 
fundamental  para  garantizar  la sostenibilidad de las entidades prestamistas y minimizar 
pérdidas derivadas de incumplimientos crediticios.  
Definición de microcréditos: Son préstamos de pequeña cuantía otorgados a personas de 
bajos  ingresos  o  con  dificultades  de  acceso  a  la  banca  tradicional,  con  el objetivo de 
fomentar el autoempleo y el desarrollo de pequeños negocios.  
 
Características  de  los  microcréditos:  tienen  montos  reducidos,  plazos  de devolución 
cortos,  tasas  de  interés  accesibles  y  una  evaluación del riesgo crediticio basada en la 
capacidad y voluntad de pago del solicitante, en lugar de garantías tangibles. En Colombia, 
un microcrédito no puede exceder los 120 salarios mínimos legales vigentes (SMLV). Este 
tipo de crédito está dirigido a microempresarios y personas independientes
</p>


#### 1.2. Objetivo claro - Pregunta SMART  
<p align="center"><b>¿Cómo podemos desarrollar un modelo basado en análisis de datos e inteligencia 
artificial para identificar créditos, analistas y agencias con alto riesgo financiero en la 
cartera de microcréditos del banco W, utilizando características del crédito, historial 
de auditorías y factores de estabilidad financiera, con el fin de priorizar las auditorías 
internas y mejorar la eficiencia del proceso en un período de seis meses?</b></p>

¿Por qué es SMART? 

- *Específica:* Se especifica que se usará análisis de datos e inteligencia artificial. Se 
centra en créditos, analistas y agencias de alto riesgo, dentro del contexto de 
auditoría de microcréditos. 

- *Medible:* Se establece que el modelo debe identificar casos de alto riesgo y mejorar 
la eficiencia de auditorías. 

- *Alcanzable:* Puede resolverse con análisis exploratorio de datos (EDA modelos de 
IA, y se cuenta con los datos del área de auditoría del banco. 

- *Relevante:* Es clave para mejorar la gestión del riesgo financiero de microcréditos y 
la selección de auditorías internas. 

- *Con límite de tiempo:* Se define un horizonte de seis meses para la 
implementación. Puede abordarse en el plazo del curso.

#### 1.3. Revisión de la bibliografía
 
 <p align="justify">
  El análisis del riesgo crediticio de cartera ha sido ampliamente estudiado en el contexto de 
la  auditoría  financiera  y la auditoría bancaria. La investigación destaca que la auditoría 
interna  es  importante  en  la  gestión  del  riesgo  crediticio,  permitiendo  a  las  entidades 
financieras mitigar pérdidas y mejorar sus procesos de toma de decisiones (Berisha et al., 
2023). Estos estudios se enfocan en el uso de metodologías cuantitativas, como el análisis 
univariado, para identificar patrones de riesgo dentro de la cartera crediticia. 
Por un lado, Moposita y Ramírez (2016) presentan un marco de auditoría para cooperativas 
de ahorro y crédito, donde se destaca la importancia de realizar exámenes detallados sobre 
el  comportamiento  de  los  clientes.  Este  enfoque  permite  establecer  relaciones  entre 
variables clave como el monto del crédito, la morosidad y la probabilidad de incumplimiento. 
Por otro lado, Hernández Bautista (2023) introduce una herramienta de análisis financiero 
que segmenta clientes según su nivel de riesgo. En este estudio, se resalta que el análisis 
de variables individuales, como el monto del crédito, permite predecir con mayor precisión la 
estabilidad financiera de un cliente, facilitando procesos de auditoría y toma de decisiones 
estratégicas. 

Estos estudios confirman que el análisis univariado es una técnica clave en la identificación 
y  supervisión  del  riesgo  crediticio,  especialmente  en  auditorías  de  microcréditos.  Su 
implementación  permite  a  las  instituciones  financieras  identificar  patrones  en  los  datos 
históricos y mejorar la calidad de su cartera crediticia.
</p>


#### 1.4. Objetivo del taller  
<p align="justify">
    En  este  contexto,  como  equipo  buscamos  aplicar  técnicas  de  análisis  univariado, 
segmentación  de  clientes  según  el  riesgo  y  detección  de  patrones  anómalos  para 
determinar qué factores son más relevantes en la identificación de clientes y agencias con 
alto riesgo financiero, contribuyendo a mejorar la gestión de riesgos en el Banco W. 
Sin embargo, como primer paso, en este taller se hará un análisis univariado teniendo en 
cuenta que ya seguimos los anteriores pasos del análisis exploratorio de datos (EDA, por 
sus siglas en inglés) como lo son la pregunta smart y una vista general de las columnas. 
Nota: en este caso no se cuenta con un diccionario de datos que nos permita determinar el 
significado real de algunas variables del dataset.  
 
Para este punto buscamos establecer qué variables son más útiles y que nos pueden decir 
esta con respecto al análisis que queremos hacer y a la respuesta de nuestra pregunta 
smart, para ello se buscará información externa que nos pueda ayudar y además hacer 
algunos de los procesos que se deben seguir en el análisis univariado como datos faltantes, 
outliers y distribución. 
</p>


#### 1.5 Diccionario de datos