
# üß† Modelos DNN y ResNet para Clasificaci√≥n de Riesgo Crediticio

Este proyecto implementa y compara redes neuronales profundas (DNN) y redes neuronales tipo ResNet para predecir el riesgo crediticio de clientes en base a sus caracter√≠sticas financieras.

## üìÅ Contenido del Proyecto

- **Modelos implementados:**
  - DNN Simple
  - ResNet Simple
  - DNN con Hiperpar√°metros Optimizado
  - ResNet Optimizado y Ajustado

- **M√©tricas evaluadas:**
  - Accuracy
  - AUC (√Årea Bajo la Curva ROC)
  - Matriz de Confusi√≥n
  - Precision, Recall y F1-Score
  - An√°lisis de errores Tipo I y II
  - Supuesto de An√°lisis Financiero

---

## üìä Resultados Comparativos

| Modelo                   | Accuracy | AUC     |
|--------------------------|----------|---------|
| DNN Simple               | 0.8429   | 0.8997  |
| ResNet Simple            | 0.8071   | 0.8805  |
| DNN Optimizado           | 0.8286   | 0.9110  |
| ResNet Optimizado        | 0.8321   | 0.8970  |

---

## üîç Reflexi√≥n Cr√≠tica

Se consideran aspectos √©ticos como el posible sesgo en los datos hist√≥ricos de aprobaci√≥n/rechazo. Adem√°s, se eval√∫a la interpretabilidad de los modelos para su aplicaci√≥n en un contexto real, como en un comit√© de riesgo bancario. A pesar de usar redes complejas, se acompa√±a con m√©tricas claras para comunicar los resultados.

---

## üí∞ Suposici√≥n Financiera (Ejemplo)

- **Falso Positivo (FP):** Otorgar cr√©dito a un cliente riesgoso ‚Üí p√©rdida de $5,000
- **Falso Negativo (FN):** Rechazar a un cliente bueno ‚Üí p√©rdida de $1,000

Esto permite estimar el impacto financiero total de las predicciones err√≥neas por modelo y sugiere que, en un contexto real, adem√°s de accuracy, el costo financiero de los errores debe considerarse al seleccionar el modelo m√°s adecuado.

---

## üì¶ Requisitos

- Python ‚â• 3.8
- TensorFlow ‚â• 2.13
- Optuna (para optimizaci√≥n)
- scikit-learn
- matplotlib / seaborn

```bash
pip install tensorflow optuna scikit-learn matplotlib seaborn


üìå Autor

Proyecto desarrollado por [Cristobal Araya] como parte de una evaluaci√≥n de modelos de machine learning aplicados al cr√©dito. Demostraci√≥n de habilidades en:

Preprocesamiento y modelado

Optimizaci√≥n de hiperpar√°metros

Interpretaci√≥n de resultados

√âtica y negocio en IA

Reflexi√≥n sobre el uso de herramientas de asistencia IA

Este proyecto fue desarrollado con una combinaci√≥n de criterio propio, conocimiento t√©cnico y asistencia con herramientas basadas en inteligencia artificial (como ChatGPT).

Si bien parte del c√≥digo fue co-creado con soporte de IA, todas las decisiones de dise√±o, evaluaci√≥n, ajustes de modelos, interpretaci√≥n de resultados y reflexiones fueron definidas por m√≠ como autor del proyecto.

Este enfoque refleja una pr√°ctica profesional moderna en la ciencia de datos, donde se utilizan herramientas avanzadas para mejorar la productividad y el enfoque anal√≠tico, sin reemplazar el juicio humano.

Subo este proyecto con el objetivo de compartir el proceso completo, desde el desarrollo hasta la reflexi√≥n cr√≠tica, incluyendo tanto los aspectos t√©cnicos como √©ticos del modelado de riesgos en un contexto financiero.

## üöÄ Ideas para Mejorar el Proyecto

Si est√°s interesado en seguir mejorando este proyecto o aprendiendo nuevas herramientas, aqu√≠ tienes algunas sugerencias pr√°cticas que puedes implementar. Cada una incluye una breve explicaci√≥n y c√≥mo comenzar a aplicarla.

---

### üìå 1. Agregar Interpretabilidad al Modelo

**¬øQu√© hacer?**  
Implementa herramientas de interpretabilidad como **SHAP** o **LIME** para entender c√≥mo cada variable influye en las predicciones del modelo.

**¬øPor qu√© es √∫til?**  
Ayuda a comunicar tus resultados a personas no t√©cnicas (como un equipo de negocio o comit√© de cr√©dito) y mejora la confianza en el modelo.

**¬øC√≥mo empezar?**  
Instala e implementa alguna de estas librer√≠as:

```bash
pip install shap lime
```

Consulta la documentaci√≥n de [`shap`](https://github.com/slundberg/shap) y [`lime`](https://github.com/marcotcr/lime) para ver ejemplos aplicados.

---

### üìå 2. Visualizar la Importancia de las Variables

**¬øQu√© hacer?**  
Genera gr√°ficos que muestren qu√© variables tienen m√°s influencia en el modelo, usando:

- Permutation Importance  
- SHAP summary plots

**¬øPor qu√© es √∫til?**  
Te permite justificar decisiones del modelo y hacer an√°lisis de negocio m√°s claro.

**¬øC√≥mo empezar?**  
Usa las funciones de `shap` o librer√≠as como `eli5` para visualizaciones simples:

```bash
pip install shap eli5
```

---

### üìå 3. Usar Cross-Validation en la Optimizaci√≥n

**¬øQu√© hacer?**  
En lugar de usar solo un `train/test split`, implementa **k-fold cross-validation** para entrenar y evaluar el modelo.

**¬øPor qu√© es √∫til?**  
Aumenta la robustez de tus resultados y evita que un split afortunado afecte las m√©tricas.

**¬øC√≥mo empezar?**  
Si ya est√°s usando `Optuna` o `scikit-learn`, puedes integrar f√°cilmente `StratifiedKFold` en tu pipeline:

```python
from sklearn.model_selection import StratifiedKFold
```

---

### üìå 4. Comparar con Modelos Tradicionales

**¬øQu√© hacer?**  
Agrega un modelo de referencia simple, como `LogisticRegression`, como punto de comparaci√≥n (**baseline**).

**¬øPor qu√© es √∫til?**  
A veces los modelos simples ofrecen buen rendimiento y mejor interpretabilidad, lo cual es clave en escenarios reales.

**¬øC√≥mo empezar?**  
Usa este modelo con `scikit-learn`:

```bash
pip install scikit-learn
```

```python
from sklearn.linear_model import LogisticRegression
```

---

### üìå 5. Crear un Dashboard con Streamlit

**¬øQu√© hacer?**  
Construye una app web interactiva para que otros puedan probar el modelo cargando sus propios datos.

**¬øPor qu√© es √∫til?**  
Ideal para entrevistas, mostrar el proyecto en tu portafolio, o presentarlo a usuarios no t√©cnicos.

**¬øC√≥mo empezar?**

1. Instala Streamlit:
   ```bash
   pip install streamlit
   ```
2. Crea un archivo `app.py` con tu l√≥gica de predicci√≥n.
3. Ejecuta la app:
   ```bash
   streamlit run app.py
   ```

---

### üìå 6. Agregar Tests y Validaciones de Calidad

**¬øQu√© hacer?**  
Incluye peque√±as pruebas que aseguren la calidad de los datos de entrada y salida, como:

- Verificar que no haya valores nulos (`NaN`)
- Validar consistencia de las columnas
- Chequear fairness del modelo en distintos grupos

**¬øPor qu√© es √∫til?**  
Da mayor confianza en el modelo y muestra profesionalismo en el desarrollo.

**¬øC√≥mo empezar?**  
Puedes usar `pytest`, o simplemente agregar bloques `assert` en el c√≥digo:

```python
assert not df.isnull().any().any(), "Existen valores nulos en los datos"
```

---

