# Taller de Modelado de Riesgo Crediticio (HELOC)
Autor: _[Tu Nombre Aquí]_  
Fecha: _[Completar]_  

Este cuaderno contiene las instrucciones para completar tareas de regresión y clasificación sobre el dataset **Home‑Equity Line of Credit (HELOC)**. Sigue cada sección, agrega tus celdas de código donde se indique **TODO**, y responde las preguntas solicitadas.

| Aspecto | Detalle |
|---------|---------|
| **Origen** | Publicado por **FICO®** como parte de su “Explainable Machine Learning Challenge” (2018); disponible en Kaggle y en el repositorio oficial de la competencia. |
| **Observaciones** | **10 459** solicitudes de línea de crédito hipotecaria (clientes únicos). |
| **Variables** | **24 columnas** en total: 1 objetivo (`RiskPerformance`) + 23 predictoras numéricas y categóricas codificadas como enteros. |
| **Variable objetivo** | `RiskPerformance` &rarr; “Good” (0) ó “Bad” (1). “Bad” indica que el cliente incurrió en default, morosidad grave o cierre por cobranza. |
| **Variables predictoras clave** | `ExternalRiskEstimate`, `MSinceMostRecentDelq`, `NumTotalTrades`, `PercentTradesNeverDelq`, `NetFractionRevolvingBurden`, entre otras. Representan historiales de crédito, antigüedad de líneas, morosidades y utilización de cupo. |
| **Codificación de faltantes** | El valor **–8** indica “no disponible” (missing). No existen `NaN` nativos; se debe convertir –8 → `NaN` antes de imputar o escalar. |
| **Balance de clases** | ~ **74 %** “Good” vs. **26 %** “Bad” (dataset moderadamente desbalanceado). |
| **Posibles tareas** | 1) **Clasificación** del riesgo (`RiskPerformance`).<br>2) **Regresión** del score de riesgo (`ExternalRiskEstimate`) o métricas de carga financiera (`NetFraction*`). |
| **Licencia / uso** | Datos anonimizados, liberados exclusivamente con fines académicos y de investigación; no incluyen información personal identificable. |

## 1. Carga de librerías y datos
Ejecuta la celda siguiente para cargar el CSV que ya descargaste (`heloc.csv`). Si lo tienes en otra ruta, ajusta el _path_.

In [11]:
import pandas as pd
import numpy as np

# Cargar datos de la carpeta data en la raíz del proyecto
df = pd.read_csv('heloc.csv')

# Vista preliminar
df.head()

Unnamed: 0,RiskPerformance,ExternalRiskEstimate,MSinceOldestTradeOpen,MSinceMostRecentTradeOpen,AverageMInFile,NumSatisfactoryTrades,NumTrades60Ever2DerogPubRec,NumTrades90Ever2DerogPubRec,PercentTradesNeverDelq,MSinceMostRecentDelq,...,PercentInstallTrades,MSinceMostRecentInqexcl7days,NumInqLast6M,NumInqLast6Mexcl7days,NetFractionRevolvingBurden,NetFractionInstallBurden,NumRevolvingTradesWBalance,NumInstallTradesWBalance,NumBank2NatlTradesWHighUtilization,PercentTradesWBalance
0,Bad,55,144,4,84,20,3,0,83,2,...,43,0,0,0,33,-8,8,1,1,69
1,Bad,61,58,15,41,2,4,4,100,-7,...,67,0,0,0,0,-8,0,-8,-8,0
2,Bad,67,66,5,24,9,0,0,100,-7,...,44,0,4,4,53,66,4,2,1,86
3,Bad,66,169,1,73,28,1,1,93,76,...,57,0,5,4,72,83,6,4,3,91
4,Bad,81,333,27,132,12,0,0,100,-7,...,25,0,1,1,51,89,3,1,0,80
