# N2 – Building Scripts para Credit Score

Este notebook documenta cómo se pasó el trabajo exploratorio de `N1_CreditScore_ANN.ipynb` a una estructura productiva tipo `model-credit`.

Scripts clave en `src/`:

- `make_dataset.py` (stub de compatibilidad)
- `train.py` (entrenamiento de modelo ANN con scikit-learn)
- `evaluate.py` (evaluación en `credit_val.csv`)
- `predict.py` (scoring sobre `credit_score.csv`)


## 1. Estructura de carpetas
```text
model-credit-score/
├─ data/
│  ├─ raw/        # Score.csv
│  ├─ processed/  # credit_train.csv, credit_val.csv, credit_score.csv
│  └─ scores/     # final_score.csv
├─ models/        # best_model.pkl
├─ notebooks/     # N1_, N2_
└─ src/           # make_dataset, train, evaluate, predict
```


## 2. Ejecución secuencial (igual que la guía)

```bash
cd src
python make_dataset.py      # opcional (stub)
python train.py             # entrena modelo
python evaluate.py          # evalúa métricas
python predict.py           # genera final_score.csv
cd ..
```


## 3. Lógica de entrenamiento (`src/train.py`)

1. Lee `data/raw/Score.csv`.
2. Separa `Credit_Score` como variable objetivo (3 clases).
3. Divide en train/validación y genera también un set `credit_score.csv`.
4. Construye un `ColumnTransformer` para tratar variables numéricas y categóricas.
5. Entrena un `MLPClassifier` (ANN) dentro de un `Pipeline`.
6. Guarda el modelo como `models/best_model.pkl`.


## 4. Evaluación (`src/evaluate.py`)

Carga `credit_val.csv` y el modelo entrenado, calcula accuracy, matriz de
confusión y classification report.


## 5. Scoring (`src/predict.py`)

Toma `credit_score.csv` (sin la columna objetivo), aplica `predict_proba`
y guarda las probabilidades por clase en `data/scores/final_score.csv`.
