En este proyecto se trabaja con la base de datos de "Credit Approval" disponible en https://archive.ics.uci.edu/ml/datasets/Credit+Approval.
El objetivo fundamental del proyecto es cubrir el proceso entero de creación de un modelo de clasificación usando R y la librería Caret. Las fases que se seguirán son las siguientes:
- Preprocesar los datos:
- Analizar las variables (tanto análisis monovariable como multivariable)
- Tratar valores nulos, outliers y desconocidos.
- Eliminar variables sin importancia y añadir nuevas.
- Transformar los datos de manera justificada (normalizar, estandarizar, etc.).
- Entrenar varios modelos/técnicas:
- Escoger varios modelos/técnicas a comparar.
- Encontrar los mejores hiper-parámetros de los mismos.
- Comparar los modelos
- Comparar el rendimiento de los diferentes modelos.
- Decidir justificadamente el modelo final.
- Evaluar el rendimiento futuro del modelo final.