Link a la publicación de Linkedin
"Credit Scoring Prediction" es un proyecto de machine learning centrado en predecir la elegibilidad de los usuarios para recibir préstamosbasándose en sus métricas y datos. El objetivo principal es utilizar algoritmos de aprendizaje automático para evaluar la probabilidad de
que un usuario sea capaz de pagar un préstamo, utilizando información histórica y métricas financieras.
Esta esta etapa consistió en: Analizar los datos Eliminar duplicados Tratar valores nulos Reemplazar valores categóritos por numéricos
Aplicamos técnicas de Feature Engineering Agrupamos los datos para su análisis Realizamos un análisis exploratorio Prescindimos de columnas que no aportaban información
Observamos un desbalanceamiento en la columna objetiva por lo que aplicamos SMOTE para balanceralos
Pusimos a prueba 5 modelos de aprendizaje automático y evaluamos por cada modelo 6 métricas distintas para tomar una decisión...
Árboles de decisiones KNN Regresión Logística Naive Bayes Random Forest
Optimizamos los modelos para obtener las mejores combinaciones de parámetros
Una vez obtenidas todas las métricas de todos los modelos procederemos a compararlas entre si para la selección del mejor método.
Para el caso de estudio la métrica mas representativa sera la Specificity pues esta trabaja con los verdaderos negativos y por
la naturaleza del ejercicio (la variable a predecir) estamos buscando los 0 verdaderos sobre los 0 falsos pues según el
archivo "german_dataset_dictionary.txt" cuando el valor de la variable a predecir es 0 significa que el cliente es muy probable
que pague.
En conclusión el mejor modelo para este caso sera RandomForestClassifier