Skip to content

Un banco Alemán requiere nuestros servicios para determinar el riesgo crediticio a la hora de otorgar un préstamo a un cliente y automatizar este proceso utilizando Machine Learning.

Notifications You must be signed in to change notification settings

pabloing93/credit-scoring-prediction

Repository files navigation

Credit Scoring Prediction

Cómo leer este proyecto 📝

image

Presentación corporativa

Link a la publicación de Linkedin

Tecnologías utilizadas

Python Pandas Matplotlib scikit-learn

Escenario 📝

"Credit Scoring Prediction" es un proyecto de machine learning centrado en predecir la elegibilidad de los usuarios para recibir préstamos
basándose en sus métricas y datos. El objetivo principal es utilizar algoritmos de aprendizaje automático para evaluar la probabilidad de
que un usuario sea capaz de pagar un préstamo, utilizando información histórica y métricas financieras.

1. Limpieza

1.2. Preprocesamiento de los Datos

Esta esta etapa consistió en: Analizar los datos Eliminar duplicados Tratar valores nulos Reemplazar valores categóritos por numéricos

image image

1.3. EDA: Análisis exploratorio de los datos

Aplicamos técnicas de Feature Engineering Agrupamos los datos para su análisis Realizamos un análisis exploratorio Prescindimos de columnas que no aportaban información


image


image


image


image

image


image


Observamos un desbalanceamiento en la columna objetiva por lo que aplicamos SMOTE para balanceralos


image


image

2. Modelos

2.2. Implementación de los modelos

Pusimos a prueba 5 modelos de aprendizaje automático y evaluamos por cada modelo 6 métricas distintas para tomar una decisión...

Árboles de decisiones KNN Regresión Logística Naive Bayes Random Forest

2.3. Optimización de los modelos

Optimizamos los modelos para obtener las mejores combinaciones de parámetros

3. Evaluación

Una vez obtenidas todas las métricas de todos los modelos procederemos a compararlas entre si para la selección del mejor método.
Para el caso de estudio la métrica mas representativa sera la Specificity pues esta trabaja con los verdaderos negativos y por
la naturaleza del ejercicio (la variable a predecir) estamos buscando los 0 verdaderos sobre los 0 falsos pues según el
archivo "german_dataset_dictionary.txt" cuando el valor de la variable a predecir es 0 significa que el cliente es muy probable
que pague.


image


En conclusión el mejor modelo para este caso sera RandomForestClassifier

4. Predicción

image

About

Un banco Alemán requiere nuestros servicios para determinar el riesgo crediticio a la hora de otorgar un préstamo a un cliente y automatizar este proceso utilizando Machine Learning.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published