<a href="https://colab.research.google.com/github/melirandazzo/trabajo_ciencia_datos/blob/main/ProyectoDS_ParteI_Randazzo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

***Análisis de riesgo crediticio***

El análisis del riesgo crediticio es esencial para las instituciones financieras, ya que les permite evaluar la capacidad de los solicitantes de préstamos para cumplir con sus obligaciones.
En este trabajo el objetivo es investigar los motivos frecuentes para solicitar un crédito, la relación entre la edad y los motivos de solicitud, los ingresos de los solicitantes en relación con el monto del préstamo y la capacidad de pago.


**Hipótesis General:**

Los solicitantes de crédito presentan diferentes comportamientos y riesgos de incumplimiento en función de factores demográficos y financieros, como la edad, el ingreso anual, la antigüedad laboral, la intención del préstamo, y el historial de cumplimiento de pago. En particular, los motivos más frecuentes para solicitar un crédito varían con la edad, y la capacidad de pago está significativamente influenciada por el ingreso anual y la proporción del ingreso destinada al préstamo.
Además, los solicitantes con mayor antigüedad laboral y un historial positivo de cumplimiento de pago tienen un menor riesgo de incumplimiento.


**Preguntas de Investigación:**

•	¿Cuáles son los motivos más frecuentes para solicitar un crédito?

•	¿Existe una relación significativa entre la edad de los solicitantes y los motivos para solicitar un crédito?

•	¿Qué proporción de los ingresos representan los créditos solicitados y cómo afecta esto a la capacidad de pago?

•	¿Cómo influye la antigüedad laboral de los solicitantes en el riesgo de incumplimiento del crédito?

•	¿Qué relación existe entre el historial de cumplimiento de pago y el riesgo de incumplimiento del crédito?

•	¿Cómo influye el grado del préstamo en el tipo de interés y el riesgo de incumplimiento?


Este informe preliminar plantea una visión general del análisis del riesgo crediticio basado en el motivo de solicitud, la edad de los solicitantes y su capacidad de pago. Proporciona una base para investigar cómo los factores mencionados afectan el comportamiento crediticio y el riesgo de incumplimiento de los solicitantes.


In [None]:
import pandas as pd
from datetime import datetime, timedelta
from matplotlib import pyplot as plt
from matplotlib import dates as mpl_dates
import seaborn as sns
from mpl_toolkits.mplot3d import Axes3D
import  numpy as np
import seaborn as sns
import matplotlib as mpl

pd.set_option('display.max_columns', None)

In [None]:
url = 'https://raw.githubusercontent.com/melirandazzo/trabajo_ciencia_datos/7d38fcd1eada1954588483f6e7121570966ed81a/credit_risk_dataset.csv'
df = pd.read_csv(url)
df

Unnamed: 0,person_age,person_income,person_home_ownership,person_emp_length,loan_intent,loan_grade,loan_amnt,loan_int_rate,loan_status,loan_percent_income,cb_person_default_on_file,cb_person_cred_hist_length
0,22,59000,RENT,123.0,PERSONAL,D,35000,16.02,1,0.59,Y,3
1,21,9600,OWN,5.0,EDUCATION,B,1000,11.14,0,0.10,N,2
2,25,9600,MORTGAGE,1.0,MEDICAL,C,5500,12.87,1,0.57,N,3
3,23,65500,RENT,4.0,MEDICAL,C,35000,15.23,1,0.53,N,2
4,24,54400,RENT,8.0,MEDICAL,C,35000,14.27,1,0.55,Y,4
...,...,...,...,...,...,...,...,...,...,...,...,...
32576,57,53000,MORTGAGE,1.0,PERSONAL,C,5800,13.16,0,0.11,N,30
32577,54,120000,MORTGAGE,4.0,PERSONAL,A,17625,7.49,0,0.15,N,19
32578,65,76000,RENT,3.0,HOMEIMPROVEMENT,B,35000,10.99,1,0.46,N,28
32579,56,150000,MORTGAGE,5.0,PERSONAL,B,15000,11.48,0,0.10,N,26


Descripción de las columnas

- person_age: Edad
- person_income: Ingreso Anual
- person_home_ownership:	Posesion de vivienda
- person_emp_length:	Antigüedad laboral
- loan_intent:	Intención de préstamo
- loan_grade:	Grado del Prestamo
- loan_amnt:	Monto del prestamo
- loan_int_rate:	Interes
- loan_status:	Estado del credito (0 no es predeterminado 1 es predeterminado)
- loan_percent_income:	Porcentaje de ingreso
- cb_person_default_on_file:	Historial de cumplimiento de pago
- cb_preson_cred_hist_length:	Historia crediticia






In [None]:
# renombrar las columnas
df= df.rename(columns={"person_age": "EDAD",
                       "person_income": "INGRESO_ANUAL",
                       "person_home_ownership": "TIPO_VIVIENDA",
                       "person_emp_length":"ANTIGUEDAD_LABORAL",
                       "loan_intent":"INTENCION",
                       "loan_grade":"GRADO",
                       "loan_amnt":"MONTO",
                       "loan_int_rate":"INTERES",
                       "loan_status":"ESTADO",
                       "loan_percent_income":"POCENTAJE_INGRESO",
                       "cb_person_default_on_file":"HISTORIAL_CUMPLIMIENTO",
                       "cb_person_cred_hist_length":"HISTORIA_CREDITICIA"})
df.head()

Unnamed: 0,EDAD,INGRESO_ANUAL,TIPO_VIVIENDA,ANTIGUEDAD_LABORAL,INTENCION,GRADO,MONTO,INTERES,ESTADO,POCENTAJE_INGRESO,HISTORIAL_CUMPLIMIENTO,HISTORIA_CREDITICIA
0,22,59000,RENT,123.0,PERSONAL,D,35000,16.02,1,0.59,Y,3
1,21,9600,OWN,5.0,EDUCATION,B,1000,11.14,0,0.1,N,2
2,25,9600,MORTGAGE,1.0,MEDICAL,C,5500,12.87,1,0.57,N,3
3,23,65500,RENT,4.0,MEDICAL,C,35000,15.23,1,0.53,N,2
4,24,54400,RENT,8.0,MEDICAL,C,35000,14.27,1,0.55,Y,4


In [None]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 32581 entries, 0 to 32580
Data columns (total 12 columns):
 #   Column                  Non-Null Count  Dtype  
---  ------                  --------------  -----  
 0   EDAD                    32581 non-null  int64  
 1   INGRESO_ANUAL           32581 non-null  int64  
 2   TIPO_VIVIENDA           32581 non-null  object 
 3   ANTIGUEDAD_LABORAL      31686 non-null  float64
 4   INTENCION               32581 non-null  object 
 5   GRADO                   32581 non-null  object 
 6   MONTO                   32581 non-null  int64  
 7   INTERES                 29465 non-null  float64
 8   ESTADO                  32581 non-null  int64  
 9   POCENTAJE_INGRESO       32581 non-null  float64
 10  HISTORIAL_CUMPLIMIENTO  32581 non-null  object 
 11  HISTORIA_CREDITICIA     32581 non-null  int64  
dtypes: float64(3), int64(5), object(4)
memory usage: 3.0+ MB


In [None]:
df.shape

(32581, 12)

In [None]:
resumen=df.describe().round(1)
resumen

Unnamed: 0,EDAD,INGRESO_ANUAL,ANTIGUEDAD_LABORAL,MONTO,INTERES,ESTADO,POCENTAJE_INGRESO,HISTORIA_CREDITICIA
count,32581.0,32581.0,31686.0,32581.0,32581.0,32581.0,32581.0,32581.0
mean,27.7,66074.8,4.8,9589.4,10.0,0.2,0.2,5.8
std,6.3,61983.1,4.1,6322.1,4.5,0.4,0.1,4.1
min,20.0,4000.0,0.0,500.0,0.0,0.0,0.0,2.0
25%,23.0,38500.0,2.0,5000.0,7.5,0.0,0.1,3.0
50%,26.0,55000.0,4.0,8000.0,10.6,0.0,0.2,4.0
75%,30.0,79200.0,7.0,12200.0,13.1,0.0,0.2,8.0
max,144.0,6000000.0,123.0,35000.0,23.2,1.0,0.8,30.0


In [None]:
# Contar el numero de valores que son 0 por columnas
valores_faltantes = (df[['ANTIGUEDAD_LABORAL','POCENTAJE_INGRESO']] == 0).sum()
print(valores_faltantes)

ANTIGUEDAD_LABORAL    4105
POCENTAJE_INGRESO        9
dtype: int64


Valores en cero para la columnas ANTIGUEDAD_LABORAL representa la situacion crediticia de personas son trabajo, se consideran valores validos.

Valores en cero para la columna POCENTAJE_INGRESO representa que el credito no impacta significativamente sobre el ingreso anual de la persona, se consideran valores validos.

In [None]:
# Contar  valores vacios de la columna intereses
intereses_faltantes = df[['INTERES']].isnull().sum()
intereses_faltantes


INTERES    3116
dtype: int64


Se detectan valores vacios para la columna intereses, no es un valor valido, se decide reemplazar por cero, interpretando que es un credito sin intereses

In [None]:
# Reemplazar valores nulos por cero de la columnaINTERES

df[['INTERES']] = df[['INTERES']].fillna(0)
df

Unnamed: 0,EDAD,INGRESO_ANUAL,TIPO_VIVIENDA,ANTIGUEDAD_LABORAL,INTENCION,GRADO,MONTO,INTERES,ESTADO,POCENTAJE_INGRESO,HISTORIAL_CUMPLIMIENTO,HISTORIA_CREDITICIA
0,22,59000,RENT,123.0,PERSONAL,D,35000,16.02,1,0.59,Y,3
1,21,9600,OWN,5.0,EDUCATION,B,1000,11.14,0,0.10,N,2
2,25,9600,MORTGAGE,1.0,MEDICAL,C,5500,12.87,1,0.57,N,3
3,23,65500,RENT,4.0,MEDICAL,C,35000,15.23,1,0.53,N,2
4,24,54400,RENT,8.0,MEDICAL,C,35000,14.27,1,0.55,Y,4
...,...,...,...,...,...,...,...,...,...,...,...,...
32576,57,53000,MORTGAGE,1.0,PERSONAL,C,5800,13.16,0,0.11,N,30
32577,54,120000,MORTGAGE,4.0,PERSONAL,A,17625,7.49,0,0.15,N,19
32578,65,76000,RENT,3.0,HOMEIMPROVEMENT,B,35000,10.99,1,0.46,N,28
32579,56,150000,MORTGAGE,5.0,PERSONAL,B,15000,11.48,0,0.10,N,26


In [None]:
# Traducir valores en ingles al español para la columan TIPO_VIVIENDA

df[['TIPO_VIVIENDA']] = df[['TIPO_VIVIENDA']].replace('RENT', 'Alquila')
df[['TIPO_VIVIENDA']] = df[['TIPO_VIVIENDA']].replace('OWN', 'Propia')
df[['TIPO_VIVIENDA']] = df[['TIPO_VIVIENDA']].replace('MORTGAGE', 'Hipoteca')
df[['TIPO_VIVIENDA']] = df[['TIPO_VIVIENDA']].replace('OTHER', 'Otra')
df

Unnamed: 0,EDAD,INGRESO_ANUAL,TIPO_VIVIENDA,ANTIGUEDAD_LABORAL,INTENCION,GRADO,MONTO,INTERES,ESTADO,POCENTAJE_INGRESO,HISTORIAL_CUMPLIMIENTO,HISTORIA_CREDITICIA
0,22,59000,Alquila,123.0,PERSONAL,D,35000,16.02,1,0.59,Y,3
1,21,9600,Propia,5.0,EDUCATION,B,1000,11.14,0,0.10,N,2
2,25,9600,Hipoteca,1.0,MEDICAL,C,5500,12.87,1,0.57,N,3
3,23,65500,Alquila,4.0,MEDICAL,C,35000,15.23,1,0.53,N,2
4,24,54400,Alquila,8.0,MEDICAL,C,35000,14.27,1,0.55,Y,4
...,...,...,...,...,...,...,...,...,...,...,...,...
32576,57,53000,Hipoteca,1.0,PERSONAL,C,5800,13.16,0,0.11,N,30
32577,54,120000,Hipoteca,4.0,PERSONAL,A,17625,7.49,0,0.15,N,19
32578,65,76000,Alquila,3.0,HOMEIMPROVEMENT,B,35000,10.99,1,0.46,N,28
32579,56,150000,Hipoteca,5.0,PERSONAL,B,15000,11.48,0,0.10,N,26


In [None]:
# Traducir valores en ingles al español para la columan INTENCION

df[['INTENCION']] = df[['INTENCION']].replace('DEBTCONSOLIDATION', 'Pago de deuda')
df[['INTENCION']] = df[['INTENCION']].replace('EDUCATION', 'Educación')
df[['INTENCION']] = df[['INTENCION']].replace('HOMEIMPROVEMENT', 'Contrucción')
df[['INTENCION']] = df[['INTENCION']].replace('MEDICAL', 'Salud')
df[['INTENCION']] = df[['INTENCION']].replace('PERSONAL', 'Personal')
df[['INTENCION']] = df[['INTENCION']].replace('VENTURE', 'Negocios')
df

Unnamed: 0,EDAD,INGRESO_ANUAL,TIPO_VIVIENDA,ANTIGUEDAD_LABORAL,INTENCION,GRADO,MONTO,INTERES,ESTADO,POCENTAJE_INGRESO,HISTORIAL_CUMPLIMIENTO,HISTORIA_CREDITICIA
0,22,59000,Alquila,123.0,Personal,D,35000,16.02,1,0.59,Y,3
1,21,9600,Propia,5.0,Educación,B,1000,11.14,0,0.10,N,2
2,25,9600,Hipoteca,1.0,Salud,C,5500,12.87,1,0.57,N,3
3,23,65500,Alquila,4.0,Salud,C,35000,15.23,1,0.53,N,2
4,24,54400,Alquila,8.0,Salud,C,35000,14.27,1,0.55,Y,4
...,...,...,...,...,...,...,...,...,...,...,...,...
32576,57,53000,Hipoteca,1.0,Personal,C,5800,13.16,0,0.11,N,30
32577,54,120000,Hipoteca,4.0,Personal,A,17625,7.49,0,0.15,N,19
32578,65,76000,Alquila,3.0,Contrucción,B,35000,10.99,1,0.46,N,28
32579,56,150000,Hipoteca,5.0,Personal,B,15000,11.48,0,0.10,N,26
