### Diccionario de datos

- id: Identificar único de la solicitud de crédito
- income: Ingreso anual en USD
- experience: Años de experiencia profesional
- marital_status: Estado marital
- house_ownership: Tipo de vivienda
- car_ownership: Propiedad de vehículo
- profession: Profesión
- city: Ciudad de residencia
- state: Estado de residencia
- current_job_years: Años en el trabajo actual
- current_house_years: Años en la actual residencia
- risk_flag: Indica si fue identificado como riesgo de incumplimiento de la obligación

In [40]:
#Jose Luis Chiquillo Aldana
import pandas as pd

import altair as alt
alt.renderers.enable('default')
#RendererRegistry.enable('default')

RendererRegistry.enable('default')

In [2]:
loans_df = pd.read_csv('./data/loans.csv')

In [3]:
loans_df.shape

(252000, 13)

In [4]:
loans_df.dtypes

id                      int64
income                  int64
age                     int64
experience              int64
marital_status         object
house_ownership        object
car_ownership          object
profession             object
city                   object
state                  object
current_job_years       int64
current_house_years     int64
risk_flag               int64
dtype: object

In [5]:
loans_df.head()

Unnamed: 0,id,income,age,experience,marital_status,house_ownership,car_ownership,profession,city,state,current_job_years,current_house_years,risk_flag
0,1,1303834,23,3,single,rented,no,Mechanical_engineer,Rewa,Madhya_Pradesh,3,13,0
1,2,7574516,40,10,single,rented,no,Software_Developer,Parbhani,Maharashtra,9,13,0
2,3,3991815,66,4,married,rented,no,Technical_writer,Alappuzha,Kerala,4,10,0
3,4,6256451,41,2,single,rented,yes,Software_Developer,Bhubaneswar,Odisha,2,12,1
4,5,5768871,47,11,single,rented,no,Civil_servant,Tiruchirappalli[10],Tamil_Nadu,3,14,1


In [98]:
#Personas menores de 21 años clasificadas por su profesión y su estado marital. 
#Se evidencia que la gran mayoría de esta población no cuenta con riesgos para pedir créditos a una entidad financiera.
pjoven = loans_df[loans_df["age"] <= 21]
pjoven.shape
alt.Chart(pjoven).mark_point().encode(
    alt.X('marital_status'),
    alt.Y('profession'),
    #alt.Size('US_Gross')
    alt.Color('risk_flag'),
    alt.OpacityValue(0.7),
    tooltip = [alt.Tooltip('marital_status'),
               alt.Tooltip('current_job_years'),
               alt.Tooltip('risk_flag'),
               alt.Tooltip('age')
              ]
).interactive()

In [68]:
psal = loans_df[loans_df["income"] < 100000]
psal.shape

(2319, 13)

In [92]:
#Personas con un salarioo anual menor a 100 mil USD, no se evidencia una tendencia fija si el riesgo existe en esta personas.
alt.Chart(psal).mark_point().encode(
    alt.X('income'),
    alt.Y('profession'),
    #alt.Size('US_Gross'),
    alt.Color('risk_flag'),
    alt.OpacityValue(0.7),
    tooltip = [alt.Tooltip('marital_status'),
               alt.Tooltip('current_job_years'),
               alt.Tooltip('risk_flag'),
               alt.Tooltip('age')
              ]
).interactive()

In [116]:
prisk = loans_df[loans_df["current_job_years"] < 1]
prisk.sample(5000, replace=True).shape

(5000, 13)

In [123]:
#Se toman aleatoriamente personas con un solo año de antiguedad en su trabajo.
#En el analisis se determina que dicha condición es tomada en cuenta para las entidades financieras a la hora de que un cliente solicite un crédito.
alt.Chart(prisk.sample(5000)).mark_point().encode(
    alt.X('income'),
    alt.Y('profession'),
    #alt.Size('US_Gross'),
    alt.Color('risk_flag'),
    alt.OpacityValue(0.7),
    tooltip = [alt.Tooltip('marital_status'),
               alt.Tooltip('current_job_years'),
               alt.Tooltip('risk_flag'),
               alt.Tooltip('age')
              ]
).interactive()

In [124]:
pexp = loans_df[loans_df["experience"] < 5]
pexp.sample(5000, replace=True).shape

(5000, 13)

In [125]:
#Se seleccionan personas con menos de 5 años de experiencia laboral, y en la matriz se ve que la variable de la experiencia se tiene muy en cuenta por la entidad financiera
alt.Chart(pexp.sample(5000)).mark_point().encode(
    alt.X('income'),
    alt.Y('profession'),
    #alt.Size('US_Gross'),
    alt.Color('risk_flag'),
    alt.OpacityValue(0.7),
    tooltip = [alt.Tooltip('marital_status'),
               alt.Tooltip('current_job_years'),
               alt.Tooltip('risk_flag'),
               alt.Tooltip('age')
              ]
).interactive()