## CODIGO DE EJECUCION

In [3]:
import numpy as np
import pandas as pd
import pickle

from sklearn.preprocessing import OrdinalEncoder
from sklearn.preprocessing import OneHotEncoder
from sklearn.preprocessing import Binarizer
from sklearn.preprocessing import MinMaxScaler

from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import HistGradientBoostingRegressor

from sklearn.pipeline import Pipeline
from sklearn.preprocessing import FunctionTransformer
from sklearn.compose import make_column_transformer
from sklearn.pipeline import make_pipeline


#1.CARGA DATOS
ruta_proyecto = 'C:/Users/Marius/EstructuraDirectorio/03_MACHINE_LEARNING/07_CASOS/03_RIESGOS'
nombre_fichero_datos = 'validacion.csv'
ruta_completa = ruta_proyecto + '/02_Datos/02_Validacion/' + nombre_fichero_datos
df = pd.read_csv(ruta_completa,index_col='id_cliente').drop(columns='Unnamed: 0')


#2.VARIABLES Y REGISTROS FINALES
variables_finales = ['ingresos_verificados',
                     'vivienda',
                     'finalidad',
                     'num_cuotas',
                     'antigüedad_empleo',
                     'rating',
                     'ingresos',
                     'dti',
                     'num_lineas_credito',
                     'porc_uso_revolving',
                     'principal',
                     'tipo_interes',
                     'imp_cuota',
                     'num_derogatorios'
                  ]
a_eliminar = df.loc[df.ingresos > 300000].index.values
df = df[~df.index.isin(a_eliminar)]
df = df[variables_finales]


#3.FUNCIONES DE SOPORTE
def calidad_datos(temp):
    temp['antigüedad_empleo'] = temp['antigüedad_empleo'].fillna('desconocido')
    temp.update(temp.select_dtypes('number').fillna(value = 0))
    return(temp)

def creacion_variables(df):
    temp = df.copy()
    temp.vivienda = temp.vivienda.replace(['ANY','NONE','OTHER'],'MORTGAGE')
    temp.finalidad = temp.finalidad.replace(['wedding','educational','renewable_energy'],'otros')
    return(temp)


#4.CALIDAD Y CREACION DE VARIABLES
#este codigo va recibir nuevos datos(de la persona que solicita nuevo prestamo) con todas las variables predictoras

x_pd = creacion_variables(calidad_datos(df))
x_ead = creacion_variables(calidad_datos(df))
x_lgd = creacion_variables(calidad_datos(df))


#5.CARGA PIPES DE EJECUCION
ruta_pipe_ejecucion_pd = ruta_proyecto + '/04_Modelos/pipe_ejecucion_pd.pickle'
ruta_pipe_ejecucion_ead = ruta_proyecto + '/04_Modelos/pipe_ejecucion_ead.pickle'
ruta_pipe_ejecucion_lgd = ruta_proyecto + '/04_Modelos/pipe_ejecucion_lgd.pickle'

with open(ruta_pipe_ejecucion_pd, mode='rb') as file:
    pipe_ejecucion_pd = pickle.load(file)

with open(ruta_pipe_ejecucion_ead, mode='rb') as file:
    pipe_ejecucion_ead = pickle.load(file)

with open(ruta_pipe_ejecucion_lgd, mode='rb') as file:
    pipe_ejecucion_lgd = pickle.load(file)


#6.EJECUCION
#Aqui es donde veremos el resultado de la perdida esperada EL = Expected loss
#EL = PD * EAD * PRINCIPAL * LGD
scoring_pd = pipe_ejecucion_pd.predict_proba(x_pd)[:, 1]
ead = pipe_ejecucion_ead.predict(x_ead)
lgd = pipe_ejecucion_lgd.predict(x_lgd)


#7.RESULTADO
principal = x_pd.principal
EL = pd.DataFrame({'principal':principal,
                   'pd':scoring_pd,
                   'ead':ead,
                   'lgd':lgd                   
                   })
EL['perdida_esperada'] = round(EL.pd * EL.principal * EL.ead * EL.lgd,2)

## Resultado Final
EL (Expected Loss) nos va decir, cuanto esperablemente en funcion de las caracteristicas de esta persona que me esta solicitando el prestamo y en funcion del riesgo asociado a estas caracteristicas cuanto dinero yo voy a perder con este prestamo.
Y esta informacion es la que utilizabamos para decidir si le concediamos el prestamo o no, o para decidir si le tengo que aplicar un precio extra o comisiones adicionales, para cubrirme en ese riesgo que estoy asumiendo en esa operacion concreta con ese cliente concreto.

In [4]:
EL

Unnamed: 0_level_0,principal,pd,ead,lgd,perdida_esperada
id_cliente,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
12656022,24000.0,0.261110,0.348081,0.598851,1306.27
20748926,25000.0,0.076880,0.082286,0.195110,30.86
144984624,3000.0,0.084354,0.578071,0.679865,99.46
130565528,8500.0,0.156307,0.547120,0.618461,449.56
71856364,16000.0,0.198731,0.451903,0.745852,1071.73
...,...,...,...,...,...
91595613,12000.0,0.158646,0.471760,0.756228,679.18
48696617,16000.0,0.038899,0.052927,0.040249,1.33
36361551,35000.0,0.181965,0.355207,0.595082,1346.22
62964318,12300.0,0.089739,0.157133,0.217135,37.66


Lectura:
 Tenemos una serie de clientes con todas las variables predictoras que hemos seleccionado a todo el transcurso del proyecto y lo que nos devolveria al final seria la columna de perdida_esperada.
 
Por ejemplo el cliente 128242680 si yo le concedo un prestamo de 25k y ademas con todo el resto de variables que yo se sobre este cliente(variables finales), si yo le accepto ese prestamo, previsiblemente voy a perder 34.45 $.