# Evaluacion Crediticia Preliminar con Perceptron
### Estructura de Datos y Algoritmos (T12A)

### Integrantes

* Castañeda De La Cruz, Edgar Daniel
* Jairo Villacorta

## Presentación

El presente documento es un informe tecnico de la implementacion de un software para ser utilizado como auxiliar en
la toma de deciciones para el area de *Riesgo Crediticio* de la empresa **CREDITOS E INVERSIONES LIMA E.I.R.L.**, 
registrado en sunat con numero de RUC **20407942800** esta pyme cuenta con una gran demora al momento de realizar los calculos de riesgos crediticios (entre 2 y 3 semanas), todo el trabajo es realizado manualmente y se basa principalmente en numerosos datos historicos de prestamos ya evaluados.

## Objetivos del Trabajo

* Minimizar drasticamente el tiempo de respuesta de evaluación crediticia.
* Desarrollar la solucion personalizada en base a su data historica.
* Nuestra solucion debe considerar que los datos historicos siempre estan en constante actualizacion.
* Asegurar la mantenibilidad del software a futuro.

## Descripción de la Empresa

### Organigrama
![organigrama](https://xmindshare.s3.amazonaws.com/preview/microfinance-organizational-chart-cmfnc-1335362344947.jpg)


### Proceso Actual de Evaluación

Antes de desembolsar un préstamo, la entidad siempre realizan una evaluación crediticia que dependerá de cada sucursal, pero todas siempre revisan que el solicitante no tenga deudas morosas en el sistema financiero, historial de pagos, y su comportamiento crediticio.

1. Si es un cliente que cumple con sus compromisos de pago en fecha. 
2. Cuál es la actividad económica (sector) a que se dedica y la antigüedad que tiene su negocio. 
3. Se tomará en cuenta su capacidad de pago, que es la cantidad de deuda que puede manejar de acuerdo a sus ingresos, los gastos del negocio y sus gastos personales (incluyendo las personas que dependan de él). 
4. En algunos casos se tendrá en cuenta si dispone de capital adicional, si tiene cuentas de ahorro o alguna propiedad que pueda funcionar como garantía del préstamo. 



## Descripcion de la Solución

Desarrollaremos un algoritmo capaz de aprender los patrones de datos recogidos en el archivo historico (previamente clasificado) de la empresa, con este aprendizaje sera posible responder con un Si o No a la pregunta *¿Existe un alto riesgo de que no pueda cumplir con el prestamo?* para lo cual modelaremos una neurona básica (perceptron) con funcion de activación binaria la cual describiremos a continuación:

### Perceptron
Algunas ideas simples de que es este algoritmo:

 * Primer modelo de red neuronal artificial desarrollado por Rosemblat en 1958. Consta de un numero arbitrario de capas.
 * Es un modelo unidireccional, compuesto por dos capas de neuronas, una sensorial o de entrada y otra de salida. La operación de una red de este tipo con "n" neuronas de entrada (Unidades de Procesamiento (U.P) y "m" de salida y su modo de entrenamiento es de tipo supervisado.
 * Determinar los pesos Sinápticos para que el dispositivo represente la relación entrada-salida lo mas fidedigna posible. La regla de aprendizaje permite corregir los pesos sinápticos para que alcancen los valore deseado, partiendo de un conjunto de pesos inicializados aleatoriamente


## Fases de Implementación

### F. Configuracion

Definicion de Hiperparametros y Carga de Datos en Memoria.

#### HIPERPARAMETROS

In [11]:
@eta = 0.00001 # TASA DE CONVERGENCIA (SUAVIZADO) 
@epochs = 100

100

#### CARGA DE DATOS A MEMORIA EN LISTA DE AMBITO GLOBAL @dataset

In [12]:
require 'csv'

@dataset = []

def cargar_data(file)
  # OBTENER CANTIDAD DE INPUTS
  i = 0
  
  CSV.foreach("#{file}.csv", :headers => true, converters: :numeric) do |row|
    @dataset[i] = row.fields
    i += 1
  end
  @ins = @dataset[i-1].size # CANTIDAD DE INPUTS
end

cargar_data('data')

8

#### GENERAR LISTA DE PESOS ALEATORIOS POR CADA INPUT (COLUMNA DE DATASET)

In [13]:
@w = []

i = 0
while i < @ins 
  @w[i] = rand(0..(@ins-1))/10.00
  i += 1
end

@w


[0.4, 0.0, 0.7, 0.6, 0.6, 0.1, 0.3, 0.2]

#### DEFINIR LA FUNCION DE ACTIVACION TIPO sigmoidal binaria 

In [14]:
def sigmoidal(inputs)
  i = 0
  weighted_average = 0
  inputs = [1] + inputs
  # OBTENER SUMA DEL PRODUCTO DE LOS PESOS
  while i < @ins
    wn = @w[i]
    xn = inputs[i]
    weighted_average += wn*xn
    i += 1
  end
  return weighted_average
end

def predict(inputs)
  weighted_average = sigmoidal(inputs)
  if weighted_average > 0
    return 1  
  else
    return 0
  end
end

:predict

#### DEFINIR FUNCION DE ENTRENAMIENTO

In [15]:
def train(inputs, ex_output)
  output = predict(inputs)
  inputs = [1] + inputs
  error = ex_output - output
  if error != 0
      # SI EXISTE EL ERROR REAJUSTAR LOS PESOS
      i = 0
      while i < @ins
        wn = @w[i]
        xn = inputs[i]
        @w[i] = wn + (@eta*error*xn)
        i += 1
      end
  end
  return error
end              

:train

### F. Entrenamiento

In [16]:
weights = [] # Lista con los pesos
errors = []  # Lista con los errores

data_x = []
data_y = []
i = 0
while i <= @epochs
  # ENTRENAREMOS VARIAS VECES SOBRE EL MISMO DATASET
  # PARA QUE LOS PESOS CONVERGAN
  sum_errors = 0
  @dataset.each_with_index do | person, index |
    # OBTENER EL ULTIMO ELEMENTO DE LA LISTA
    output = person[-1]
    inp = person.take person.size - 1
    weights.push(@w)
    err = train(inp, output)
    errors.push(err)
    sum_errors += err
  end
  # GUARDAR DATOS PARA LA REPRESENTACION
  data_y.push(@ins - sum_errors.round(2))
  data_x.push(i)
  i += 1
end


#### REPRESENTACION DE LA PRECICION EN CADA ITERACION

In [17]:
require 'nyaplot'

plot = Nyaplot::Plot.new
line_pres = plot.add(:line, data_x, data_y)
line_pres.color('#ff2680')

plot.x_label("Iteraciones")
plot.y_label("Errores")
plot.show

#### REPRESENTACION DE LA DISTRIBUCION DEL PATRON

In [18]:
data_x = [[], []]
data_y = [[], []]

@dataset.each_with_index do | person, index |
  # OBTENER EL ULTIMO ELEMENTO DE LA LISTA
  tag = person[-1]
  inp = person.take person.size - 1
  data_x[tag].push(sigmoidal(inp))
  data_y[tag].push(index)
end

plot = Nyaplot::Plot.new
line_pres = plot.add(:scatter, data_x[0], data_y[0])
line_pres.color('#ff2680')

line_pres = plot.add(:scatter, data_x[1], data_y[1])
line_pres.color('#15db29')

plot.show

## F. De Pruebas y Producción

### Cotización #1
Cliente: EMPRESA TURISTICA SOL Y MAR E.I.R.L. | *RUC: 20140917690*

#### Evaluación
Cliente percibe un ingreso fijo mensual de **S/. 2100.00**, ademas de justificar otros ingresos por facturas de servicio por **S/. 1600.00** Aprox, tiene con nosotros **15 Letras** Pagadas, el importe de su ultima letra cobrada fue de **S/. 110.00**, Edad del cliente al solicitar nuevo prestamo es de **36 años**. Pertenece al **Sector 7** (PYMES De Servicios), Antiguedad del cliente **7 meses**.


In [19]:
ingreso_mensual = 2100
otros_ingresos = 1600
facturas = 15
importe_ultima_fact = 110
edad = 36
meses_contrato = 7
sector = 7

resp = predict([
  ingreso_mensual,
  otros_ingresos,
  facturas,
  importe_ultima_fact,
  edad,
  meses_contrato,
  sector
])

if resp == 1
  print "Asignar Prestamo\n"
else
  print "NO Asignar Prestamo\n"
end


Asignar Prestamo


### Cotización #2
Cliente: SERVICIOS GENERALES DE ALQUILER A & J E.I.R.L. | *RUC: 20529360712*

#### Evaluación
Cliente percibe un ingreso fijo mensual de **S/. 1350.00**, ademas de justificar otros ingresos por facturas de servicio por **S/. 360.00** Aprox, tiene con nosotros **10 Letras** Pagadas, el importe de su ultima letra cobrada fue de **S/. 150.00**, Edad del cliente al solicitar nuevo prestamo es de **33 años**. Pertenece al **Sector 2** (PYMES Alquiler y Arrendamiento), Antiguedad del cliente **23 meses**.


In [20]:
ingreso_mensual = 1350
otros_ingresos = 360
facturas = 10
importe_ultima_fact = 150
edad = 33
meses_contrato = 23
sector = 2


resp = predict([
  ingreso_mensual,
  otros_ingresos,
  facturas,
  importe_ultima_fact,
  edad,
  meses_contrato,
  sector
])

if resp == 1
  print "Asignar Prestamo\n"
else
  print "NO Asignar Prestamo\n"
end

NO Asignar Prestamo


## Conclusiones y Recomendaciones

Esta implementacion de la neurona tiene la capacidad de seguir aprendiendo con nuevos datos, pero tiene un limite en la curva de aprendizaje, por lo cual se recomienda mantener la informacion balanceada, y eliminar los datos mas antiguos y de uso poco frecuente, actualizar la trama de informacion antes de los dias de mayor actividad comercial.

## Referencias y bibliografía utilizada.

*Clever Algorithms: Nature-Inspired Programming Recipes | 
By Jason Brownlee PhD*