In [1]:
import os
import pandas as pd
import numpy as np
import math
from datetime import datetime

In [2]:
from platform import python_version
print(python_version())

3.8.8


### Recuperando datos

In [3]:
# Reclamos
file_name = 'data/pre_processed_data.csv'
datos_preprocessed = pd.read_pickle(file_name)

# Catalogos BN
schema = {
    'Servicio BN':int,
    'Motivo BN':int,
    'Canal Incidencia SBS': str,
    'Servicio SBS': str,
    'Motivo SBS': str,
}
catalogo_bn = pd.read_csv('catalogo/catalogo_BN.csv', dtype=schema)
catalogo_bn['Servicio BN'] = catalogo_bn['Servicio BN'].astype(str)
catalogo_bn['Motivo BN'] = catalogo_bn['Motivo BN'].astype(str)

# Catalogos SBS
catalogo_sbs_motivo = pd.read_excel('catalogo/catalogo_SBS.xlsx', sheet_name='MOTIVOS')
catalogo_sbs_servicios = pd.read_excel('catalogo/catalogo_SBS.xlsx', sheet_name='SERVICIOS')
catalogo_sbs_canales = pd.read_excel('catalogo/catalogo_SBS.xlsx', sheet_name='CANALES')

# Catalogos NIVEL
catalogo_nivel_motivo = pd.read_excel('catalogo/catalogo_NIVEL.xlsx', sheet_name='MOTIVOS')
catalogo_nivel_servicios = pd.read_excel('catalogo/catalogo_NIVEL.xlsx', sheet_name='SERVICIOS')
catalogo_nivel_canales = pd.read_excel('catalogo/catalogo_NIVEL.xlsx', sheet_name='CANALES')

In [4]:
niveles = {}
niveles['servicios'] = catalogo_nivel_servicios.set_index('Cod_SBS').T.to_dict('dict')
niveles['motivos'] = catalogo_nivel_motivo.set_index('Cod_SBS').T.to_dict('dict')
niveles['canales'] = catalogo_nivel_canales.set_index('Cod_SBS').T.to_dict('dict')

In [5]:
datos_preprocessed_merged = pd.merge(
                            datos_preprocessed,
                            catalogo_bn,
                            how="left",
                            left_on=['Cod servicio', 'Cod motivo'],
                            right_on=['Servicio BN', 'Motivo BN'],
                            sort=True,
                            suffixes=("_x", "_y"),
                        )

In [6]:
def nivel(canal,servicio,motivo):
    try:
        canal = int(canal)
        return niveles['canales'][canal]['Nivel']
    except:
        pass
    try:
        servicio = int(servicio)
        return niveles['servicios'][servicio]['Nivel']
    except:
        pass
    try:
        motivo = int(motivo)
        return niveles['motivos'][motivo]['Nivel']
    except:
        pass
    return '2do'

In [7]:
datos_preprocessed_merged['Nivel'] = datos_preprocessed_merged.apply(lambda x: nivel(x['Canal Incidencia SBS'], x['Servicio SBS'], x['Motivo SBS']), axis=1)


In [8]:
datos_preprocessed_merged.head()

Unnamed: 0,Numero reclamo,Nombre,Numero documento,Cod servicio,Cod motivo,Cod ATM,ATM error,Numero cajero,Monto,Fecha operacion,...,fecha fase 7,Servicio BN,Motivo BN,Canal Incidencia SBS,Servicio SBS,Motivo SBS,Canal Incidencia,Servicio,Motivo,Nivel
0,023818-7,TORRES SENMACHE PATHY PAMELA,41114765,100,10000,,,,,19/09/2018,...,2018-10-03,100,10000,1,102,1,OFICINA,CUENTA DE AHORRO (DESTINADA A DEPÓSITO DE REMU...,"INCUMPLIMIENTO DE CLAUSULAS DE LOS CONTRATOS, ...",1er
1,002718-4016,CARLOS RIQUELME ROMAN,43471167,100,10000,,,,,15/08/2018,...,2018-09-26,100,10000,1,102,1,OFICINA,CUENTA DE AHORRO (DESTINADA A DEPÓSITO DE REMU...,"INCUMPLIMIENTO DE CLAUSULAS DE LOS CONTRATOS, ...",1er
2,002719-6276,RICARDO ARTURO RIVERA NUÑEZ,30831857,100,10000,,,,892.74,20/12/2019,...,2020-02-11,100,10000,1,102,1,OFICINA,CUENTA DE AHORRO (DESTINADA A DEPÓSITO DE REMU...,"INCUMPLIMIENTO DE CLAUSULAS DE LOS CONTRATOS, ...",1er
3,010119-356,VERAMENDI ANCASI JAVIER,9952556,100,10000,,,,8000.0,29/10/2019,...,2019-12-20,100,10000,1,102,1,OFICINA,CUENTA DE AHORRO (DESTINADA A DEPÓSITO DE REMU...,"INCUMPLIMIENTO DE CLAUSULAS DE LOS CONTRATOS, ...",1er
4,010119-354,MEDINA RAMOS JOSE LUIS,29353518,100,10000,,,,,26/08/2019,...,2019-11-12,100,10000,1,102,1,OFICINA,CUENTA DE AHORRO (DESTINADA A DEPÓSITO DE REMU...,"INCUMPLIMIENTO DE CLAUSULAS DE LOS CONTRATOS, ...",1er


In [9]:
datos_preprocessed_merged.to_pickle('data/data_merged.csv')

In [None]:
def nivel_reclamo(x,y):
    try:
        nivel = catalogo_sbs_motivo[x]['Nivel']
    except:
        try:
            nivel = catalogo_sbs_servicio[y]['Nivel']
        except:
            nivel = None
    return nivel

def tipo_reclamo(x,y):
    try:
        tipo = catalogo_sbs_motivo[x]['Tipo']
    except:
        try:
            tipo = catalogo_sbs_servicio[y]['Tipo']
        except:
            tipo = None
    return tipo

def reclamo_name_sbs_motivo(x):
    try:
        tipo = catalogo_sbs_motivo[x]['Motivo SBS']
    except:
        tipo = 'No identificado'
    return tipo

def reclamo_name_sbs_servicio(x):
    try:
        tipo = catalogo_sbs_servicio[x]['Motivo SBS']
    except:
        tipo = 'No identificado'
    return tipo

datos_preprocessed_merged['Nivel'] = datos_preprocessed_merged.apply(lambda x: nivel_reclamo(x['Cod Motivo SBS'], x['Cod Servicio SBS']), axis=1)
datos_preprocessed_merged['Tipo'] = datos_preprocessed_merged.apply(lambda x: tipo_reclamo(x['Cod Motivo SBS'], x['Cod Servicio SBS']), axis=1)
datos_preprocessed_merged['Motivo_name_SBS'] = datos_preprocessed_merged.apply(lambda x: reclamo_name_sbs_motivo(x['Cod Motivo SBS']), axis=1)
datos_preprocessed_merged['Servicio_name_SBS'] = datos_preprocessed_merged.apply(lambda x: reclamo_name_sbs_motivo(x['Cod Servicio SBS']), axis=1)

datos_preprocessed_merged['Nivel'] = datos_preprocessed_merged['Nivel'].fillna('2do').astype(str)

In [None]:
datos_preprocessed_merged.head()

### Saving data

In [None]:
datos_preprocessed_merged.to_pickle('data/pre_processed_2_sbs.csv')

## Primer nivel

In [None]:
datos_nivel_1 = datos_preprocessed_merged[datos_preprocessed_merged['Nivel']=='1er']
datos_reclamos_nivel_1 = datos_nivel_1[datos_nivel_1['Reclamo/requerim']=='RECLAMO']
datos_requerimiento_nivel_1 = datos_nivel_1[datos_nivel_1['Reclamo/requerim']=='REQUERIMIENTO']

In [None]:
datos_reclamos_nivel_1.to_pickle('data/pre_processed_reclamos_nivel_1.csv')  
datos_requerimiento_nivel_1.to_pickle('data/pre_processed_requerimiento_nivel_1.csv')  