In [1]:
import abc
import pandas as pd
import os
from pandas import Series, DataFrame
from configparser import SafeConfigParser
import codecs
import ast

In [2]:
import numpy as np
from pandas import ExcelWriter

class ValidateDataFrame(object):
    __metaclass__ = abc.ABCMeta
    
    @abc.abstractmethod
    def validation(self):
        pass
    
    def exportValidation(self, exportparams):
        writer = ExcelWriter(exportparams['xlsxfile'])
        exportparams['dataframe'].to_excel(writer, index = False, sheet_name = 'validaciones')
        self.display(exportparams)
        
    def display(self, exportparams):
        print('Archivo exportado %s con %s registros' % (exportparams['xlsxfile'], len(exportparams['dataframe'])))
    
class ValidateInar(ValidateDataFrame):
    
    def __init__(self, dataframelist):
        self.inarbruto = dataframelist['inarbruto']
        self.jerarquia = dataframelist['jerarquia']
        self.comisionantes = dataframelist['comisionantes']
        self.tblempleados = dataframelist['tblempleados']
        
    def validation(self):      
        # Validación de blanks : tipodoc, vendedor, zona, tipodoc
        
        nocolsjerarquia = ['nombre_vendedor','estado_vendedor','gerencia_1','gerencia_2','canal_de_venta','zona_de_venta',
                            'supervision_kam','departamento','codigo_inar']
        nocolsm2m = ['id_empl', 'codigo_inar', 'dni', 'apellido_paterno', 'nombres', 'apellido_materno', 'fecha_ingreso', 
                    'fecha_actualizacion', 'posicion_empl', 'periodo_activacion']
        
        # Limpiando el inar bruto
        df0 = self.inarbruto[self.inarbruto['estado'] != 'DEAC']
        df0 = df0[df0['vendedor']!= 'SERVICIO_GENERAL1']      
        
        #Corrige las Ñs
        df0 = df0.replace(',|\r|"|\x91', '', regex = True)
        df0[['vendedor','razon_social']] = df0[['vendedor','razon_social']].replace('Ã','Ñ', regex = True)
              
        # Empezando con las validaciones    
        blanksdoc = df0[(df0['tipodoc'].isnull()) & (~df0['plan_tarifario'].str.contains('Prepago'))]
        blanksdoc['observacion'] = 'blanks en documento'
        
        df0 = df0[df0['tipodoc'].isin(['RUC',np.NaN])]
        
        blanksvendedor = df0[(df0['vendedor'].isnull()) | (df0['zona'].isnull())]
        blanksvendedor['observacion'] = 'blanks en vendedor o zona'
        
        vendedorsinjerarquia = df0.merge(self.jerarquia.drop_duplicates(['codigo_inar']),left_on = ['vendedor'], 
                                        right_on = ['codigo_inar'], how = 'left' )
        vendedorsinjerarquia = vendedorsinjerarquia[vendedorsinjerarquia['gerencia_2'].isnull()]   
        vendedorsinjerarquia.drop(nocolsjerarquia, inplace=True, axis=1)    
        vendedorsinjerarquia['observacion'] = 'vendedor no se encuentra en jerarquia de ventas'
        
        # Detectando planes de data con consultores de voz
        
        emplactivos = self.tblempleados[self.tblempleados['fecha_cese'] == '']
        
        puestosvoz = emplactivos[~emplactivos['posicion_empl'].
                                 str.contains('Soluciones de Negocio')]['posicion_empl'].drop_duplicates()
        puestosvoz = puestosvoz.tolist()
        
        vozm2m = df0.merge(emplactivos, left_on = ['vendedor'], right_on = ['codigo_inar'], how = 'left' )
        vozm2m = vozm2m[vozm2m['plan_tarifario'].str.contains('M2M') & vozm2m['posicion_empl'].isin(puestosvoz)]
        vozm2m.drop(nocolsm2m, inplace = True, axis = 1)
        vozm2m['observacion'] = 'consultor de voz con planes data'
        
        # Detectando empleados inactivos
        emplcesados = self.tblempleados[self.tblempleados['fecha_cese'] != '']
        inactivos = df0.merge(emplcesados, left_on = ['vendedor'], right_on = ['codigo_inar'])
        inactivos.drop(nocolsm2m, inplace = True, axis = 1)
        inactivos['observacion'] = 'consultor cesado'
        
        df = blanksdoc.append(blanksvendedor, ignore_index = True)
        df = df.append(vendedorsinjerarquia, ignore_index = True)
        df = df.append(vozm2m, ignore_index = True)
        df = df.append(inactivos, ignore_index = True)
        
        df = df [['codigo','razon_social','contrato','fec_activ','fec_desactiva','estado','telefono','modelo','tmcode',
                  'plan_tarifario','vendedor','zona','dealer','tecnologia','tipodoc','documento','falso_deac','fecha_proceso',
                  'fecha_cese','observacion']]
        
        return df
    
class ValidateMultipleData(ValidateDataFrame):
    
    def __init__(self, dataframelist):

        self.jerarquia = dataframelist['jerarquia']
        self.comisionantes = dataframelist['comisionantes']
        self.tblempleados = dataframelist['tblempleados']
        
    def validation(self):      
        
       
        tblempleados = self.tblempleados[['codigo_inar', 'fecha_cese', 'posicion_empl']]
        comisionantes = self.comisionantes[['login', 'gerencia2', 'zona', 'departamento', 'posición']]
        jerarquia = self.jerarquia[['canal_vista_negocio', 'gerencia_2', 'zona_de_venta', 'departamento', 'vendedor', 
                                    'estado_vendedor']]
        
        # Observaciones en jerarquia
        
        gerencia2 = ['CORPORACIONES','DESARROLLO NEGOCIOS PYME','GRANDES CLIENTES','SOLUCIONES DE DATOS',
                     'VD PYMES','VENTA REGIONAL EMPRESA']
        jerarquiadep = jerarquia[(jerarquia['canal_vista_negocio'] == 'EJECUTIVO ENTEL') & 
                                 (jerarquia['estado_vendedor'] == 'Activo')]
        jerarquiadep = jerarquiadep[jerarquiadep['gerencia_2'].isin(gerencia2)]
        
        emplcesados = tblempleados[(tblempleados['codigo_inar'] != '') & (tblempleados['fecha_cese'] != '')]
        
        vendedorinactivo = jerarquiadep.merge(emplcesados, left_on=['vendedor'],right_on=['codigo_inar'])
        vendedorinactivo['observacion'] = 'inactivar vendedor en jerarquia'
        vendedorinactivo.drop(['vendedor'], axis = 1, inplace =True)
             
        # Observaciones en comisionantes
        
        comisionantespos = comisionantes[comisionantes['posición'].str.contains('Consultor|Ejecutivo')]
        colscomisionantes = ['login','gerencia2','zona','departamento']
        concomisionantes = comisionantespos[colscomisionantes]
        concomisionantes['concolscom'] = concomisionantes.apply(lambda x : '|'.join(x), axis = 1)
        
        colsjerarquia = ['vendedor','gerencia_2','zona_de_venta','departamento']
        conjerarquia = jerarquiadep[colsjerarquia]      
        conjerarquia['concolsjer'] = conjerarquia.apply(lambda x : '|'.join(x), axis = 1)
            
        comparezonas = concomisionantes.merge(conjerarquia, left_on = ['login'], right_on = ['vendedor'], how = 'left')
        comparezonas = comparezonas[comparezonas['concolscom'] != comparezonas['concolsjer']]
        comparezonas['observacion'] = 'diferencias en zonas'
        comparezonas.rename(columns = {'login':'codigo_inar','departamento_x':'departamento'}, inplace = True)
        comparezonas.drop(['concolscom', 'concolsjer', 'vendedor'], axis = 1, inplace =True)
        
        # Observaciones en tblempleados
        
        tblsincodigos = jerarquiadep.merge(tblempleados, left_on = ['vendedor'], right_on = ['codigo_inar'], how = 'left')
        tblsincodigos = tblsincodigos[tblsincodigos['codigo_inar'].isnull()]
        tblsincodigos ['observacion'] = 'ingresar el codigo_inar en la tabla empleados'
        tblsincodigos['codigo_inar'] = tblsincodigos['vendedor']
        
        # Observaciones en la posición de comisionantes
        errorenpuesto = comisionantes.merge(tblempleados, left_on = ['login'], right_on = ['codigo_inar'])
        errorenpuesto = errorenpuesto[errorenpuesto['posición'] != errorenpuesto['posicion_empl']]
        errorenpuesto['observacion'] = 'actualizar el puesto en tblempleados'
            
        # Armando el df con las observaciones
        df = vendedorinactivo.append(comparezonas, ignore_index= True)
        df = df.append(tblsincodigos, ignore_index = True)
        df = df.append(errorenpuesto, ignore_index = True)
        df.drop(['canal_vista_negocio', 'estado_vendedor','posicion_empl', 'login', 'vendedor'], axis = 1, inplace =True)
        
        df = df[['codigo_inar','gerencia2','gerencia_2','zona','zona_de_venta','departamento','departamento_y','posición',
                 'fecha_cese','observacion']]

        
        #df.to_csv(testpath + month + '_otras validaciones.csv')
        return df
        # Puesto no es el correcto
        

In [3]:
import sys
import sqlite3
import pandas as pd
from pandas import Series, DataFrame

class DbGenericOperator(object):
    __metaclass__ = abc.ABCMeta
    
    @abc.abstractmethod
    def opendb(self):
        raise NotImplementedError
    
    @abc.abstractmethod
    def closedb(self):
        raise NotImplementedError

    @abc.abstractmethod
    def readtbl(self,query):
        raise NotImplementedError
    
    @abc.abstractmethod
    def writetbl(self,query):
        raise NotImplementedError      

    @abc.abstractmethod    
    def updatetbl(self):
        raise NotImplementedError
  
    @abc.abstractmethod
    def deletetbl(self,query):
        raise NotImplementedError
        
class DbSqLiteOperator(DbGenericOperator):


    def __init__(self, params):

        self.dbpath = params['dbpath']
        self.dbname = params['dbname']

    def openDb(self):
        self.conn = sqlite3.connect(self.dbpath + self.dbname, detect_types = sqlite3.PARSE_DECLTYPES)
        
    def closeDb(self):
        self.conn.close()
        
    def readTbl(self, query):
        df = pd.read_sql_query(query, self.conn)
        return df
     
    def writeTbl(self, sql, tuplas):
        cursor = self.conn.cursor()
        cursor.executemany(sql, tuplas)
        self.conn.commit()
        cursor.close()
        
    def updateTbl(self, sql, args):      
        cursor = self.conn.cursor()
        cursor.executemany(sql, args)
        self.conn.commit()
        cursor.close()
        
    def deleteTbl(self, query):
        cursor = self.conn.cursor()
        cursor.execute(query)
        self.conn.commit()

In [4]:
class DbManager(object):
    
    __metaclass__ = abc.ABCMeta
    
    @abc.abstractmethod 
    def prepare(self):
        pass
    
    @abc.abstractmethod       
    def operation(self):
        pass
  
    def display(self, paramstable):
        print('Registros de la tabla %s es %s registros ' % ((paramstable['section'], paramstable['lenght'])))
    
class LoadTbl(DbManager):
    
    def __init__(self, params):
        self.params = params
        
    def prepare(self):
        pass
    
    def operation(self):
        
        dboperator = DbSqLiteOperator(self.params)
        dboperator.openDb()
        df = dboperator.readTbl(self.params['query'])
        dboperator.closeDb()
        df = df.fillna('')
        return df

class DbDataProcess(object):
    
    def __init__(self, month):
        self.month = month
        self.parser = None
        self.section = None
        self.parameters = None
        self.dbpath = 'D:/Datos de Usuario/cleon/Documents/Capital Humano/Bases/'
        self.dbname = 'comisiones3.sqlite'
        
    def configParameters(self): # incluía parser
   

        l2 = []
        
        itemlist = ['colstoinsert', 'coldates', 'colstoupdate']
    
        for item in self.parser.options(self.section): # 
            if item in itemlist:
                l2.append(ast.literal_eval(self.parser.get(self.section,item)))      
            else:
                l2.append(self.parser.get(self.section,item))

        self.parameters = dict(zip(self.parser.options(self.section),l2))

        self.parameters['section'] = self.section
        self.parameters['dbpath'] = self.dbpath
        self.parameters['dbname'] = self.dbname
                
    
    def loadData(self, section):
        
        self.section = section
        self.configParameters()
        
        dbobj = LoadTbl(self.parameters)
        df = dbobj.operation()
        df.name = section
        
        paramstable = {'section' : self.section, 'lenght' : len(df)}
        dbobj.display(paramstable)
        
        return df
        
    def setParser(self, parser):
        self.parser = parser
        

In [5]:
from Loader import fileloader as fl

month = '201706'
testpath = 'D:/Datos de Usuario/cleon/Documents/Capital Humano/Data Fuente Comisiones/test/'
defaultpath = 'D:/Datos de Usuario/cleon/Documents/Capital Humano/Data Fuente Comisiones/xlsx/'


In [6]:
inifile = fl.ReadIniFile('C:/Anaconda3/MeScripts/Comisiones4/Config/myconfig.ini')
parser = inifile.readFile()

loader = fl.LoadFileProcess(month)
loader.setParser(parser)

In [7]:
# Importando la información

inarbruto = loader.loadFile('Inar_bruto')
jerarquia = loader.loadFile('Jerarquia')
comisionantes = loader.loadFile('Comisionantes_voz')

inidb = fl.ReadIniFile('C:/Anaconda3/MeScripts/Comisiones4/Config/mydbconfig.ini')
dbparser = inidb.readFile()

dbmanager = DbDataProcess(month)
dbmanager.setParser(dbparser)
tblempleados = dbmanager.loadData('tblEmpleados')


El tamaño de Inar_bruto es 694971 registros
El tamaño de Jerarquia es 23212 registros
El tamaño de Comisionantes_voz es 352 registros
Registros de la tabla tblEmpleados es 755 registros 


  data = self._reader.read(nrows)


In [8]:
# Armando las validaciones

valinarfl = {'inarbruto' : inarbruto, 'jerarquia' : jerarquia, 'comisionantes' : comisionantes, 'tblempleados' : tblempleados}
valinarobj = ValidateInar(valinarfl)
inarvalidation = valinarobj.validation()

#importante renombrar la columna codigo_inar en jerarquia
jerarquia.rename(columns = {'codigo_inar' : 'vendedor'}, inplace = True)

valmultipledatafl = {'jerarquia' : jerarquia, 'comisionantes' : comisionantes, 'tblempleados' : tblempleados}
valmultipledataobj = ValidateMultipleData(valmultipledatafl)
multipledatavalidation = valmultipledataobj.validation()

#****** Exportar validaciones

xlsxfile1 = testpath + month + '_validaciones en INAR.xlsx'
exportparams = {'xlsxfile' : xlsxfile1, 'dataframe' : inarvalidation}
valinarobj.exportValidation(exportparams)

xlsxfile2 = testpath + month + '_Otras validaciones.xlsx'
exportparams = {'xlsxfile' : xlsxfile2, 'dataframe' : multipledatavalidation}
valmultipledataobj.exportValidation(exportparams)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy


Archivo exportado D:/Datos de Usuario/cleon/Documents/Capital Humano/Data Fuente Comisiones/test/201706_validaciones en INAR.xlsx con 1601 registros
Archivo exportado D:/Datos de Usuario/cleon/Documents/Capital Humano/Data Fuente Comisiones/test/201706_Otras validaciones.xlsx con 83 registros


A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy


In [9]:
comisionantes.dtypes

login                        object
gerencia2                    object
zona                         object
departamento                 object
kam                          object
posición                     object
nombres                      object
dni                         float64
fecha_de_planilla    datetime64[ns]
fecha_de_ingreso     datetime64[ns]
dtype: object