Primera versión con funciones:

In [1]:
# Seteos iniciales:

ruta_aux = 'C:\\modelos\\Auxiliares\\'

ruta_stock = 'C:\\modelos\\Bases 202010-202109\\Stocks\\Stock Neuquen\\'
ruta_consumo = 'C:\\modelos\\Bases 202010-202109\\Consumos\\Consumo Neuquen\\'

ruta_int = 'C:\\modelos\\Internaciones\\50.1 Tipos de internaciones.xlsx' # tipos de internaciones
ruta_diag = 'C:\\modelos\Diagnosticos\\Diagnosticos 202010-202109.csv'

medicamentos_especiales = ruta_aux + 'Aux_Prestaciones_especiales_med.xlsx'
cobertura_medicamentos = ruta_aux + 'Aux_CobertMedicamentosPlan.xlsx'

archivo_exportacion = 'C:\\modelos\\Exportaciones\\Consumo_Neuquen.csv'
resultado_exportacion = 'C:\\modelos\\Exportaciones\\Reporte_Neuquen.csv'

In [2]:
# Librerías usadas:
import pandas as pd
import numpy as np
import os
from datetime import datetime

In [3]:
# Leer todos los xslx de una carpeta y resumirlo en un df:

def leer_xlsx(ruta):
    print("Inicio del proceso: " + datetime.now().strftime('%H:%M:%S'))
    contenido = os.listdir(ruta)

    

    # Dataframe con el stock:
    df = pd.DataFrame()

    archivos = []
    for fichero in contenido:
        if os.path.isfile(os.path.join(ruta, fichero)) and fichero.endswith('.xlsx'):
            df_temp = pd.read_excel(ruta+fichero)
            df = pd.concat([df, df_temp], axis=0)
            print("Se cargó el archivo: ", fichero, "a las: " + datetime.now().strftime('%H:%M:%S'))
    
    df_temp = []
    print("Fin de la carga de archivos")
    return df

In [4]:
# Renombrar columnas de un df:

def renombrar_columnas(df):
    df.rename( columns = { 'Periodo ID': 'Periodo',
                           'Persona ID': 'Persona',
                           'Persona Fecha Nacimiento': 'Fecha_nac',
                           'Discapacitado ID': 'Discapacidad',
                           'Marca Persona con Diabetes DESC': 'Diabetes',
                           'Marca Persona con Hepatitis DESC': 'Hepatitis',
                           'Marca Persona con PMI DESC': 'PMI',
                           'Marca Persona con Tratamiento Cronico DESC': 'Cronico',
                           'Marca Persona con Tratamiento Oncológico DESC':  'Oncologico',
                           'Sexo ID': 'Sexo',
                           'Plan Sin Segmento ID': 'Plan',
                           'Posicion Asociado DESC': 'Posicion Asociado',
                           'Zona de Promocion DESC': 'Zona de Promocion',
                           'Segmento Agrupado DESC': 'Segmento',
                           'Plan Agrupado Sin Segmento DESC': 'Plan Agrupado',
                           'Stock Asociados Salud': 'Stock',
                           'Edad Periodo ID': 'Edad',
                           'ACE Stock Asociados Salud': 'ACE', 
                           'Consumos Costo con Subsidios SSS': 'Consumo3',
                           'Recaudacion Costo con Otros Subsidios': 'Recaudacion3',
                           'Precio Sugerido Medicamento': "Precio_sug",
                           'Periodo Prestacion ID':'Periodo_Prest',
                           'Provision Acreedor DESC':"Prov_acr_de",
                           'Porcentaje Cobertura Medicamento ID': "Cobertura_DW",
                           'Prestacion ID': 'Prestacion',
                           'Consumos Costo con Otros Subsidios': 'Consumo',
                           'Cantidad Practicas Pagadas': 'Cantidad',
                           'Plan Agrupado Con Segmento DESC':'Plan Agrupado'
                           }, inplace=True)

In [5]:
# La siguiente función genera las columnas: Cantidad, Consumo y Prestaciones distintas
# dado un dataframe de entrada.
# Finalmente, como se genera "multi-index" se cambia el nombre de las columnas para que queden consolidados

def td_consumo(df, columna, segmentacion, metricas):
    
    # Genero la td
    td = pd.pivot_table(df, 
                        index = segmentacion, 
                        columns = columna, 
                        aggfunc = metricas, 
                        fill_value = 0)
    
    # Cambio los nombres de las columnas
    col_names = []
    for i in td.columns:
        col_names.append((i[0] + " " + i[2])) # se debe ver en funcion del multiindex
    
    td.columns = col_names
    
    # Eliminamos las columnas "no considerar"
    col_drop = td.columns.str.contains('no considerar', case=False)
    td = td.drop(td.columns[col_drop],1)
    
    return td

## Levantar los archivos de consumos

In [6]:
# Generamos dataframe de consumos:
dfc = leer_xlsx(ruta = ruta_consumo)

Inicio del proceso: 07:22:11
Se cargó el archivo:  10.1 Consumos para modelo (per prestac) Neuquen 202010-202101.xlsx a las: 07:24:09
Se cargó el archivo:  10.1 Consumos para modelo (per prestac) Neuquen 202102-202105.xlsx a las: 07:26:48
Se cargó el archivo:  10.1 Consumos para modelo (per prestac) Neuquen 202106-202109.xlsx a las: 07:29:36
Fin de la carga de archivos


In [7]:
# renombramos las columnas:
renombrar_columnas(df = dfc)

## Agregamos marca PMO

In [8]:
# CREAMOS LA COLUMNA: "Marca PMO"

# Levanto el excel con marca de prestaciones pmo
dfpmo = pd.read_excel(ruta_aux + 'Aux_pmo.xlsx')


# Quito los espacios a las prestaciones:
dfc["Prest_sin_esp"] = dfc.Prestacion.str.strip()


# Unimos la marca al dfc
dfc = pd.merge( left = dfc, right = dfpmo, left_on='Prest_sin_esp', 
               right_on='Prest sin espacios', how = "left")

# Libero memoria:
dfpmo = []


# Prestaciones detectadas como faltantes:
print('Las prestaciones que no se pudieron catalogar fueron:')
print(dfc[dfc['Marca PMO'].isna()]["Prestacion"].unique())

# Reemplazamos los nan de marca pmo por "NO PMO"
dfc['Marca PMO'] = dfc['Marca PMO'].replace(np.nan,"NO PMO")

Las prestaciones que no se pudieron catalogar fueron:
['NS100     ' 'NS0401050 ' 'NS0401080 ' 'NS0401120 ' 'NS0405710 '
 'NS130103  ' '00340209  ' '00420101  ']


## Agregamos Tipo Internación

In [9]:
# CREAMOS LA COLUMNA: "Tipo Int. ID"

# Levanto las internaciones históricas para cruzar:
dfint = pd.read_excel(ruta_int)


# Agregamos info a dfc
dfc = pd.merge( left = dfc, right = dfint[['Paciente ID','Orden Int. ID','Tipo Int. ID']], 
               right_on=['Paciente ID','Orden Int. ID'], 
               left_on=['Persona','Orden Relacionada ID'], how = "left")

# Libero memoria:
dfint = []

# Reemplazamos los falta dato por "otras Int"
dfc['Tipo Int. ID'] = dfc['Tipo Int. ID'].replace(np.nan,"Otras Int")


# Armado de la columna calculada:
condiciones_dfint = [
    (dfc['Origen Prestacion ID'] == 'I')]

# Lista de resultados en función de las selecciones
valores_dfint = [dfc['Tipo Int. ID']]   

# Generación de la columna calculada
dfc['Tipo Int. ID'] = np.select(condiciones_dfint, valores_dfint, default = 'No Considerar')

## Apertura Total

In [10]:
condiciones2 = [
    (dfc['Origen Facturacion ID'] == 'A') ,
    (dfc['Origen Facturacion ID'] == 'C') ,
    (dfc['Nomenclador ID'] == 'ME') ,
    (dfc['Nomenclador ID'] == 'M1') ,
    (dfc['Origen Prestacion ID'] == 'I')]

# Lista de resultados en función de las selecciones
valores_condic2 = ['Naj', 'NC', 'MEd', 'MEd', 'Internacion sin A,C,Med']     

# Generación de la columna calculada
dfc['Apertura Total'] = np.select(condiciones2, valores_condic2, default = 'Ambulatorio sin A,C,Med')

# Apertura Amb por Rubros

In [11]:
# Creamos la columna: Amb por Rubros


# Apertura para consumo: Agrupador consumos 3

condiciones3 = [
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'A'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'I'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'C'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'D'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'E'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'F'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'G'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'N'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'M'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'J'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'R'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'S'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'T'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'U'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'V'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'W'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Rubro Indicadores Consumo ID'] == 'X'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Nomenclador ID'] == 'ME'),
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Nomenclador ID'] == 'M1'),

    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Nomenclador ID'] == 'NP'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Nomenclador ID'] == 'DI'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Nomenclador ID'] == 'NC'),
    
    (dfc['Origen Prestacion ID'] == 'A') & (dfc['Nomenclador ID'] == 'NA'),
    
    (dfc['Origen Prestacion ID'] == 'A') ]

# Lista de resultados en función de las selecciones
valores_condic3 = ['Consulta', 'Laboratorio', 'Imagenes', 'Imagenes', 'Imagenes', 
                  'Imagenes', 'Imagenes', 'Fisiokinesio', 'Salud Mental', 
                  'Odontologia', 'Odontologia', 'Odontologia', 'Odontologia', 
                   'Odontologia', 'Odontologia', 'Odontologia', 'Odontologia',
                   'Amb ME','Amb ME','Amb NP','Amb DI', 'Amb NC',
                   'Amb NA','Resto Amb']   

# Generación de la columna calculada
dfc['Amb por Rubros'] = np.select(condiciones3, valores_condic3, default = 'No Considerar')


## Apertura Medicamentos por Origen Prestacion

In [12]:
# Apertura para consumo: Medicamentos por Origen

condiciones4 = [
    
    # Condiciones para marcar medicamentos en internacion:
    (dfc['Origen Prestacion ID'] == 'I') & (dfc['Nomenclador ID'] == 'ME'),
    (dfc['Origen Prestacion ID'] == 'I') & (dfc['Nomenclador ID'] == 'M1'),
    
    # Condiciones para marcar medicamentos en amb -> no se filtra origen (por defecto mandar a AMB)
    (dfc['Nomenclador ID'] == 'ME'),
    (dfc['Nomenclador ID'] == 'M1') ]

# Lista de resultados en función de las selecciones
valores_condic4 = ['Med. Int', 'Med. Int', 'Med. Amb', 'Med. Amb']     

# Generación de la columna calculada
dfc['Medicamentos por Origen'] = np.select(condiciones4, valores_condic4, default = 'No Considerar')

## Medicamentos por Vía

In [13]:
# Apertura para consumo: Medicamentos por via

condiciones5 = [
    
    # Condiciones para marcar medicamentos en internacion:
    (dfc['Provision Acreedor ID'] == 6) & (dfc['Nomenclador ID'] == 'ME'),
    (dfc['Provision Acreedor ID'] == 6) & (dfc['Nomenclador ID'] == 'M1'),

    (dfc['Provision Acreedor ID'] == 66) & (dfc['Nomenclador ID'] == 'ME'),
    (dfc['Provision Acreedor ID'] == 66) & (dfc['Nomenclador ID'] == 'M1'),
    
    (dfc['Nomenclador ID'] == 'ME'),
    (dfc['Nomenclador ID'] == 'M1') ]

# Lista de resultados en función de las selecciones
valores_condic5 = ['Farmacia', 'Farmacia', 'Provision', 'Provision', 'Otras vias', 'Otras vias']     

# Generación de la columna calculada
dfc['Medicamentos por Via'] = np.select(condiciones5, valores_condic5, default = 'No Considerar')

## Medicamentos por Cobertura

In [14]:
# Creamos la columna adicional: medicamentos por cobertura:

dfmed = pd.read_excel(medicamentos_especiales)


# Cruzamos con el dfc:
dfc = pd.merge( left = dfc, right = dfmed[["Prestacion","Tipo_med"]], 
               left_on='Prestacion', right_on='Prestacion', how = "left")

# Libero memoria:
dfmed = []


# Cálculos auxiliares para definir % cobertura:
# Creo el cálculo auxiliar con *10 para quedarnos con la decena de la cobertura
dfc['Cob_prec_sug'] = (dfc.Consumo / dfc.Precio_sug)*10

# Reemplazo valores +inf y -inf por 0
dfc['Cob_prec_sug'] = dfc['Cob_prec_sug'].replace([np.inf, -np.inf], 0)

# Redondeo a 0 y multiplico por 10 para quedarme con la decena
dfc['Cob_prec_sug'] = round(dfc['Cob_prec_sug'],0)*10



# Coberturas
dfmed2 = pd.read_excel(cobertura_medicamentos)

# Cruzamos con el dfc:
dfc = pd.merge( left = dfc, right = dfmed2[["Plan","Cobertura_med_id"]], 
               left_on='Plan', right_on='Plan', how = "left")

# Libero memoria:
dfmed2 = []


# MARCA COBERTURA BASE

# Transformo las provisiones en función de su descripción
condiciones_c = [
    (dfc.Cobertura_med_id == 301) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 302) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 302) & (dfc.Cobertura_DW == 50) & (dfc.Cob_prec_sug == 50),    
    (dfc.Cobertura_med_id == 303) & (dfc.Cobertura_DW == 50) & (dfc.Cob_prec_sug == 50),
    (dfc.Cobertura_med_id == 304) & (dfc.Cobertura_DW == 60) & (dfc.Cob_prec_sug == 60),
    (dfc.Cobertura_med_id == 305) & (dfc.Cobertura_DW == 70) & (dfc.Cob_prec_sug == 70),
    (dfc.Cobertura_med_id == 306) & (dfc.Cobertura_DW == 80) & (dfc.Cob_prec_sug == 80),
    (dfc.Cobertura_med_id == 307) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 307) & (dfc.Cobertura_DW == 60) & (dfc.Cob_prec_sug == 60),
    (dfc.Cobertura_med_id == 308) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 310) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 312) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 312) & (dfc.Cobertura_DW == 60) & (dfc.Cob_prec_sug == 60),
    (dfc.Cobertura_med_id == 313) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 313) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40),
    (dfc.Cobertura_med_id == 315) & (dfc.Cobertura_DW == 40) & (dfc.Cob_prec_sug == 40) 
]

# Lista de resultados en función de las selecciones
valores_condic_c = ['Cob. Base 40%', 
                  'Cob. Base 40%',
                  'Cob. Base 50%',
                  'Cob. Base 50%',
                  'Cob. Base 60%',
                  'Cob. Base 70%',
                  'Cob. Base 80%',
                  'Cob. Base 40%',
                  'Cob. Base 60%',
                  'Cob. Base 40%',
                  'Cob. Base 40%',
                  'Cob. Base 40%',
                  'Cob. Base 60%',
                  'Cob. Base 40%',
                  'Cob. Base 40%',
                  'Cob. Base 40%']     

# Generación de la columna calculada
dfc['Marca_Cob_Base'] = np.select(condiciones_c, valores_condic_c, default = 'No Cob. Base')


# MARCA COBERTURA 100%

condiciones = [(dfc.Cobertura_DW == 100) & (dfc.Cob_prec_sug == 100)]

# Lista de resultados en función de las selecciones
valores_condic = ['Cobertura 100%']  

# Generación de la columna calculada
dfc['Marca_Cobertura_100'] = np.select(condiciones, valores_condic, default = 'No Cobertura 100%')



# Genero la agrupación final med
condiciones = [
    # Tipo medicamento es MACBI, ME6000 o M1 o R310.
    dfc.Tipo_med == 'ME6000000 y ME1600085',
    dfc.Tipo_med.isnull() == 0,
    dfc.Marca_Cob_Base != 'No Cob. Base',
    dfc.Marca_Cobertura_100 == "Cobertura 100%",
    dfc["Tipo Orden ID"] == 4,
    dfc["Nomenclador ID"] == 'ME',
    dfc["Nomenclador ID"] == 'M1']
    
# Lista de resultados en función de las selecciones
valores_condic = ["Prest Genéricas", dfc.Tipo_med, dfc.Marca_Cob_Base, dfc.Marca_Cobertura_100, "Form. 4", "Otros", "Otros"]  

# Generación de la columna calculada
dfc['Medicamentos por Cobertura'] = np.select(condiciones, valores_condic, default = 'No Considerar')

## Creamos las diferentes tds

In [15]:
# Segmentaciones y métricas comúnes:

segmentacion = (['Periodo_Prest', 'Persona'])

# dejo para probar procesamientos más rápido (debugging)
segmentacion2 = ['Periodo', 'Sexo']


# Defino las métricas a calcular
metricas = ({'Consumo':[np.sum], 'Prestacion':pd.Series.nunique,'Cantidad':[np.sum]})


metricas2 = ({  'Consumo':[np.sum,len],
                'Cantidad':np.sum })

In [16]:
td1 = pd.pivot_table(dfc, index = segmentacion, aggfunc = metricas, fill_value = 0)

# Nombres de columnas:
col_td1 = [

    "Cantidad Total",
    "Consumo Total",
    "Prest. Dist. Total"  ]

# Renombro las columnas:
td1.columns = col_td1

In [17]:
td2 = td_consumo(df = dfc, columna = "Apertura Total", segmentacion = segmentacion, metricas = metricas)
print("fin td2 -- " + datetime.now().strftime('%H:%M:%S'))

td3 = td_consumo(df = dfc, columna = "Amb por Rubros", segmentacion = segmentacion, metricas = metricas)
print("fin td3 -- " + datetime.now().strftime('%H:%M:%S'))

td4 = td_consumo(df = dfc, columna = "Medicamentos por Origen", segmentacion = segmentacion, metricas = metricas)
print("fin td4 -- " + datetime.now().strftime('%H:%M:%S'))

td5= td_consumo(df = dfc, columna = "Medicamentos por Via", segmentacion = segmentacion, metricas = metricas)
print("fin td5 -- " + datetime.now().strftime('%H:%M:%S'))

td6 = td_consumo(df = dfc, columna = "Medicamentos por Cobertura", segmentacion = segmentacion, metricas = metricas)
print("fin td6 -- " + datetime.now().strftime('%H:%M:%S'))

td7 = td_consumo(df = dfc, columna = "Tipo Int. ID", segmentacion = segmentacion, metricas = metricas)
print("fin td7 -- " + datetime.now().strftime('%H:%M:%S'))

td8 = td_consumo(df = dfc, columna = "Marca PMO", segmentacion = segmentacion, metricas = metricas)
print("fin td8 -- " + datetime.now().strftime('%H:%M:%S'))

  td = td.drop(td.columns[col_drop],1)


fin td2 -- 07:32:01
fin td3 -- 07:32:28
fin td4 -- 07:32:40
fin td5 -- 07:32:52
fin td6 -- 07:33:05
fin td7 -- 07:33:16
fin td8 -- 07:33:32


# Agrupamos las td que queremos y las exportamos como "Consumos"

In [18]:
tdt = pd.concat([td1, td2, td3, td4, td5, td6, td7, td8], axis=1)
tdt.to_csv(archivo_exportacion, encoding = 'latin1', decimal=',')

# Agrupamos el análisis con Stock

In [33]:
dfs = leer_xlsx(ruta = ruta_stock)

Inicio del proceso: 07:48:47
Se cargó el archivo:  20.1 Stock Neuquen.xlsx a las: 07:49:13
Fin de la carga de archivos


In [34]:
renombrar_columnas(dfs)

## Agregado de Auxiliares

In [35]:
# RANGO DE EDAD


# Levanto la auxiliar:
Aux_RangoEdad = pd.read_excel(ruta_aux + "Aux_RangoEdad.xlsx")
# Pego la informacion al df stock:
dfs = pd.merge(left = dfs, right = Aux_RangoEdad[["Edad","Rango_Edad"]], left_on='Edad', right_on='Edad', how = "left")
# Elimino la columna adicional -- no hay

# Elimino Aux_RangoEdad de memoria
Aux_RangoEdad = []

In [36]:
# CARTILLA BASE


# Levanto la auxiliar:
Aux_CartillaBase = pd.read_excel(ruta_aux+"Aux_CartillaBase.xlsx")
# Pego la informacion al df stock:
dfs = pd.merge(left = dfs, right = Aux_CartillaBase[["Plan","Modelo_Cartilla"]], left_on='Plan', right_on='Plan', how = "left")
# Elimino la columna adicional -- no hay

# Elimino Aux_CartillaBase de memoria
Aux_CartillaBase = []

In [37]:
# COBERTURA MED


# Levanto la auxiliar:
Aux_CobertMedicamentosPlan = pd.read_excel(ruta_aux+"Aux_CobertMedicamentosPlan.xlsx")
# Pego la informacion al df stock:
dfs = pd.merge(left = dfs, right = Aux_CobertMedicamentosPlan[["Plan","Cobertura_med_id"]], left_on='Plan', right_on='Plan', how = "left")
# Elimino la columna adicional -- no hay

# Elimino Aux_CartillaBase de memoria
Aux_CobertMedicamentosPlan = []

In [38]:
# LISTA COPAGOS

# Levanto la auxiliar:
Aux_ListaCopagos = pd.read_excel(ruta_aux+"Aux_ListaCopagos.xlsx")
# Pego la informacion al df stock:
dfs = pd.merge(left = dfs, right = Aux_ListaCopagos[["Plan","Lista_PrecioDesc"]], left_on='Plan', right_on='Plan', how = "left")
# Elimino la columna adicional -- no hay

# Elimino Aux_CartillaBase de memoria
Aux_ListaCopagos = []

In [39]:
# DIAGNOSTICOS

dfdiag = pd.read_csv(ruta_diag)

# Pego la informacion al df stock:
dfs = pd.merge(left = dfs, right = dfdiag[["Persona",'GC', 'Rango_Cons', 
              'algun_diag', 'prop_diag', 'Marca_Diagnostico']], left_on='Persona', right_on='Persona', how = "left")
# Elimino la columna adicional -- no hay

# Elimino Aux_CartillaBase de memoria
dfdiag = []


# Reemplazo valores de filas con replace:
dfs['Diabetes'] = dfs['Diabetes'].replace(['No Diabético', 'Diabético'], [0, 1])
dfs['Hepatitis'] = dfs['Hepatitis'].replace(['Sin Hepatitis', 'Con Hepatitis'], [0, 1])
dfs['PMI'] = dfs['PMI'].replace(['NO', 'SI'], [0, 1])
dfs['Cronico'] = dfs['Cronico'].replace(['NO', 'SI'], [0, 1])
dfs['Oncologico'] = dfs['Oncologico'].replace(['Sin Marca', 'Paciente Oncológico'], [0, 1])
dfs['algun_diag'] = dfs['Marca_Diagnostico'].replace(['Sin Diagnostico', 'Con Diagnostico'], [0, 1])

In [40]:
# TRANSFORMACIONES NECESARIAS

# Reemplazo los datos faltantes:
dfs["GC"].fillna(0, inplace = True)
dfs["Rango_Cons"].fillna("Muy Bajo", inplace = True)
dfs["algun_diag"].fillna(0, inplace = True)
dfs["prop_diag"].fillna(0, inplace = True)
dfs["Marca_Diagnostico"].fillna("Sin Diagnostico", inplace = True)

# Reemplazo los valores mayores a 1 por 1 para que quede marca de gc 1 o 0
#en lugar de cantidad de veces siendo GC..
# Es un reemplazar que funciona al revez: Reemplaza todos los valores que NO CUMPLEN la condición
dfs['GC'] = dfs['GC'].where(dfs['GC'] == 0 , 1)



# Agregamos los parentescos de los hijos:
# Método np.select()

condiciones = [
    (dfs['Parentesco IdParentesco'] == 3),
    (dfs['Parentesco IdParentesco'] == 4),
    (dfs['Parentesco IdParentesco'] == 5),
    (dfs['Parentesco IdParentesco'] == 6),
    (dfs['Parentesco IdParentesco'] == 7)]

# Lista de resultados en función de las selecciones
valores_condic = [1,1,1,1,1]     

# Generación de la columna calculada
dfs['Marca Hijo'] = np.select(condiciones, valores_condic, default=0) # se analizaron y surgen de consumo 3 == 0

In [41]:
# Reemplazo valores de filas con replace:
dfs['Sexo'] = dfs['Sexo'].replace(['M', 'F'], [1, 0])
dfs['Discapacidad'] = dfs['Discapacidad'].replace(['N', 'S'], [0, 1])

## Armo la tabla consolidada de stock
Por ahora se saca consolidado total

# Creamos el df final del reporte

In [42]:
# reinicio indices de los dataframes de consumo y stock procesados
tdt = tdt.reset_index()

In [43]:
# tdt es el consumo consolidado
# tds es la td de stock por persona

dff = pd.merge(left = dfs, right = tdt, 
               left_on=("Persona","Periodo"), right_on=("Persona","Periodo_Prest"), how = "left")

dff = dff.fillna(0)

In [44]:
dff.to_csv(resultado_exportacion, encoding = 'latin1', index = False, decimal=',')