In [38]:
import pandas as pd
import json
import warnings
import os
import numpy as np

warnings.filterwarnings('ignore', category = UserWarning, module = 'openpyxl')
warnings.filterwarnings('ignore', category = RuntimeWarning)


with open('RESISTENCIAS_PSEUDOMONAS.json', 'r', encoding = 'utf-8') as f:
    RESISTENCIAS_PSEUDOMONAS = json.load(f)

with open('RESISTENCIAS_ENTEROCOCCUS.json', 'r', encoding = 'utf-8') as f:
    RESISTENCIAS_ENTEROCOCCUS = json.load(f)

with open('RESISTENCIAS_KLEBSIELLA.json', 'r', encoding = 'utf-8') as f:
    RESISTENCIAS_KLEBSIELLA = json.load(f)

with open('LIMPIADOR_TOTAL.json', 'r', encoding = 'utf-8') as f:
    DICCIONARIO_LIMPIADOR_NOMENCLATURAS = json.load(f)

    LIMPIADOR_EVE = DICCIONARIO_LIMPIADOR_NOMENCLATURAS['NOMENCLATURA EVE']
    LIMPIADOR_REDUNDANTES = DICCIONARIO_LIMPIADOR_NOMENCLATURAS['REDUNDANTES']

    LIMPIADOR_GLOBAL = LIMPIADOR_EVE | LIMPIADOR_REDUNDANTES

help(warnings.filterwarnings)


    
    'action' -- one of "error", "ignore", "always", "default", "module",
                or "once"
    'module' -- a regex that the module name must match
    'append' -- if true, append to the list of filters



In [69]:
class Estadisticas:
    def __init__(self):
        pass

    def obtener_estadisticas_todos_los_meses(self, output):
        nombres_sensibilidades_ordenadas = sorted([excel for excel in os.listdir() if 'Fibrosis' in excel])
        estadisticas_acumuladas = {}
        dfs_a_guardar = []

        for nombre_archivo in nombres_sensibilidades_ordenadas:
            print(f'Leyendo {nombre_archivo}')

            estadistica_fq_archivo = self.obtener_estadistica_por_archivo(nombre_archivo)
            estadisticas_acumuladas[nombre_archivo] = estadistica_fq_archivo
            df_fq_archivo = pd.DataFrame.from_dict(estadistica_fq_archivo, orient = 'index')
            df_fq_archivo.columns = ['Cantidad']
            df_fq_archivo.index.name = nombre_archivo
            dfs_a_guardar.append((nombre_archivo, df_fq_archivo))


        df_estadisticas_acumuladas = pd.DataFrame.from_dict(estadisticas_acumuladas, orient = 'index')
        dfs_a_guardar.append(('ESTADISTICAS GLOBALES FQ', df_estadisticas_acumuladas))
        
        with pd.ExcelWriter(output) as f:
            for i in range(len(dfs_a_guardar)):
                nombre, df = dfs_a_guardar[i][0], dfs_a_guardar[i][1]
                columna = i * 3
                df.to_excel(f, startcol = columna)


    def obtener_estadistica_por_archivo(self, nombre_archivo):
        df = pd.read_excel(nombre_archivo, header = 1).dropna(how = 'all')
        #df = df.fillna('-')
        df_limpia = df.copy()
        df_limpia['MICROORGANISMO'] = df_limpia['MICROORGANISMO'].map(lambda x: LIMPIADOR_GLOBAL[x] if (LIMPIADOR_GLOBAL[x] != None) else x)
        mask_candidas_patogenos = df_limpia['MICROORGANISMO'].apply(lambda x: True if (('Candida' in x) or \
                                                                   (x == 'Streptococcus alfa hemolitico') or \
                                                                   (x == 'Staphylococcus pseudintermedius') or \
                                                                   (x == 'Staphylococcus coagulasa (-)') or \
                                                                   (x == 'Streptococcus alfa hemolitico') or \
                                                                   (x == 'Staphylococcus epidermidis') or \
                                                                   (x == 'Staphylococcus warneri') or \
                                                                   (x == 'Staphylococcus pasteuri') or \
                                                                   (x == 'Streptococcus viridans') or \
                                                                   (x == 'Staphylococcus haemolyticus') or \
                                                                   (x == 'No hubo desarrollo bacteriano a las 24 horas de incubación.')) else False)
        
        df_limpia = df_limpia[~mask_candidas_patogenos]

        estadisticas_fq = self.calcular_estadisticas(df_limpia)

        return estadisticas_fq

    def calcular_estadisticas(self, df_fq):
        estadisticas = {}

        frecuencias_microorganismos = self.calcular_microorganismos_mas_frecuentes(df_fq)
        sensibilidades_globales = self.calcular_sensibilidades_a_antibioticos(df_fq)

        estadisticas.update(frecuencias_microorganismos)


        return estadisticas.copy()

    
    def calcular_microorganismos_mas_frecuentes(self, df_fq):
        return df_fq['MICROORGANISMO'].value_counts()
    
    def calcular_sensibilidades_a_antibioticos(self, df_fq):
        sensibilidades = {}
        for farmaco in df_fq.loc[:, 'AK': 'VAN'].columns:
            filas_que_si_se_les_midio = df_fq[farmaco]
            recuento_valores = filas_que_si_se_les_midio.value_counts()
        
            total = recuento_valores.sum()

            try:
                sensibles = recuento_valores['S']
            
            except KeyError:
                sensibles = 0
            
            try:
                resistentes = recuento_valores['R']
            
            except KeyError:
                resistentes = 0
            
            try:
                intermedio = recuento_valores['I']
            except KeyError:
                intermedio = 0
            
            porcentaje_sensibles = round((sensibles / total) * 100, 1)
            # porcentaje_resistentes = round((resistentes / total) * 100, 1)
            # porcentaje_intermedios = round((intermedio / total) * 100, 1)

            # resistencias[farmaco] = (porcentaje_sensibles, porcentaje_resistentes, porcentaje_intermedios)
            sensibilidades[farmaco] = porcentaje_sensibles
            
        return sensibilidades


In [70]:
estadisticas = Estadisticas()
resultados = estadisticas.obtener_estadisticas_todos_los_meses('ESTADISTICAS_FQ_3.xlsx')

Leyendo Fibrosis 2016.xlsx
Leyendo Fibrosis 2017.xlsx
Leyendo Fibrosis 2018.xlsx
Leyendo Fibrosis 2019.xlsx
Leyendo Fibrosis 2020.xlsx
Leyendo Fibrosis 2021.xlsx
Leyendo Fibrosis 2022.xlsx


PermissionError: [Errno 13] Permission denied: 'ESTADISTICAS_FQ_3.xlsx'