In [2]:
from docxtpl import DocxTemplate, InlineImage
from docx.shared import Cm
import csv
from PIL import Image
from io import BytesIO


#extraer los datos de las tablas
def extract_patient_info(doc)->dict:
    '''
    Toma un archivo docx producido por un dispositivo vinno.
    Los datos del paciente son la primera tabla, la recorre y extrar el texto
    lo guarda en un diccionario
    '''
    data = {}
    mot={}
    #itero sobre las tablas del documento
    for index_table,table in enumerate(doc.tables):
        #tabla 1 es la que contiene estos datos
        if index_table==1:
            for row_index, row in enumerate(table.rows):
                if row_index>0:
                    for cell in row.cells:
                        if cell.text.lower().strip not in data:  
                            key=cell.text.split(':')[0].strip()
                            value=cell.text.split(':')[1].strip()
                            data[key]=value            
    return data

def extract_patient_measurements(path)-> dict:
    '''
    toma el path del docx, lo cambia a un path terminado en .csv
    Extrae las mediciones del archivo csv del directorio de un paciente, generado por un dispositivo vinno
    '''
    #convierto el path en csv
    p=(str(path.with_suffix('.csv')).replace('Report.V3','Worksheet'))        
    data={}
    #genero un diccionario con el csv
    
    with open(p,mode='r') as file:
        csv_reader = csv.DictReader(file)
        
        #genero el limite de la tabla de mediciones
        limite=next((int(index) for index,row in enumerate(csv_reader) if 'Lucho Card' in row.values()),None)
        #seteo el iterador en 0
        file.seek(0)
        
        
        try:
            #extraigo los datos
            for index,row in enumerate(csv_reader):
                #genero el key con el primer valor de la row para el diccionario
                
                key=row.get('ï»¿Name','').strip().replace("'",'')
                if not key:
                    continue

                #chequeo si hay dos valores para cada medicion y si lo hay lo incorporo
                #los valores no numericos son unidades y los voy a tener que sacar manualmente despues
                if (
                    '2' in row 
                    and row['2'] is not None
                    and row['2']!='' 
                    and row['2'].replace('-','').replace('.','').isnumeric()

                ):
                    value=[row['1'],row['2']]

                else:
                    value=row['1']
                #agrego los datos bi dimensionales al diccionario
                data[key]=value
                #cheque
               # if 'Carotid'not in str(path)
                #lucho card marca el inicio de los calculo, asi que con ese tomo el index
                #si el indice es mayor al limite estamos en la segunda tabla. siempre sigue un patron donde el ante penultivo
                #elemento es el key que requiero y el valor esta en unir
                if limite is not None and index>limite+1:
                    #controlo el len de keys y v para modificar que variable sera key
                    if len(row.keys())==7:
                        k=-4
                        v=k+1
                    elif len(row.keys())==6:
                        k=-3
                        v=k+1
                    elif len(row.keys())==5:
                        k=-2
                        v=k+1
                    if row[list(row.keys())[k]] is not None:
                        key_2=row[list(row.keys())[k]].strip().replace("'",'')
                        value_2=row[list(row.keys())[v]]

                        #chequeo que valores 2 sea lista para no pner simbolos que compliquen la renderizacion
                        if isinstance(value_2,list):
                            data[key_2]=value_2[0]
                        else: data[key_2]=value_2
        except (IndexError, AttributeError) as e:
            # Log or handle specific exceptions if needed
            print(f"Error: {e}, no existe la tabla")    
        
        return data
    

def image_extractor(doc, template,tipo,image_width=Cm(8), image_height=Cm(5.36))->dict:
    '''
    extrae las imagenes del reporte docx del dispositivo vinno y devuelve un diccionario con objetos inlineimage
    requiere el doc: documento a extraer, template: template donde se renderizaran
    Se establecen medidas habituales de 5.36x8, excepto para el mapa polar del stress que es 8.22 x 16.23 y 6.39 x 16.23
    
    
    '''
    image_dict={}
    #extraer imagenes
    for rel in doc.part.rels:
        rel_obj = doc.part.rels[rel]
        if 'image' in rel_obj.reltype:
            image_data = rel_obj.target_part.blob
            image=Image.open(BytesIO(image_data))
            target= rel_obj.target_ref.split('.')[0].replace(r'media/','')
            #si el tipo de template es stres las primeras dos imagenes tiene un tamano distinto del resto
            
            if tipo=='stress' and int(target.replace('image','')) in [1,2]:
    
                if target.replace('image','')=='1':
                    image_dict[target]=InlineImage(template,
                                          BytesIO(image_data),
                                          width=Cm(16.23), height=Cm(8.22)
                                         )
                    
                else:
                        image_dict[target] = InlineImage(template,
                                          BytesIO(image_data),
                                          width=Cm(16.23), height=Cm(6.39)
                                         )
            else:          
                #default tamano de imagenes
                image_dict[target] = InlineImage(template,
                                                 BytesIO(image_data),
                                                 width=image_width,
                                                 height=image_height,

                                                )

    
    key=list(image_dict.keys())
    key = sorted(key, key=lambda image_name: int(image_name.replace('image', '')))
    image_dict={i: image_dict[i] for i in key}
    image_dict={'image':[{'key':k,'image':v} for k,v in image_dict.items()]}
    
    
    return image_dict

def mot_extractor(doc)->dict:
    
    '''
    Extrae las puntaciones y los nombres de los segmentos en los score de motilidad del ecostress
    '''
    table=doc.tables[2].rows[1].cells[0].tables[0]
    mot={}
    for index_r, row in enumerate(table.rows):
        #la fila 1 contiene la primera info,la ultima info en la 17 (apex)
        if 1 <= index_r <= 17:
            key = None
            values = []
            for index_c, cell in enumerate(row.cells):
                #las primeras cuatro celdas son segment ID
                #la 5 celda es el nombre del segmento
                #la 6 es baseline, 7 peak, 8 recovery 
                if index_c == 5:
                    key = cell.text.lower().replace(' ', '_')
                if 5 < index_c <= 8 and key:
                    values.append(cell.text)

            if key and values:  # Store the key-value pair only if both key and values exist
                mot[key] = values
                contex = {'mot': [{'key': k, 'motilidad': v} for k, v in mot.items()]}                                             
                                                                   
    return contex                                                              
