In [126]:
import os
import json
from shapely.geometry import Polygon
from typing import List, Dict

In [127]:
def calcular_iou(poligono1: Polygon, poligono2: Polygon, ) -> float:
    interseccion = poligono1.intersection(poligono2).area
    union = poligono1.union(poligono2).area
    return interseccion / union

def change_label(shapes: List[Dict], label_points: Polygon, label_to_change='dog', iou_threshold=0.5) -> List[Dict]:
    # Convertir puntos a polígonos de Shapely
    poligonos = [Polygon(shape['points']) for shape in shapes]
    iou_list = []
    for p in (poligonos):
        iou_list.append(calcular_iou(p, Polygon(label_points)))
    
    if iou_list:
        max_iou_index = iou_list.index(max(iou_list))
        if shapes[max_iou_index]['label'] != label_to_change and max(iou_list) > iou_threshold:
            shapes[max_iou_index]['label'] = label_to_change
            print(f"{shapes[max_iou_index]['label']} changed to {label_to_change} with {max(iou_list)}")

        return shapes[max_iou_index]['points']

In [128]:
# Procesar los ficheros json del directorio que empieza por starts_with
def process_json_files_in_directory(directory, start_idx, count=50):
    
    # El poligono que quiere corregir su label, coge a partir del primer json, actualiza en cada iteracion al otro label que tiene mayor iou
    points = None
    # Recorrer los ficheros
    for i in range(start_idx, start_idx+count+1):
      file_name = f'4_{i:06d}.json'
      file_path = os.path.join(directory, file_name)
      
      # Abrir el fichero y cargar los datos
      print('processing: ', file_path)
      with open(file_path, 'r', encoding='utf-8') as json_file:
        data = json.load(json_file)
        # Primera vez entrar al bucle, encontrar el poligono que quiere procesar por label
        if not points:
          try:  
            points = [shape for shape in data['shapes'] if shape['label'] == 'dog'][0]['points']
          except IndexError as e:
            print(e)
        # Si tiene ya un punto asignado, y los datos están en el atributo data
        else:              
          # Cambar el label que tiene mayor iou y devolver el poligono nuevo del label que ha cambiado
          update_points = change_label(data['shapes'], points, iou_threshold = 0.25)
          if update_points:
            points = update_points

      # Guardar el contenido modificado de nuevo en el archivo JSON
      with open(file_path, 'w', encoding='utf-8') as json_file:
        json.dump(data, json_file, ensure_ascii=False, indent=4)

In [131]:
directory = './Septiembre/processing'

process_json_files_in_directory(directory, start_idx=430)

processing:  ./Septiembre/processing\4_000430.json
processing:  ./Septiembre/processing\4_000431.json
processing:  ./Septiembre/processing\4_000432.json
processing:  ./Septiembre/processing\4_000433.json
processing:  ./Septiembre/processing\4_000434.json
processing:  ./Septiembre/processing\4_000435.json
processing:  ./Septiembre/processing\4_000436.json
processing:  ./Septiembre/processing\4_000437.json
processing:  ./Septiembre/processing\4_000438.json
processing:  ./Septiembre/processing\4_000439.json
processing:  ./Septiembre/processing\4_000440.json
processing:  ./Septiembre/processing\4_000441.json
processing:  ./Septiembre/processing\4_000442.json
processing:  ./Septiembre/processing\4_000443.json
processing:  ./Septiembre/processing\4_000444.json
processing:  ./Septiembre/processing\4_000445.json
processing:  ./Septiembre/processing\4_000446.json
processing:  ./Septiembre/processing\4_000447.json
processing:  ./Septiembre/processing\4_000448.json
processing:  ./Septiembre/proce