In [None]:
'''
il simbolo ! in google colab permette di eseguire comandi di shell direttamente da un notebook.
Esegui il comando shell unrar per estrarre (x) tutti i file e le directory,
mantenendo la loro struttura originale, dall'archivio dataset.rar e salvali nella cartella dataset
(creandola se non esiste) nella directory di lavoro corrente.
'''
!unrar x dataset.rar dataset


UNRAR 6.11 beta 1 freeware      Copyright (c) 1993-2022 Alexander Roshal


Extracting from dataset.rar

Creating    dataset                                                   OK
Creating    dataset/groundtruth01                                     OK
Extracting  dataset/groundtruth01/unogt100.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt140.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt141.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt142.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt143.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt144.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt145.jpg                             0%  OK 
Extracting  dataset/groundtruth01/unogt146.jpg                             0%  OK 
Extracting  d

In [13]:
'''
Utilizzando il gestore di pacchetti Python pip, scarica e installa nell'ambiente Python
corrente le seguenti librerie: opencv-python-headless (per la computer vision senza GUI),
numpy (per il calcolo numerico), scikit-learn (per il machine learning), pyyaml
(per la gestione di file YAML) e ultralytics (per i modelli YOLO e altre utility di deep learning).
'''
!pip install opencv-python-headless numpy scikit-learn pyyaml ultralytics

Collecting ultralytics
  Downloading ultralytics-8.3.129-py3-none-any.whl.metadata (37 kB)
Collecting ultralytics-thop>=2.0.0 (from ultralytics)
  Downloading ultralytics_thop-2.0.14-py3-none-any.whl.metadata (9.4 kB)
Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch>=1.8.0->ultralytics)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch>=1.8.0->ultralytics)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch>=1.8.0->ultralytics)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch>=1.8.0->ultralytics)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch>=1.8.0->ultralytics)
  Downloading n

In [None]:
# il comando import importa moduli e pacchetti in Python.
'''
questo script serve a preprocessare i dati per l'addestramento di un modello YOLO (You Only Look Once)
per la rilevazione di oggetti, in questo caso per la tiroide.
'''
#Importa la libreria OpenCV (cv2), utilizzata per l'elaborazione di immagini e video.
import cv2
#Importa la libreria NumPy e le assegna l'alias 'np'. NumPy è fondamentale per il calcolo numerico e la manipolazione di array.
import numpy as np
#Importa il modulo 'os', che fornisce funzioni per interagire con il sistema operativo, come la gestione di percorsi e directory.
import os
#Importa il modulo 'glob', utilizzato per trovare tutti i nomi di percorso che corrispondono a un pattern specificato.
import glob
#Dalla libreria Scikit-learn (sklearn), importa la funzione 'train_test_split', utile per suddividere i dati in set di addestramento e validazione.
from sklearn.model_selection import train_test_split
#Importa la libreria 'yaml', utilizzata per leggere e scrivere file in formato YAML (YAML Ain't Markup Language), spesso usato per file di configurazione.
import yaml
#Importa il modulo 'shutil', che offre operazioni su file e collezioni di file di alto livello, come la copia e la rimozione di alberi di directory. Il commento originale indica già il suo uso per copiare i file.
import shutil
#Importa il modulo 're', che fornisce supporto per le espressioni regolari, utili per la ricerca e la manipolazione di stringhe basate su pattern.
import re

# --- CONFIGURAZIONE ---
base_dataset_folder = 'dataset' # La cartella che contiene 'originali01', 'groundtruth01' etc.
yolo_dataset_folder = 'yolo_thyroid_dataset' # Cartella di output con file postprocess per training di YOLO

# Definisci la regola per trovare la maschera dall'immagine originale
# Esempio: se l'immagine è 'dataset/originali01/uno100.jpg', la maschera è 'dataset/groundtruth01/unogt100.jpg'
def get_mask_path(image_path):
    '''
   Firma della funzione: get_mask_path(image_path)
   - def: Parola chiave che definisce una funzione.
   - get_mask_path: Nome della funzione.
   - image_path: Parametro in input. È una stringa che rappresenta il percorso completo di un file immagine originale.
   Scopo: Questa funzione costruisce e restituisce il percorso presunto del file maschera corrispondente all'immagine fornita.
          Si basa su una convenzione specifica di denominazione e struttura delle cartelle:
          1. Estrae il numero identificativo dalla cartella dell'immagine originale (es. '01' da 'originali01').
          2. Usa questo numero per formare il nome della cartella delle maschere (es. 'groundtruth01').
          3. Modifica il nome del file immagine (es. sostituendo 'uno' con 'unogt') per ottenere il nome del file maschera.
   Ritorna: Una stringa con il percorso completo al file maschera se la logica ha successo, altrimenti None se non è possibile determinare il percorso (es. se il numero della cartella non viene trovato).
    '''
    #Divide il percorso dell'immagine ('image_path') in una lista di componenti, utilizzando il separatore di directory specifico del sistema operativo (os.sep, es. '/' o '\').
    parts = image_path.split(os.sep)
    #Estrae l'ultimo elemento della lista 'parts', che corrisponde al nome del file con estensione (es. 'uno100.jpg').
    filename = parts[-1]
    # Estrai il numero dalla cartella originale (es. '01' da 'originali01')
    folder_name = parts[-2]
    #Utilizza un'espressione regolare (re.search) per trovare una sequenza di una o più cifre ('\d+') alla fine ('$') del nome della cartella ('folder_name').
    folder_num_match = re.search(r'\d+$', folder_name)
    #Controlla se l'espressione regolare ha trovato una corrispondenza (cioè, se è stato trovato un numero alla fine del nome della cartella).
    if folder_num_match:
        #Se una corrispondenza è stata trovata, 'folder_num_match.group()' restituisce la stringa corrispondente (es. '01').
        folder_num = folder_num_match.group()
        #Costruisce il nome della cartella delle maschere anteponendo 'groundtruth' al numero estratto (es. 'groundtruth01').
        mask_folder = f'groundtruth{folder_num}'
        #Crea il nome del file maschera sostituendo 'uno' con 'unogt' nel nome del file originale.
        mask_filename = filename.replace('uno', 'unogt')
        #Combina il percorso base del dataset, la cartella della maschera calcolata e il nome del file maschera calcolato per formare il percorso completo del file maschera, e lo restituisce.
        return os.path.join(base_dataset_folder, mask_folder, mask_filename)
    else:
        #Se l'espressione regolare non ha trovato un numero alla fine del nome della cartella.
        print(f"Attenzione: Impossibile determinare la cartella groundtruth per {image_path}")
        #Restituisce None per segnalare che il percorso della maschera non è stato trovato.
        return None #

# Classe target (solo una: tiroide)
class_index = 0
class_name = 'thyroid'
# --- FINE CONFIGURAZIONE ---

print(f"Cartella dataset originale: {os.path.abspath(base_dataset_folder)}")
print(f"Cartella dataset YOLO di output: {os.path.abspath(yolo_dataset_folder)}")

# Pulisci la cartella di output se esiste già (opzionale, ma utile in Colab)
if os.path.exists(yolo_dataset_folder):
    print(f"Rimuovo la cartella YOLO esistente: {yolo_dataset_folder}")
    shutil.rmtree(yolo_dataset_folder)
'''
Crea le cartelle necessarie per il training di YOLO
le cartelle sono:
- images/train: per le immagini di addestramento
- images/val: per le immagini di validazione
- labels/train: per le etichette di addestramento
- labels/val: per le etichette di validazione
'''
os.makedirs(os.path.join(yolo_dataset_folder, 'images', 'train'), exist_ok=True)
os.makedirs(os.path.join(yolo_dataset_folder, 'images', 'val'), exist_ok=True)
os.makedirs(os.path.join(yolo_dataset_folder, 'labels', 'train'), exist_ok=True)
os.makedirs(os.path.join(yolo_dataset_folder, 'labels', 'val'), exist_ok=True)

print("Struttura cartelle YOLO creata.")

#Inizializza una lista vuota chiamata 'all_image_paths' che conterrà i percorsi di tutte le immagini originali trovate.
all_image_paths = []
# Trova tutte le immagini JPG nelle cartelle 'originali*'
#Itera su tutte le cartelle all'interno di 'base_dataset_folder' il cui nome inizia con 'originali' (es. 'originali01', 'originali02').
for original_folder in glob.glob(os.path.join(base_dataset_folder, 'originali*')):
    #Per ogni cartella 'original_folder' trovata, cerca tutti i file con estensione '.jpg' e aggiunge i loro percorsi alla lista 'all_image_paths'.
    all_image_paths.extend(glob.glob(os.path.join(original_folder, '*.jpg')))

print(f"Trovate {len(all_image_paths)} immagini originali.")

#Inizializza una lista vuota chiamata 'image_mask_pairs' per memorizzare le coppie di percorsi (immagine originale, maschera corrispondente).
image_mask_pairs = []
#Itera su ciascun percorso di immagine trovato e memorizzato in 'all_image_paths'.
for img_path in all_image_paths:
    #Chiama la funzione 'get_mask_path' per ottenere il percorso della maschera corrispondente all'immagine corrente.
    mask_path = get_mask_path(img_path)
    # Aggiungi solo se get_mask_path ha restituito un percorso valido e se esiste
    #Controlla due condizioni: 1) 'mask_path' non è None (cioè la funzione ha restituito un percorso) E 2) il file specificato da 'mask_path' esiste effettivamente.
    if mask_path and os.path.exists(mask_path):
        #Se entrambe le condizioni sono vere, aggiunge una tupla (coppia) contenente il percorso dell'immagine e il percorso della maschera alla lista 'image_mask_pairs'.
        image_mask_pairs.append((img_path, mask_path))
    elif mask_path:
        #Se 'mask_path' è stato restituito (non è None) ma il file non esiste (la condizione 'os.path.exists(mask_path)' era falsa).
        print(f"Attenzione: Maschera non trovata per {img_path} al percorso calcolato {mask_path}")

print(f"Trovate {len(image_mask_pairs)} coppie immagine-maschera valide.")

#Controlla se la lista 'image_mask_pairs' è vuota (cioè, non sono state trovate coppie valide).
if not image_mask_pairs:
    print("Nessuna coppia immagine-maschera trovata. Controlla i percorsi e la funzione get_mask_path.")
#Se almeno una coppia immagine-maschera è stata trovata.
else:
    #Suddivide la lista 'image_mask_pairs' in due sotto-liste: 'train_pairs' (80% dei dati) e 'val_pairs' (20% dei dati).
    #'test_size=0.20' specifica la proporzione del dataset da allocare al set di validazione.
    #'random_state=42' assicura che la suddivisione sia riproducibile; usando lo stesso stato casuale si otterrà sempre la stessa suddivisione.
    train_pairs, val_pairs = train_test_split(image_mask_pairs, test_size=0.20, random_state=42)
    print(f"Suddivisione: {len(train_pairs)} training, {len(val_pairs)} validation.")

def process_dataset_split(pairs, split_name):
    '''
   Firma della funzione: process_dataset_split(pairs, split_name)
   - process_dataset_split: Nome della funzione.
   - pairs: Parametro in input. È una lista di tuple, dove ogni tupla contiene due stringhe: (percorso_immagine_originale, percorso_maschera_corrispondente).
   - split_name: Parametro in input. È una stringa che indica il nome del set di dati che si sta processando (es. "train" o "val").
   Scopo: Questa funzione elabora un insieme di coppie immagine-maschera per un determinato split (addestramento o validazione).
          Per ogni coppia:
          1. Costruisce nuovi nomi per l'immagine e il file di etichetta, includendo un numero derivato dalla sottocartella originale per garantire unicità.
          2. Copia l'immagine originale nella sottocartella 'images/<split_name>' della directory YOLO con il nuovo nome.
          3. Legge l'immagine della maschera, la binarizza e trova i contorni della regione di interesse (es. la tiroide).
          4. Normalizza le coordinate dei punti del contorno rispetto alle dimensioni dell'immagine (valori tra 0 e 1).
          5. Salva i contorni normalizzati in un file di testo (formato etichetta YOLO) nella sottocartella 'labels/<split_name>' con il nuovo nome.
   Ritorna: Nulla (la funzione modifica il filesystem creando file e cartelle).
   '''
    print(f"\nInizio processamento per lo split: {split_name}")
    #Inizializza un contatore per le immagini processate con successo.
    processed_count = 0
    #Inizializza un contatore per i file saltati a causa dell'impossibilità di estrarre il numero della sottocartella.
    skipped_no_folder_num = 0

    #Itera su ogni tupla (percorso immagine, percorso maschera) nella lista 'pairs'.
    for img_path, mask_path in pairs:
        #Inizia un blocco try-except per gestire potenziali errori durante l'elaborazione di una singola coppia immagine-maschera.
        try:
            # --- Estrai informazioni per il nuovo nome ---
            #Estrae il nome base del file originale dell'immagine (es. "uno100.jpg") dal suo percorso completo.
            original_base_filename = os.path.basename(img_path)
            #Separa il nome base del file nella sua parte nominale (es. "uno100") e la sua estensione (es. ".jpg").
            name_part, extension = os.path.splitext(original_base_filename)

            # Divide il percorso completo dell'immagine originale nei suoi componenti.
            parts = img_path.split(os.sep)
            #Estrae il nome della cartella che contiene l'immagine (es. 'originali01').
            folder_name = parts[-2]
            #Utilizza un'espressione regolare per trovare una sequenza di cifre alla fine del nome della cartella.
            folder_num_match = re.search(r'\d+$', folder_name)

            #Se l'espressione regolare non trova un numero alla fine del nome della cartella.
            if not folder_num_match:
                print(f"Attenzione: Impossibile estrarre il numero dalla cartella '{folder_name}' per l'immagine {img_path}. Salto questo file.")
                #Incrementa il contatore dei file saltati per questo motivo.
                skipped_no_folder_num += 1
                #Interrompe l'iterazione corrente del ciclo e passa alla prossima coppia immagine-maschera.
                continue

            #Estrae la stringa numerica trovata (es. '01').
            subfolder_num_str = folder_num_match.group()

            # Costruisci i nuovi nomi dei file
            new_base_filename = f"{name_part}_{subfolder_num_str}{extension}" # Es: uno140_01.jpg
            #Costruisce il nuovo nome del file etichetta, usando la stessa base del nuovo nome immagine ma con estensione ".txt" (es. "uno140_01.txt").
            new_label_filename = f"{name_part}_{subfolder_num_str}.txt"

            # --- Processa Immagine ---
            # Legge l'immagine originale dal percorso 'img_path' utilizzando OpenCV. 'img' sarà un array NumPy.
            img = cv2.imread(img_path)
            #Controlla se il caricamento dell'immagine è fallito (imread restituisce None in caso di errore).
            if img is None:
                print(f"Errore nel leggere l'immagine: {img_path}")
                #Salta all'iterazione successiva del ciclo.
                continue
            #Estrae altezza ('img_height') e larghezza ('img_width') dell'immagine dalle dimensioni dell'array NumPy ('img.shape').
            img_height, img_width = img.shape[:2]

            # Definisci il percorso di destinazione con il NUOVO nome
            yolo_img_path = os.path.join(yolo_dataset_folder, 'images', split_name, new_base_filename)
            #Copia il file immagine originale ('img_path') nella nuova posizione ('yolo_img_path'). 'copy2' tenta di preservare anche i metadati del file.
            shutil.copy2(img_path, yolo_img_path)

            # --- Processa Maschera e Crea Etichetta .txt ---
            #Legge l'immagine della maschera dal percorso 'mask_path' in scala di grigi (cv2.IMREAD_GRAYSCALE).
            mask = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE)
            #Controlla se il caricamento della maschera è fallito.
            if mask is None:
                print(f"Errore nel leggere la maschera: {mask_path} (associata a {img_path})")
                #Se l'immagine era già stata copiata ma la sua maschera non è leggibile, rimuove l'immagine copiata per mantenere la coerenza.
                if os.path.exists(yolo_img_path): os.remove(yolo_img_path)
                #Salta all'iterazione successiva.
                continue

            #Applica una binarizzazione alla maschera. I pixel con valore > 127 diventano 255 (bianco), gli altri 0 (nero). Il primo valore restituito ('_') è la soglia usata, non ci serve quindi usiamo il simbolo '_' per ignorarlo.
            _, mask_binary = cv2.threshold(mask, 127, 255, cv2.THRESH_BINARY)

            #Trova i contorni nell'immagine della maschera binarizzata.
            # - 'mask_binary': Immagine sorgente (binaria).
            # - 'cv2.RETR_EXTERNAL': Modalità di recupero dei contorni; recupera solo i contorni esterni.
            # - 'cv2.CHAIN_APPROX_SIMPLE': Metodo di approssimazione dei contorni; comprime segmenti orizzontali, verticali e diagonali lasciando solo i loro punti finali.
            # 'contours' è una lista di tutti i contorni trovati, ognuno è un array NumPy di coordinate (x,y) dei punti del contorno.
            # 'hierarchy' contiene informazioni sulla topologia dei contorni (non usata attivamente in questo script).
            contours, hierarchy = cv2.findContours(mask_binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

            #Costruisce il percorso completo per il file di etichetta .txt nella struttura YOLO, usando il nuovo nome file.
            yolo_label_path = os.path.join(yolo_dataset_folder, 'labels', split_name, new_label_filename)

            #Apre il file di etichetta in modalità scrittura ('w'). Il costrutto 'with' assicura che il file venga chiuso automaticamente. 'f' è l'oggetto file.
            with open(yolo_label_path, 'w') as f:
                #Inizializza un contatore per i contorni validi (quelli che soddisfano i criteri di dimensione/area) trovati in questa maschera.
                valid_contours_found = 0
                #Itera su ciascun contorno trovato nell'immagine della maschera.
                for contour in contours:
                    #Applica filtro su punti E area (opzionale ma consigliato)
                    #Definisce un'area minima (in pixel) affinché un contorno sia considerato valido.
                    min_contour_area = 5 # Ignora contorni con area < 5 pixel
                    #Controlla se il contorno è valido:
                    # 1. 'contour.size >= 6': Verifica che il contorno abbia almeno 3 punti (poiché ogni punto ha 2 coordinate (x,y), quindi 3*2=6 valori). Questo è necessario per definire una forma poligonale.
                    # 2. 'cv2.contourArea(contour) > min_contour_area': Verifica che l'area del contorno sia maggiore della soglia minima definita.
                    if contour.size >= 6 and cv2.contourArea(contour) > min_contour_area:
                        #'contour.flatten()' converte l'array del contorno (che potrebbe essere [[x1,y1],[x2,y2],...]) in un array monodimensionale [x1,y1,x2,y2,...].
                        normalized_contour = contour.flatten().astype(float)
                        #Normalizza le coordinate x (elementi a indice pari: 0, 2, 4, ...) dividendo per la larghezza dell'immagine. Il risultato è tra 0 e 1.
                        normalized_contour[0::2] /= img_width
                        #normalizza le coordinate y (elementi a indice dispari: 1, 3, 5, ...) dividendo per l'altezza dell'immagine. Il risultato è tra 0 e 1.
                        normalized_contour[1::2] /= img_height
                        #Assicura che tutte le coordinate normalizzate siano strettamente comprese tra 0 e 1 (es. 0.00001 e 0.99999). Evita valori esattamente uguali a 0.0 o 1.0 che potrebbero causare problemi con alcune implementazioni YOLO.
                        normalized_contour = np.clip(normalized_contour, 0.00001, 0.99999)
                        #Converte ogni coordinata normalizzata in una stringa formattata con 6 cifre decimali (es. "0.123456") e poi unisce tutte queste stringhe con uno spazio come separatore.
                        contour_str = ' '.join(map(lambda x: f"{x:.6f}", normalized_contour))
                        #Scrive una riga nel file di etichetta. La riga contiene: l'indice della classe ('class_index'), seguito da uno spazio, seguito dalle coordinate normalizzate del contorno, e termina con un carattere di nuova riga ('\n').
                        f.write(f"{class_index} {contour_str}\n")
                        #Incrementa il contatore dei contorni validi scritti su file per questa immagine.
                        valid_contours_found += 1
                #Se sono stati trovati dei contorni ('contours' non è vuoto) ma nessuno di essi è risultato valido ('valid_contours_found' è 0).
                if contours and valid_contours_found == 0:
                     print(f"Info: Trovati contorni in {mask_path}, ma nessuno era valido (>=3 punti e area > {min_contour_area}). File {new_label_filename} creato vuoto.")
                #Se non è stato trovato alcun contorno nell'immagine della maschera.
                elif not contours:
                     print(f"Info: Nessun contorno trovato in {mask_path}. File {new_label_filename} creato vuoto.")
                     #Non fa nulla; il file di etichetta rimarrà vuoto, che è il comportamento corretto se non ci sono oggetti.
                     pass

            #Incrementa il contatore delle immagini processate con successo in questo split.
            processed_count += 1
            #Controlla se il numero di immagini processate è un multiplo di 50.
            if processed_count % 50 == 0: # Stampa ogni 50 immagini
                print(f"  Processate {processed_count}/{len(pairs)} immagini per lo split {split_name}...")

        #Se si verifica un qualsiasi altro errore non gestito specificamente nel blocco 'try'. 'e' contiene l'oggetto eccezione.
        except Exception as e:
            print(f"Errore grave durante il processamento di {img_path} o {mask_path}: {e}")

    print(f"Fine processamento per lo split: {split_name}. Immagini processate correttamente: {processed_count}.")
    #Se alcuni file sono stati saltati a causa del problema con il numero della sottocartella.
    if skipped_no_folder_num > 0:
        print(f"Attenzione: {skipped_no_folder_num} file sono stati saltati perché non è stato possibile estrarre il numero della sottocartella.")


#Controlla se la variabile 'train_pairs' esiste nello scope locale (locals()) e se non è vuota. Questo evita errori se 'image_mask_pairs' era vuoto e quindi 'train_pairs' non è stato definito.
if 'train_pairs' in locals() and train_pairs:
    #Chiama la funzione 'process_dataset_split' per elaborare le coppie del set di addestramento.
    process_dataset_split(train_pairs, 'train')
#stesso procedimento per il set di validazione
if 'val_pairs' in locals() and val_pairs:
    process_dataset_split(val_pairs, 'val')


# Crea il dizionario per il file YAML
# I percorsi nel YAML puntano alle cartelle
# Il file YAML è necessario per YOLOv5 e YOLOv8

#Inizia la definizione di un dizionario Python chiamato 'yaml_data'.
yaml_data = {
    ##prende i percorsi assoluti delle cartelle di addestramento e validazione
    'train': os.path.abspath(os.path.join(yolo_dataset_folder, 'images', 'train')),
    'val': os.path.abspath(os.path.join(yolo_dataset_folder, 'images', 'val')),
    'nc': 1, # Numero di classi
    'names': [class_name] # Lista dei nomi delle classi
}

#Costruisce il percorso completo per il file 'data.yaml' all'interno della cartella del dataset YOLO.
yaml_path = os.path.join(yolo_dataset_folder, 'data.yaml')
#Apre il file 'data.yaml' in modalità scrittura ('w').
with open(yaml_path, 'w') as f:
    #Scrive il contenuto del dizionario 'yaml_data' nel file 'f' (data.yaml) in formato YAML.
    # 'default_flow_style=False': produce un output YAML più leggibile (stile a blocchi invece che inline).
    # 'sort_keys=False': mantiene l'ordine delle chiavi come nel dizionario originale.
    yaml.dump(yaml_data, f, default_flow_style=False, sort_keys=False)

print(f"\nFile data.yaml creato in: {yaml_path}")
print("Contenuto del data.yaml:")
with open(yaml_path, 'r') as f:
  print(f.read())

print(f"\nPreprocessing completato! La cartella '{yolo_dataset_folder}' contiene le immagini e le etichette rinominate ed è pronta per l'addestramento YOLO.")

Cartella dataset originale: /content/dataset
Cartella dataset YOLO di output: /content/yolo_thyroid_dataset
Struttura cartelle YOLO creata.
Trovate 880 immagini originali.
Trovate 880 coppie immagine-maschera valide.
Suddivisione: 704 training, 176 validation.

Inizio processamento per lo split: train
  Processate 50/704 immagini per lo split train...
  Processate 100/704 immagini per lo split train...
  Processate 150/704 immagini per lo split train...
  Processate 200/704 immagini per lo split train...
  Processate 250/704 immagini per lo split train...
  Processate 300/704 immagini per lo split train...
  Processate 350/704 immagini per lo split train...
  Processate 400/704 immagini per lo split train...
  Processate 450/704 immagini per lo split train...
  Processate 500/704 immagini per lo split train...
  Processate 550/704 immagini per lo split train...
  Processate 600/704 immagini per lo split train...
Info: Trovati contorni in dataset/groundtruth02/unogt99.jpg, ma nessuno er

In [None]:
#Utilizzando il gestore di pacchetti Python pip, installa la libreria ultralytics e, durante l'operazione,
# riduci al minimo i messaggi di output stampati sulla console (modalità silenziosa/quiet) utilizzando -q

!pip install ultralytics -q

In [None]:
#Importa la classe YOLO dalla libreria 'ultralytics', che è la classe principale per utilizzare i modelli YOLOv8.
from ultralytics import YOLO
#Importa il modulo 'os', che fornisce funzioni per interagire con il sistema operativo, come la gestione dei percorsi dei file.
import os
#Importa la libreria PyTorch ('torch'). Viene qui utilizzata principalmente per verificare la disponibilità e le informazioni sulla GPU.
import torch

#Questo blocco di codice verifica la presenza di una GPU NVIDIA compatibile con CUDA.
print(f"GPU disponibile: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"Nome GPU: {torch.cuda.get_device_name(0)}")

#Definisce la variabile 'data_yaml_path' con il percorso del file 'data.yaml'.
#Questo file è cruciale perché contiene le informazioni sul dataset
#(percorsi per training/validation, numero di classi, nomi delle classi) necessarie al modello YOLO per l'addestramento.
data_yaml_path = '/content/yolo_thyroid_dataset/data.yaml'

#Controlla se il file specificato in 'data_yaml_path' esiste nel filesystem.
if os.path.exists(data_yaml_path):
    print(f"File data.yaml trovato in: {data_yaml_path}")
    #Apre il file 'data.yaml' in modalità lettura ('r'). Il costrutto 'with' assicura la chiusura automatica del file.
    with open(data_yaml_path, 'r') as f:
         print("Contenuto di data.yaml:\n", f.read())
#Se il file 'data.yaml' non viene trovato al percorso specificato.
else:
    print(f"ERRORE: File data.yaml NON trovato in: {data_yaml_path}. Verifica il percorso!")


# Scegli il modello base per la segmentazione
# Opzioni comuni: 'yolov8n-seg.pt', 'yolov8s-seg.pt', 'yolov8m-seg.pt'
#Assegna alla variabile 'model_name' il nome del file del modello scelto, in questo caso 'yolov8s-seg.pt' (modello "small" per la segmentazione).
model_name = 'yolov8s-seg.pt'

#Crea un'istanza della classe YOLO, caricando i pesi del modello pre-addestrato specificato da 'model_name'. Questo oggetto 'model' verrà poi utilizzato per l'addestramento.
model = YOLO(model_name)

# --- Parametri di Addestramento ---
# Definisce il numero di 'epoche', ovvero il numero di volte in cui l'intero dataset di addestramento verrà processato dal modello.
epochs = 100
img_size = 640    # Dimensione delle immagini per l'addestramento (640x640 pixel è comune per YOLOv8)
#Definisce il 'batch_size', cioè il numero di immagini che vengono elaborate contemporaneamente dal modello prima di aggiornare i pesi. Questo valore deve essere adattato in base alla memoria GPU disponibile.
batch_size = 8
#Assegna un nome descrittivo ('run_name') a questa sessione di addestramento.
#Questo nome verrà utilizzato per creare una cartella dove verranno salvati i risultati (pesi, log, grafici).
run_name = 'thyroid_seg_finetune'

# Avvia l'addestramento!
# Assicurati che data_yaml_path sia corretto
if os.path.exists(data_yaml_path):
    print(f"\n--- Inizio Addestramento ---")
    # La variabile 'results' conterrà informazioni e metriche relative all'addestramento una volta completato.
    results = model.train(
        data=data_yaml_path,
        epochs=epochs,
        imgsz=img_size,
        batch=batch_size,
        name=run_name,  # Nome della cartella dei risultati
        project='YOLOv8_Thyroid_Runs' # Cartella radice per tutte le esecuzioni
    )

    print("--- Addestramento Completato ---")
else:
    print("Addestramento non avviato a causa del file data.yaml mancante.")

GPU disponibile: True
Nome GPU: Tesla T4
File data.yaml trovato in: /content/yolo_thyroid_dataset/data.yaml
Contenuto di data.yaml:
 train: /content/yolo_thyroid_dataset/images/train
val: /content/yolo_thyroid_dataset/images/val
nc: 1
names:
- thyroid

Downloading https://github.com/ultralytics/assets/releases/download/v8.3.0/yolov8s-seg.pt to 'yolov8s-seg.pt'...


100%|██████████| 22.8M/22.8M [00:00<00:00, 121MB/s] 



--- Inizio Addestramento ---
Ultralytics 8.3.127 🚀 Python-3.11.12 torch-2.6.0+cu124 CUDA:0 (Tesla T4, 15095MiB)
[34m[1mengine/trainer: [0magnostic_nms=False, amp=True, augment=False, auto_augment=randaugment, batch=8, bgr=0.0, box=7.5, cache=False, cfg=None, classes=None, close_mosaic=10, cls=0.5, conf=None, copy_paste=0.0, copy_paste_mode=flip, cos_lr=False, cutmix=0.0, data=/content/yolo_thyroid_dataset/data.yaml, degrees=0.0, deterministic=True, device=cuda:0, dfl=1.5, dnn=False, dropout=0.0, dynamic=False, embed=None, epochs=100, erasing=0.4, exist_ok=False, fliplr=0.5, flipud=0.0, format=torchscript, fraction=1.0, freeze=None, half=False, hsv_h=0.015, hsv_s=0.7, hsv_v=0.4, imgsz=640, int8=False, iou=0.7, keras=False, kobj=1.0, line_width=None, lr0=0.01, lrf=0.01, mask_ratio=4, max_det=300, mixup=0.0, mode=train, model=yolov8s-seg.pt, momentum=0.937, mosaic=1.0, multi_scale=False, name=thyroid_seg_finetune, nbs=64, nms=False, opset=None, optimize=False, optimizer=auto, overlap_

100%|██████████| 755k/755k [00:00<00:00, 24.9MB/s]

Overriding model.yaml nc=80 with nc=1

                   from  n    params  module                                       arguments                     
  0                  -1  1       928  ultralytics.nn.modules.conv.Conv             [3, 32, 3, 2]                 
  1                  -1  1     18560  ultralytics.nn.modules.conv.Conv             [32, 64, 3, 2]                
  2                  -1  1     29056  ultralytics.nn.modules.block.C2f             [64, 64, 1, True]             
  3                  -1  1     73984  ultralytics.nn.modules.conv.Conv             [64, 128, 3, 2]               
  4                  -1  2    197632  ultralytics.nn.modules.block.C2f             [128, 128, 2, True]           
  5                  -1  1    295424  ultralytics.nn.modules.conv.Conv             [128, 256, 3, 2]              
  6                  -1  2    788480  ultralytics.nn.modules.block.C2f             [256, 256, 2, True]           
  7                  -1  1   1180672  ultralytics




 22        [15, 18, 21]  1   2770931  ultralytics.nn.modules.head.Segment          [1, 32, 128, [128, 256, 512]] 
YOLOv8s-seg summary: 151 layers, 11,790,483 parameters, 11,790,467 gradients, 42.7 GFLOPs

Transferred 411/417 items from pretrained weights
Freezing layer 'model.22.dfl.conv.weight'
[34m[1mAMP: [0mrunning Automatic Mixed Precision (AMP) checks...
Downloading https://github.com/ultralytics/assets/releases/download/v8.3.0/yolo11n.pt to 'yolo11n.pt'...


100%|██████████| 5.35M/5.35M [00:00<00:00, 97.6MB/s]


[34m[1mAMP: [0mchecks passed ✅
[34m[1mtrain: [0mFast image access ✅ (ping: 0.0±0.0 ms, read: 293.4±102.3 MB/s, size: 8.6 KB)


[34m[1mtrain: [0mScanning /content/yolo_thyroid_dataset/labels/train... 704 images, 122 backgrounds, 0 corrupt: 100%|██████████| 704/704 [00:00<00:00, 1309.27it/s]

[34m[1mtrain: [0mNew cache created: /content/yolo_thyroid_dataset/labels/train.cache





[34m[1malbumentations: [0mBlur(p=0.01, blur_limit=(3, 7)), MedianBlur(p=0.01, blur_limit=(3, 7)), ToGray(p=0.01, method='weighted_average', num_output_channels=3), CLAHE(p=0.01, clip_limit=(1.0, 4.0), tile_grid_size=(8, 8))
[34m[1mval: [0mFast image access ✅ (ping: 0.0±0.0 ms, read: 160.6±107.9 MB/s, size: 8.2 KB)


[34m[1mval: [0mScanning /content/yolo_thyroid_dataset/labels/val... 176 images, 32 backgrounds, 0 corrupt: 100%|██████████| 176/176 [00:00<00:00, 987.69it/s] 

[34m[1mval: [0mNew cache created: /content/yolo_thyroid_dataset/labels/val.cache





Plotting labels to YOLOv8_Thyroid_Runs/thyroid_seg_finetune/labels.jpg... 
[34m[1moptimizer:[0m 'optimizer=auto' found, ignoring 'lr0=0.01' and 'momentum=0.937' and determining best 'optimizer', 'lr0' and 'momentum' automatically... 
[34m[1moptimizer:[0m AdamW(lr=0.002, momentum=0.9) with parameter groups 66 weight(decay=0.0), 77 weight(decay=0.0005), 76 bias(decay=0.0)
Image sizes 640 train, 640 val
Using 2 dataloader workers
Logging results to [1mYOLOv8_Thyroid_Runs/thyroid_seg_finetune[0m
Starting training for 100 epochs...

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      1/100      2.34G      1.516      2.486      2.771      1.458          7        640: 100%|██████████| 88/88 [00:22<00:00,  3.85it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.11it/s]

                   all        176        146     0.0319     0.0205      0.004    0.00132     0.0398     0.0205    0.00643    0.00234






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      2/100      3.84G      1.411      1.804      1.428      1.366         16        640: 100%|██████████| 88/88 [00:18<00:00,  4.67it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  3.90it/s]

                   all        176        146      0.391       0.63      0.405      0.187       0.45      0.726      0.534      0.251






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      3/100      3.87G      1.453      1.781      1.232      1.362         12        640: 100%|██████████| 88/88 [00:18<00:00,  4.77it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.36it/s]


                   all        176        146       0.67      0.555      0.645      0.308      0.667      0.568      0.635      0.269

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      4/100      3.91G      1.439       1.88      1.267      1.319         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.55it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.33it/s]

                   all        176        146      0.914      0.849      0.909      0.488      0.909      0.893      0.942      0.576






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      5/100      3.95G      1.328      1.644      1.078      1.294         16        640: 100%|██████████| 88/88 [00:18<00:00,  4.78it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.01it/s]


                   all        176        146       0.88        0.9      0.908        0.5      0.971      0.906      0.964      0.484

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      6/100      3.99G      1.316      1.754       1.07      1.282         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.76it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.55it/s]

                   all        176        146      0.643      0.685      0.711      0.422      0.665      0.664      0.721      0.421






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      7/100      4.03G      1.206      1.595     0.9424      1.215         13        640: 100%|██████████| 88/88 [00:19<00:00,  4.54it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.49it/s]


                   all        176        146      0.948      0.932       0.97      0.666      0.948      0.932      0.971      0.657

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      8/100      4.07G      1.188      1.587     0.8898      1.204         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.73it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.10it/s]

                   all        176        146       0.92      0.788      0.883      0.569      0.928      0.789      0.847      0.546






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


      9/100      4.11G      1.145      1.519     0.8321      1.169         17        640: 100%|██████████| 88/88 [00:18<00:00,  4.78it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.49it/s]

                   all        176        146      0.872      0.842      0.918      0.667      0.922      0.889      0.961      0.666






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     10/100      4.15G       1.16      1.526     0.8362      1.178         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.52it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.57it/s]

                   all        176        146      0.935      0.932      0.967      0.695      0.963      0.959      0.975      0.661






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     11/100      4.19G      1.157      1.481     0.8056      1.181         20        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.03it/s]

                   all        176        146      0.933      0.979      0.986      0.751      0.933      0.979      0.986      0.696






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     12/100      4.23G      1.038      1.391     0.7346      1.125         12        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.49it/s]

                   all        176        146      0.913       0.93      0.962      0.677      0.926      0.944      0.974      0.659






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     13/100      4.27G      1.084      1.414     0.7659      1.147         14        640: 100%|██████████| 88/88 [00:19<00:00,  4.51it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.53it/s]


                   all        176        146       0.94       0.96      0.975       0.76      0.979      0.945      0.979       0.71

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     14/100      4.31G       1.02      1.367     0.7501      1.107         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.69it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.21it/s]

                   all        176        146      0.915      0.959      0.976      0.761      0.964      0.925      0.978      0.734






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     15/100      4.35G       1.02      1.356     0.7296       1.12         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.59it/s]

                   all        176        146      0.984      0.979      0.986      0.758      0.984      0.979      0.986      0.717






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     16/100      4.39G      0.997      1.361       0.74      1.098          9        640: 100%|██████████| 88/88 [00:19<00:00,  4.52it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.60it/s]

                   all        176        146      0.986      0.963      0.975      0.739      0.986      0.963      0.975      0.713






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     17/100      4.43G     0.9656      1.304     0.6644      1.083         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.55it/s]

                   all        176        146      0.986      0.911      0.969      0.765      0.977      0.932      0.972      0.719






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     18/100      4.47G     0.9545      1.282     0.6669      1.088         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.57it/s]

                   all        176        146      0.959      0.961      0.987      0.754      0.966      0.968      0.991      0.717






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     19/100      4.51G      1.002      1.318     0.6851        1.1         19        640: 100%|██████████| 88/88 [00:19<00:00,  4.50it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.51it/s]


                   all        176        146      0.966      0.979      0.983      0.778      0.972      0.979      0.977      0.737

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     20/100      4.55G     0.9226      1.272     0.6233      1.063         16        640: 100%|██████████| 88/88 [00:19<00:00,  4.51it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.51it/s]

                   all        176        146      0.991      0.973      0.988      0.782      0.991      0.973      0.989      0.743






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     21/100      4.59G     0.9412      1.295     0.6477      1.076         16        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.40it/s]

                   all        176        146       0.97      0.973       0.99      0.787      0.972      0.973       0.99      0.752






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     22/100      4.63G     0.9083      1.248      0.616      1.051         12        640: 100%|██████████| 88/88 [00:19<00:00,  4.59it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.57it/s]

                   all        176        146      0.972      0.968      0.988      0.799      0.972      0.968      0.988       0.76






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     23/100      4.67G     0.8721      1.225     0.6128      1.032         13        640: 100%|██████████| 88/88 [00:19<00:00,  4.48it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.58it/s]

                   all        176        146      0.996      0.979      0.994        0.8      0.996      0.979      0.994      0.754






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     24/100      4.71G     0.8896      1.238     0.6132       1.05         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.72it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.89it/s]

                   all        176        146      0.993      0.955       0.98      0.801      0.991      0.973      0.989      0.752






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     25/100      4.75G     0.8737      1.248      0.617      1.035         13        640: 100%|██████████| 88/88 [00:19<00:00,  4.61it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.58it/s]

                   all        176        146      0.993      0.979      0.991      0.812      0.993      0.979      0.991      0.779






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     26/100      4.79G     0.8443      1.161     0.5689       1.02         16        640: 100%|██████████| 88/88 [00:19<00:00,  4.51it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.53it/s]

                   all        176        146          1      0.986      0.994       0.82      0.993      0.979      0.984      0.759






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     27/100      4.83G     0.8652      1.208     0.5883       1.04         12        640: 100%|██████████| 88/88 [00:18<00:00,  4.70it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.28it/s]

                   all        176        146      0.999      0.973      0.987      0.809      0.999      0.973      0.992       0.76






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     28/100      4.87G     0.8228      1.191     0.5694      1.015         12        640: 100%|██████████| 88/88 [00:18<00:00,  4.72it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.54it/s]

                   all        176        146      0.991      0.986      0.991      0.826      0.991      0.986      0.991      0.788






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     29/100      4.91G     0.8207      1.143     0.5508       1.01         10        640: 100%|██████████| 88/88 [00:19<00:00,  4.50it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.62it/s]


                   all        176        146      0.987      0.979      0.994      0.843      0.987      0.979      0.994      0.791

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     30/100      4.95G     0.7831       1.13     0.5423     0.9931         18        640: 100%|██████████| 88/88 [00:18<00:00,  4.68it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.03it/s]

                   all        176        146      0.965      0.979      0.983      0.832      0.999      0.966      0.994      0.794






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     31/100      4.99G     0.7392      1.038     0.5031     0.9669         19        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.65it/s]

                   all        176        146      0.977      0.979      0.985      0.843      0.984      0.986      0.994      0.795






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     32/100      5.03G     0.8239       1.19     0.5511      1.019         12        640: 100%|██████████| 88/88 [00:19<00:00,  4.50it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.47it/s]

                   all        176        146      0.995      0.986      0.992      0.864      0.995      0.986      0.992      0.804






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     33/100      5.07G     0.7555      1.142     0.5359     0.9818          7        640: 100%|██████████| 88/88 [00:19<00:00,  4.58it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.40it/s]

                   all        176        146      0.985      0.979      0.985      0.856      0.992      0.986      0.995      0.802






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     34/100      5.11G     0.7578      1.085     0.5007     0.9899         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.72it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.67it/s]

                   all        176        146      0.986      0.984      0.994      0.845      0.986      0.984      0.994      0.825






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     35/100      5.15G     0.7597      1.064     0.5077     0.9734         12        640: 100%|██████████| 88/88 [00:19<00:00,  4.50it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.67it/s]

                   all        176        146      0.993      0.986      0.995      0.847      0.993      0.986      0.995      0.815






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     36/100      5.19G      0.729      1.037     0.4919     0.9778         18        640: 100%|██████████| 88/88 [00:19<00:00,  4.61it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.77it/s]

                   all        176        146          1      0.992      0.995      0.869          1      0.992      0.995      0.819






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     37/100      5.23G     0.7129      1.015     0.4738     0.9642         12        640: 100%|██████████| 88/88 [00:18<00:00,  4.69it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.56it/s]

                   all        176        146      0.984      0.979      0.993      0.865      0.984      0.979      0.993      0.819






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     38/100      5.27G     0.7258      1.023     0.4889     0.9678         19        640: 100%|██████████| 88/88 [00:19<00:00,  4.51it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.63it/s]

                   all        176        146      0.998      0.979      0.994      0.866      0.998      0.979      0.994      0.832






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     39/100      5.31G     0.7172       1.03     0.4864     0.9623         18        640: 100%|██████████| 88/88 [00:19<00:00,  4.51it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.51it/s]

                   all        176        146          1      0.993      0.995      0.871          1      0.993      0.995      0.834






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     40/100      5.35G     0.6932     0.9604     0.4532     0.9531         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.71it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.36it/s]

                   all        176        146      0.986       0.98      0.994       0.86      0.986       0.98      0.994      0.821






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     41/100      5.39G     0.7207      1.014      0.481     0.9592         11        640: 100%|██████████| 88/88 [00:19<00:00,  4.59it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.58it/s]

                   all        176        146          1      0.986      0.995      0.877          1      0.986      0.995      0.837






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     42/100      5.43G     0.6765     0.9804     0.4661     0.9466         11        640: 100%|██████████| 88/88 [00:19<00:00,  4.49it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.56it/s]

                   all        176        146      0.996      0.986      0.994      0.882      0.996      0.986      0.994      0.839






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     43/100      5.47G     0.7004     0.9823      0.462     0.9612         20        640: 100%|██████████| 88/88 [00:18<00:00,  4.73it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.81it/s]

                   all        176        146      0.992      0.993      0.994       0.87      0.992      0.993      0.994      0.835






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     44/100      5.51G     0.6874     0.9905     0.4674     0.9545         16        640: 100%|██████████| 88/88 [00:18<00:00,  4.67it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.54it/s]

                   all        176        146      0.999      0.986      0.995      0.869      0.999      0.986      0.995      0.831






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     45/100      5.55G     0.6732       1.01     0.4487     0.9455         10        640: 100%|██████████| 88/88 [00:19<00:00,  4.52it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.60it/s]

                   all        176        146      0.993      0.993      0.995       0.86      0.993      0.993      0.995      0.825






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     46/100      5.59G      0.674      0.968       0.45     0.9489         15        640: 100%|██████████| 88/88 [00:18<00:00,  4.68it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.22it/s]

                   all        176        146      0.993      0.986      0.995      0.879      0.993      0.986      0.995      0.847






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     47/100      5.63G     0.6651     0.9352     0.4427     0.9545         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.55it/s]

                   all        176        146      0.992      0.986      0.995      0.883      0.992      0.986      0.995      0.835






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     48/100      5.67G     0.6602     0.9554     0.4467     0.9498         18        640: 100%|██████████| 88/88 [00:19<00:00,  4.46it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.52it/s]

                   all        176        146      0.993      0.978      0.993      0.885          1      0.985      0.995      0.829






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     49/100      5.71G     0.6696      0.938     0.4421     0.9531         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.60it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.29it/s]

                   all        176        146      0.998      0.986      0.995      0.888      0.998      0.986      0.995      0.845






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     50/100      5.75G     0.6402     0.9242     0.4252     0.9413         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.58it/s]

                   all        176        146      0.993      0.993      0.995      0.913      0.993      0.993      0.995      0.856






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     51/100      5.79G     0.6335     0.9211     0.4196     0.9335         11        640: 100%|██████████| 88/88 [00:20<00:00,  4.35it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.46it/s]

                   all        176        146      0.992      0.993      0.995      0.899      0.992      0.993      0.995       0.85






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     52/100      5.83G     0.6246     0.9341     0.4155     0.9233         10        640: 100%|██████████| 88/88 [00:19<00:00,  4.44it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.45it/s]


                   all        176        146      0.992      0.993      0.995      0.895      0.992      0.993      0.995      0.852

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     53/100      5.87G      0.619     0.9071      0.417     0.9306         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.62it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.60it/s]

                   all        176        146      0.993      0.992      0.995      0.905      0.993      0.992      0.995      0.863






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     54/100      6.02G     0.5965     0.8923     0.4044     0.9157         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.58it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.48it/s]

                   all        176        146      0.986      0.991      0.995      0.912      0.986      0.991      0.995      0.869






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     55/100      6.06G     0.6161     0.8847     0.4117     0.9297         13        640: 100%|██████████| 88/88 [00:19<00:00,  4.45it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.49it/s]

                   all        176        146      0.991      0.993      0.995      0.898      0.991      0.993      0.995      0.853






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     56/100       6.1G     0.5918     0.8516     0.4074     0.9305         18        640: 100%|██████████| 88/88 [00:18<00:00,  4.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.08it/s]


                   all        176        146          1      0.986      0.995      0.892          1      0.986      0.995      0.847

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     57/100      6.14G      0.613     0.8452     0.4133     0.9318         12        640: 100%|██████████| 88/88 [00:18<00:00,  4.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.38it/s]

                   all        176        146      0.993      0.992      0.995      0.904      0.993      0.992      0.995       0.86






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     58/100      6.18G     0.5906     0.8619     0.3937     0.9179         14        640: 100%|██████████| 88/88 [00:19<00:00,  4.41it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.43it/s]

                   all        176        146      0.999      0.993      0.995      0.912      0.999      0.993      0.995      0.863






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     59/100      6.22G      0.578       0.87     0.3842     0.9244          9        640: 100%|██████████| 88/88 [00:19<00:00,  4.47it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.97it/s]

                   all        176        146          1      0.992      0.995      0.916          1      0.992      0.995      0.862






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     60/100      6.88G     0.5731     0.8385     0.3726      0.916         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.68it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.72it/s]

                   all        176        146      0.998      0.986      0.995      0.918      0.998      0.986      0.995      0.873






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     61/100      6.92G     0.5949     0.8635     0.3976     0.9271         13        640: 100%|██████████| 88/88 [00:19<00:00,  4.44it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.43it/s]


                   all        176        146      0.999      0.986      0.995      0.916      0.999      0.986      0.995      0.859

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     62/100      6.96G      0.553     0.8065     0.3619     0.9023         14        640: 100%|██████████| 88/88 [00:19<00:00,  4.47it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.59it/s]

                   all        176        146      0.999      0.986      0.995      0.919      0.999      0.986      0.995      0.866






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     63/100         7G      0.553     0.8002     0.3691      0.912         13        640: 100%|██████████| 88/88 [00:18<00:00,  4.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.04it/s]

                   all        176        146          1      0.986      0.994      0.917          1      0.986      0.994      0.865






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     64/100      7.04G     0.5533     0.7858     0.3632     0.9081         12        640: 100%|██████████| 88/88 [00:19<00:00,  4.54it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.57it/s]

                   all        176        146          1      0.993      0.995       0.92          1      0.993      0.995      0.869






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     65/100      7.08G     0.5309     0.7701     0.3634     0.8973         16        640: 100%|██████████| 88/88 [00:20<00:00,  4.40it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.55it/s]

                   all        176        146          1      0.992      0.995      0.925          1      0.992      0.995      0.873






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     66/100      7.12G     0.5664     0.7991     0.3779     0.9127         11        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.14it/s]

                   all        176        146      0.999      0.986      0.995      0.918      0.999      0.986      0.995      0.871






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     67/100      7.16G     0.5279     0.7626     0.3515     0.8979          8        640: 100%|██████████| 88/88 [00:18<00:00,  4.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.65it/s]

                   all        176        146      0.993      0.993      0.995       0.93      0.993      0.993      0.995      0.876






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     68/100       7.2G     0.5238      0.734     0.3551     0.9026         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.45it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.56it/s]

                   all        176        146      0.999      0.986      0.995      0.925      0.999      0.986      0.995      0.877






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     69/100      7.24G     0.5304     0.7752       0.36     0.9046         11        640: 100%|██████████| 88/88 [00:18<00:00,  4.63it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.39it/s]

                   all        176        146          1      0.993      0.995      0.925          1      0.993      0.995      0.869






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     70/100      7.28G     0.5216     0.7457     0.3562     0.8898         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.40it/s]

                   all        176        146          1      0.993      0.995      0.939          1      0.993      0.995      0.879






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     71/100      7.32G     0.5302     0.7598     0.3628     0.8907         18        640: 100%|██████████| 88/88 [00:19<00:00,  4.45it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.60it/s]

                   all        176        146          1      0.993      0.995      0.947          1      0.993      0.995      0.884






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     72/100      7.36G     0.5097     0.7855     0.3425     0.8828         13        640: 100%|██████████| 88/88 [00:19<00:00,  4.46it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.38it/s]

                   all        176        146      0.999      0.993      0.995      0.937      0.999      0.993      0.995      0.881






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     73/100       7.4G     0.5189     0.7752     0.3488     0.8993          8        640: 100%|██████████| 88/88 [00:18<00:00,  4.67it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.20it/s]

                   all        176        146          1      0.993      0.995      0.948          1      0.993      0.995      0.882






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     74/100      3.22G     0.5028     0.7215     0.3396      0.898          9        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.50it/s]

                   all        176        146          1      0.993      0.995      0.926          1      0.993      0.995      0.875






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     75/100      3.44G     0.5069     0.7221      0.344      0.893         13        640: 100%|██████████| 88/88 [00:20<00:00,  4.39it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.56it/s]

                   all        176        146          1      0.993      0.995      0.932          1      0.993      0.995      0.874






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     76/100      3.44G     0.5032     0.7212     0.3361     0.8995          8        640: 100%|██████████| 88/88 [00:19<00:00,  4.52it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.76it/s]

                   all        176        146      0.999      0.986      0.995      0.941      0.999      0.986      0.995      0.881






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     77/100      3.44G     0.5048     0.7113     0.3439     0.8957         12        640: 100%|██████████| 88/88 [00:19<00:00,  4.61it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.53it/s]

                   all        176        146      0.999      0.986      0.995      0.935      0.999      0.986      0.995      0.882






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     78/100      3.44G     0.4863     0.6978     0.3259     0.8822         11        640: 100%|██████████| 88/88 [00:19<00:00,  4.48it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.55it/s]

                   all        176        146          1      0.993      0.995      0.941          1      0.993      0.995      0.886






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     79/100      3.44G     0.4726     0.7069     0.3278     0.8785         12        640: 100%|██████████| 88/88 [00:19<00:00,  4.45it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.59it/s]

                   all        176        146          1      0.992      0.995       0.94          1      0.992      0.995      0.893






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     80/100      3.44G     0.4686     0.6777      0.322     0.8763         15        640: 100%|██████████| 88/88 [00:18<00:00,  4.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.08it/s]

                   all        176        146      0.999      0.993      0.995      0.937      0.999      0.993      0.995      0.889






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     81/100      3.44G     0.4701     0.6777     0.3279     0.8773         15        640: 100%|██████████| 88/88 [00:19<00:00,  4.59it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.62it/s]

                   all        176        146          1      0.992      0.995      0.942          1      0.992      0.995      0.897






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     82/100      3.44G     0.4712     0.6948     0.3192     0.8798         16        640: 100%|██████████| 88/88 [00:19<00:00,  4.43it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.40it/s]

                   all        176        146          1      0.993      0.995       0.94          1      0.993      0.995      0.893






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     83/100      3.44G     0.4831      0.684     0.3191     0.8788         14        640: 100%|██████████| 88/88 [00:18<00:00,  4.66it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  3.95it/s]

                   all        176        146          1      0.993      0.995      0.954          1      0.993      0.995      0.892






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     84/100      3.44G     0.4547     0.6589     0.3103     0.8716         18        640: 100%|██████████| 88/88 [00:18<00:00,  4.63it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.51it/s]

                   all        176        146          1      0.993      0.995      0.941          1      0.993      0.995      0.895






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     85/100      3.44G     0.4399     0.6489     0.2991     0.8761         12        640: 100%|██████████| 88/88 [00:20<00:00,  4.39it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.51it/s]

                   all        176        146          1      0.993      0.995      0.944          1      0.993      0.995      0.899






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     86/100      3.44G      0.452     0.6666      0.311     0.8676         14        640: 100%|██████████| 88/88 [00:20<00:00,  4.39it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.89it/s]

                   all        176        146          1      0.993      0.995       0.95          1      0.993      0.995        0.9






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     87/100      3.44G     0.4468     0.6531     0.3031     0.8791         11        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.34it/s]

                   all        176        146          1      0.992      0.995      0.949          1      0.992      0.995      0.896






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     88/100      3.65G     0.4337     0.6286     0.2943     0.8611         24        640: 100%|██████████| 88/88 [00:19<00:00,  4.48it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.58it/s]

                   all        176        146      0.999      0.993      0.995       0.95      0.999      0.993      0.995      0.896






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     89/100      3.65G     0.4404     0.6554     0.2991     0.8706         18        640: 100%|██████████| 88/88 [00:19<00:00,  4.42it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.46it/s]

                   all        176        146      0.999      0.993      0.995      0.946      0.999      0.993      0.995        0.9






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     90/100      3.65G     0.4259      0.621     0.2923     0.8682         14        640: 100%|██████████| 88/88 [00:19<00:00,  4.60it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.23it/s]

                   all        176        146      0.999      0.993      0.995      0.955      0.999      0.993      0.995      0.901





Closing dataloader mosaic
[34m[1malbumentations: [0mBlur(p=0.01, blur_limit=(3, 7)), MedianBlur(p=0.01, blur_limit=(3, 7)), ToGray(p=0.01, method='weighted_average', num_output_channels=3), CLAHE(p=0.01, clip_limit=(1.0, 4.0), tile_grid_size=(8, 8))

      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     91/100      3.65G     0.3139     0.5054     0.2265     0.8215          7        640: 100%|██████████| 88/88 [00:19<00:00,  4.49it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.48it/s]

                   all        176        146          1      0.993      0.995      0.962          1      0.993      0.995      0.901






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     92/100      3.65G     0.3007     0.4744     0.2181     0.8031          3        640: 100%|██████████| 88/88 [00:19<00:00,  4.50it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.48it/s]

                   all        176        146      0.999      0.993      0.995      0.953      0.999      0.993      0.995      0.906






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     93/100      3.65G     0.2894     0.4594     0.2168     0.8099          6        640: 100%|██████████| 88/88 [00:18<00:00,  4.64it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.70it/s]

                   all        176        146      0.999      0.993      0.995      0.962      0.999      0.993      0.995      0.919






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     94/100      3.65G     0.2948     0.4507     0.2177      0.811          4        640: 100%|██████████| 88/88 [00:18<00:00,  4.76it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.49it/s]

                   all        176        146          1      0.993      0.995      0.963          1      0.993      0.995      0.916






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     95/100      3.78G     0.2858     0.4439     0.2124     0.8134          8        640: 100%|██████████| 88/88 [00:19<00:00,  4.56it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.53it/s]

                   all        176        146      0.999      0.993      0.995      0.963      0.999      0.993      0.995      0.917






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     96/100      3.82G     0.2707     0.4431     0.2054     0.8103          5        640: 100%|██████████| 88/88 [00:18<00:00,  4.68it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.44it/s]

                   all        176        146          1      0.993      0.995      0.968          1      0.993      0.995      0.914






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     97/100      3.86G     0.2704     0.4342     0.2047     0.8007          7        640: 100%|██████████| 88/88 [00:18<00:00,  4.75it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.53it/s]

                   all        176        146      0.999      0.993      0.995      0.963      0.999      0.993      0.995      0.922






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     98/100       3.9G     0.2613       0.43     0.1988     0.7936          7        640: 100%|██████████| 88/88 [00:19<00:00,  4.56it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:01<00:00,  5.69it/s]

                   all        176        146          1      0.993      0.995      0.972          1      0.993      0.995      0.921






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


     99/100      3.94G     0.2589     0.4262     0.1985     0.7996          7        640: 100%|██████████| 88/88 [00:18<00:00,  4.65it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  4.60it/s]

                   all        176        146          1      0.993      0.995      0.966          1      0.993      0.995      0.929






      Epoch    GPU_mem   box_loss   seg_loss   cls_loss   dfl_loss  Instances       Size


    100/100      3.98G     0.2622     0.4239     0.1942     0.7984          7        640: 100%|██████████| 88/88 [00:18<00:00,  4.78it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:02<00:00,  5.30it/s]

                   all        176        146      0.999      0.993      0.995      0.966      0.999      0.993      0.995      0.922






100 epochs completed in 0.608 hours.
Optimizer stripped from YOLOv8_Thyroid_Runs/thyroid_seg_finetune/weights/last.pt, 23.9MB
Optimizer stripped from YOLOv8_Thyroid_Runs/thyroid_seg_finetune/weights/best.pt, 23.9MB

Validating YOLOv8_Thyroid_Runs/thyroid_seg_finetune/weights/best.pt...
Ultralytics 8.3.127 🚀 Python-3.11.12 torch-2.6.0+cu124 CUDA:0 (Tesla T4, 15095MiB)
YOLOv8s-seg summary (fused): 85 layers, 11,779,987 parameters, 0 gradients, 42.4 GFLOPs


                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 11/11 [00:04<00:00,  2.52it/s]


                   all        176        146          1      0.993      0.995      0.966          1      0.993      0.995       0.93
Speed: 0.2ms preprocess, 6.3ms inference, 0.0ms loss, 3.6ms postprocess per image
Results saved to [1mYOLOv8_Thyroid_Runs/thyroid_seg_finetune[0m
--- Addestramento Completato ---


In [19]:
!unrar x datasetTest.rar datasetTest


UNRAR 6.11 beta 1 freeware      Copyright (c) 1993-2022 Alexander Roshal


Extracting from datasetTest.rar

Creating    datasetTest                                               OK
Creating    datasetTest/groundtruth01                                 OK
Extracting  datasetTest/groundtruth01/unogt100.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt140.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt141.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt142.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt143.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt144.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt145.jpeg                        0%  OK 
Extracting  datasetTest/groundtruth01/unogt146.jpeg                        0%  OK 
Extractin

In [None]:
# il comando import importa moduli e pacchetti in Python.
'''
questo script serve a preprocessare i dati per la creazione di un dataset di test
per un modello YOLO (You Only Look Once) per la rilevazione di oggetti,
in questo caso per la tiroide.
Le immagini originali sono .jpg, le maschere sono .jpeg.
'''
#Importa la libreria OpenCV (cv2), utilizzata per l'elaborazione di immagini e video.
import cv2
#Importa la libreria NumPy e le assegna l'alias 'np'. NumPy è fondamentale per il calcolo numerico e la manipolazione di array.
import numpy as np
#Importa il modulo 'os', che fornisce funzioni per interagire con il sistema operativo, come la gestione di percorsi e directory.
import os
#Importa il modulo 'glob', utilizzato per trovare tutti i nomi di percorso che corrispondono a un pattern specificato.
import glob
#Dalla libreria Scikit-learn (sklearn), importa la funzione 'train_test_split', utile per suddividere i dati in set di addestramento e validazione.
# from sklearn.model_selection import train_test_split # Non più necessario per solo test set
#Importa la libreria 'yaml', utilizzata per leggere e scrivere file in formato YAML (YAML Ain't Markup Language), spesso usato per file di configurazione.
import yaml
#Importa il modulo 'shutil', che offre operazioni su file e collezioni di file di alto livello, come la copia e la rimozione di alberi di directory. Il commento originale indica già il suo uso per copiare i file.
import shutil
#Importa il modulo 're', che fornisce supporto per le espressioni regolari, utili per la ricerca e la manipolazione di stringhe basate su pattern.
import re

# --- CONFIGURAZIONE ---
base_dataset_folder = 'datasetTest' # Cartella che contiene 'originali01', 'groundtruth01' etc. del test set
yolo_dataset_folder = 'yolo_thyroid_dataset_test' # Cartella di output con file postprocess per il test set di YOLO
yaml_output_filename = 'data_test.yaml' # Nome del file YAML per il test set

# Definisci la regola per trovare la maschera dall'immagine originale
# Esempio: se l'immagine è 'datasetTest/originali01/uno100.jpg', la maschera è 'datasetTest/groundtruth01/unogt100.jpeg'
def get_mask_path(image_path):
    '''
    Firma della funzione: get_mask_path(image_path)
    - def: Parola chiave che definisce una funzione.
    - get_mask_path: Nome della funzione.
    - image_path: Parametro in input. È una stringa che rappresenta il percorso completo di un file immagine originale.
    Scopo: Questa funzione costruisce e restituisce il percorso presunto del file maschera corrispondente all'immagine fornita.
            Si basa su una convenzione specifica di denominazione e struttura delle cartelle:
            1. Estrae il numero identificativo dalla cartella dell'immagine originale (es. '01' da 'originali01').
            2. Usa questo numero per formare il nome della cartella delle maschere (es. 'groundtruth01').
            3. Modifica il nome del file immagine (es. sostituendo 'uno' con 'unogt') per ottenere il nome del file maschera.
            4. Assicura che l'estensione del file maschera sia .jpeg.
    Ritorna: Una stringa con il percorso completo al file maschera se la logica ha successo, altrimenti None se non è possibile determinare il percorso (es. se il numero della cartella non viene trovato).
    '''
    #Divide il percorso dell'immagine ('image_path') in una lista di componenti, utilizzando il separatore di directory specifico del sistema operativo (os.sep, es. '/' o '\').
    parts = image_path.split(os.sep)
    #Estrae l'ultimo elemento della lista 'parts', che corrisponde al nome del file con estensione (es. 'uno100.jpg').
    filename_orig_ext = parts[-1]
    # Estrai il numero dalla cartella originale (es. '01' da 'originali01')
    folder_name = parts[-2]
    #Utilizza un'espressione regolare (re.search) per trovare una sequenza di una o più cifre ('\d+') alla fine ('$') del nome della cartella ('folder_name').
    folder_num_match = re.search(r'\d+$', folder_name)
    #Controlla se l'espressione regolare ha trovato una corrispondenza (cioè, se è stato trovato un numero alla fine del nome della cartella).
    if folder_num_match:
        #Se una corrispondenza è stata trovata, 'folder_num_match.group()' restituisce la stringa corrispondente (es. '01').
        folder_num = folder_num_match.group()
        #Costruisce il nome della cartella delle maschere anteponendo 'groundtruth' al numero estratto (es. 'groundtruth01').
        mask_folder = f'groundtruth{folder_num}'

        # Estrai il nome base del file originale SENZA la sua estensione originale
        original_base_name, original_ext = os.path.splitext(filename_orig_ext) # es. filename_orig_ext='uno100.jpg' -> original_base_name='uno100'

        # Crea il nome base del file maschera (es. sostituendo 'uno' con 'unogt' se presente)
        mask_base_name = original_base_name.replace('uno', 'unogt')

        # *** Forza l'estensione del file maschera a .jpeg ***
        mask_filename_with_jpeg_ext = f"{mask_base_name}.jpeg"

        #Combina il percorso base del dataset, la cartella della maschera calcolata e il nome del file maschera calcolato per formare il percorso completo del file maschera, e lo restituisce.
        return os.path.join(os.path.dirname(os.path.dirname(image_path)), mask_folder, mask_filename_with_jpeg_ext)
    else:
        #Se l'espressione regolare non ha trovato un numero alla fine del nome della cartella.
        print(f"Attenzione: Impossibile determinare la cartella groundtruth per {image_path}")
        #Restituisce None per segnalare che il percorso della maschera non è stato trovato.
        return None

# Classe target (solo una: tiroide)
class_index = 0
class_name = 'thyroid'
# --- FINE CONFIGURAZIONE ---

print(f"Cartella dataset originale (test set): {os.path.abspath(base_dataset_folder)}")
print(f"Cartella dataset YOLO di output (test set): {os.path.abspath(yolo_dataset_folder)}")

# Pulisci la cartella di output se esiste già (opzionale, ma utile in Colab)
if os.path.exists(yolo_dataset_folder):
    print(f"Rimuovo la cartella YOLO (test) esistente: {yolo_dataset_folder}")
    shutil.rmtree(yolo_dataset_folder)

'''
Crea le cartelle necessarie per il test set di YOLO
le cartelle sono:
- images/test: per le immagini di test
- labels/test: per le etichette di test
'''
os.makedirs(os.path.join(yolo_dataset_folder, 'images', 'test'), exist_ok=True)
os.makedirs(os.path.join(yolo_dataset_folder, 'labels', 'test'), exist_ok=True)

print("Struttura cartelle YOLO per il test set creata.")

#Inizializza una lista vuota chiamata 'all_image_paths' che conterrà i percorsi di tutte le immagini originali trovate.
all_image_paths = []
# Trova tutte le immagini nelle cartelle 'originali*'
#Itera su tutte le cartelle all'interno di 'base_dataset_folder' il cui nome inizia con 'originali' (es. 'originali01', 'originali02').
for original_folder in glob.glob(os.path.join(base_dataset_folder, 'originali*')):
    # L'utente ha specificato che le immagini originali sono .jpg
    all_image_paths.extend(glob.glob(os.path.join(original_folder, '*.jpg')))
    # Manteniamo la flessibilità per altre estensioni se presenti, ma la priorità è .jpg per originali
    all_image_paths.extend(glob.glob(os.path.join(original_folder, '*.jpeg')))
    all_image_paths.extend(glob.glob(os.path.join(original_folder, '*.png')))

print(f"Trovate {len(all_image_paths)} immagini originali candidate nel test set.")

#Inizializza una lista vuota chiamata 'image_mask_pairs' per memorizzare le coppie di percorsi (immagine originale, maschera corrispondente).
image_mask_pairs = []
#Itera su ciascun percorso di immagine trovato e memorizzato in 'all_image_paths'.
for img_path in all_image_paths:
    #Chiama la funzione 'get_mask_path' per ottenere il percorso della maschera corrispondente all'immagine corrente.
    mask_path = get_mask_path(img_path)
    # Aggiungi solo se get_mask_path ha restituito un percorso valido e se esiste
    #Controlla due condizioni: 1) 'mask_path' non è None (cioè la funzione ha restituito un percorso) E 2) il file specificato da 'mask_path' esiste effettivamente.
    if mask_path and os.path.exists(mask_path):
        #Se entrambe le condizioni sono vere, aggiunge una tupla (coppia) contenente il percorso dell'immagine e il percorso della maschera alla lista 'image_mask_pairs'.
        image_mask_pairs.append((img_path, mask_path))
    elif mask_path:
        #Se 'mask_path' è stato restituito (non è None) ma il file non esiste (la condizione 'os.path.exists(mask_path)' era falsa).
        print(f"Attenzione: Maschera non trovata per {img_path} al percorso calcolato {mask_path} (Verifica estensione e nome file maschera!)")
    else: # mask_path è None
        print(f"Attenzione: get_mask_path non ha restituito un percorso per {img_path}")


print(f"Trovate {len(image_mask_pairs)} coppie immagine-maschera valide nel test set.")

#Controlla se la lista 'image_mask_pairs' è vuota (cioè, non sono state trovate coppie valide).
if not image_mask_pairs:
    print("Nessuna coppia immagine-maschera trovata. Controlla i percorsi, la funzione get_mask_path e le estensioni dei file.")
#else:
    # Non c'è suddivisione train/val, tutte le coppie sono per il test set

def process_dataset_split(pairs, split_name):
    '''
    Firma della funzione: process_dataset_split(pairs, split_name)
    - process_dataset_split: Nome della funzione.
    - pairs: Parametro in input. È una lista di tuple, dove ogni tupla contiene due stringhe: (percorso_immagine_originale, percorso_maschera_corrispondente).
    - split_name: Parametro in input. È una stringa che indica il nome del set di dati che si sta processando (es. "test").
    Scopo: Questa funzione elabora un insieme di coppie immagine-maschera per un determinato split.
            Per ogni coppia:
            1. Costruisce nuovi nomi per l'immagine e il file di etichetta, includendo un numero derivato dalla sottocartella originale per garantire unicità.
            2. Copia l'immagine originale nella sottocartella 'images/<split_name>' della directory YOLO con il nuovo nome.
            3. Legge l'immagine della maschera, la binarizza e trova i contorni della regione di interesse (es. la tiroide).
            4. Normalizza le coordinate dei punti del contorno rispetto alle dimensioni dell'immagine (valori tra 0 e 1).
            5. Salva i contorni normalizzati in un file di testo (formato etichetta YOLO) nella sottocartella 'labels/<split_name>' con il nuovo nome.
    Ritorna: Nulla (la funzione modifica il filesystem creando file e cartelle).
    '''
    print(f"\nInizio processamento per lo split: {split_name}")
    #Inizializza un contatore per le immagini processate con successo.
    processed_count = 0
    #Inizializza un contatore per i file saltati a causa dell'impossibilità di estrarre il numero della sottocartella.
    skipped_no_folder_num = 0

    #Itera su ogni tupla (percorso immagine, percorso maschera) nella lista 'pairs'.
    for img_path, mask_path in pairs:
        #Inizia un blocco try-except per gestire potenziali errori durante l'elaborazione di una singola coppia immagine-maschera.
        try:
            # --- Estrai informazioni per il nuovo nome ---
            #Estrae il nome base del file originale dell'immagine (es. "uno100.jpg") dal suo percorso completo.
            original_base_filename_with_ext = os.path.basename(img_path)
            #Separa il nome base del file nella sua parte nominale (es. "uno100") e la sua estensione (es. ".jpg").
            name_part, extension = os.path.splitext(original_base_filename_with_ext)

            # Divide il percorso completo dell'immagine originale nei suoi componenti.
            parts = img_path.split(os.sep)
            #Estrae il nome della cartella che contiene l'immagine (es. 'originali01').
            folder_name = parts[-2]
            #Utilizza un'espressione regolare per trovare una sequenza di cifre alla fine del nome della cartella.
            folder_num_match = re.search(r'\d+$', folder_name)

            #Se l'espressione regolare non trova un numero alla fine del nome della cartella.
            if not folder_num_match:
                print(f"Attenzione: Impossibile estrarre il numero dalla cartella '{folder_name}' per l'immagine {img_path}. Salto questo file.")
                #Incrementa il contatore dei file saltati per questo motivo.
                skipped_no_folder_num += 1
                #Interrompe l'iterazione corrente del ciclo e passa alla prossima coppia immagine-maschera.
                continue

            #Estrae la stringa numerica trovata (es. '01').
            subfolder_num_str = folder_num_match.group()

            # Costruisci i nuovi nomi dei file
            new_base_filename = f"{name_part}_{subfolder_num_str}{extension}" # Es: uno140_01.jpg (mantiene l'estensione originale dell'immagine)
            #Costruisce il nuovo nome del file etichetta, usando la stessa base del nuovo nome immagine ma con estensione ".txt" (es. "uno140_01.txt").
            new_label_filename = f"{name_part}_{subfolder_num_str}.txt"

            # --- Processa Immagine ---
            # Legge l'immagine originale dal percorso 'img_path' utilizzando OpenCV. 'img' sarà un array NumPy.
            img = cv2.imread(img_path)
            #Controlla se il caricamento dell'immagine è fallito (imread restituisce None in caso di errore).
            if img is None:
                print(f"Errore nel leggere l'immagine: {img_path}")
                #Salta all'iterazione successiva del ciclo.
                continue
            #Estrae altezza ('img_height') e larghezza ('img_width') dell'immagine dalle dimensioni dell'array NumPy ('img.shape').
            img_height, img_width = img.shape[:2]

            # Definisci il percorso di destinazione con il NUOVO nome
            yolo_img_path = os.path.join(yolo_dataset_folder, 'images', split_name, new_base_filename)
            #Copia il file immagine originale ('img_path') nella nuova posizione ('yolo_img_path'). 'copy2' tenta di preservare anche i metadati del file.
            shutil.copy2(img_path, yolo_img_path)

            # --- Processa Maschera e Crea Etichetta .txt ---
            #Legge l'immagine della maschera dal percorso 'mask_path' in scala di grigi (cv2.IMREAD_GRAYSCALE).
            mask = cv2.imread(mask_path, cv2.IMREAD_GRAYSCALE)
            #Controlla se il caricamento della maschera è fallito.
            if mask is None:
                print(f"Errore nel leggere la maschera: {mask_path} (associata a {img_path})")
                #Se l'immagine era già stata copiata ma la sua maschera non è leggibile, rimuove l'immagine copiata per mantenere la coerenza.
                if os.path.exists(yolo_img_path): os.remove(yolo_img_path)
                #Salta all'iterazione successiva.
                continue

            #Applica una binarizzazione alla maschera. I pixel con valore > 60 diventano 255 (bianco), gli altri 0 (nero). Il primo valore restituito ('_') è la soglia usata, non ci serve quindi usiamo il simbolo '_' per ignorarlo.
            _, mask_binary = cv2.threshold(mask, 60, 255, cv2.THRESH_BINARY)

            #Trova i contorni nell'immagine della maschera binarizzata.
            contours, hierarchy = cv2.findContours(mask_binary, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

            #Costruisce il percorso completo per il file di etichetta .txt nella struttura YOLO, usando il nuovo nome file.
            yolo_label_path = os.path.join(yolo_dataset_folder, 'labels', split_name, new_label_filename)

            #Apre il file di etichetta in modalità scrittura ('w'). Il costrutto 'with' assicura che il file venga chiuso automaticamente. 'f' è l'oggetto file.
            with open(yolo_label_path, 'w') as f:
                #Inizializza un contatore per i contorni validi (quelli che soddisfano i criteri di dimensione/area) trovati in questa maschera.
                valid_contours_found = 0
                #Itera su ciascun contorno trovato nell'immagine della maschera.
                for contour in contours:
                    #Applica filtro su punti E area (opzionale ma consigliato)
                    min_contour_area = 5 # Ignora contorni con area < 5 pixel
                    #Controlla se il contorno è valido:
                    if contour.size >= 6 and cv2.contourArea(contour) > min_contour_area:
                        #'contour.flatten()' converte l'array del contorno in un array monodimensionale [x1,y1,x2,y2,...].
                        normalized_contour = contour.flatten().astype(float)
                        #Normalizza le coordinate x (elementi a indice pari: 0, 2, 4, ...) dividendo per la larghezza dell'immagine.
                        normalized_contour[0::2] /= img_width
                        #normalizza le coordinate y (elementi a indice dispari: 1, 3, 5, ...) dividendo per l'altezza dell'immagine.
                        normalized_contour[1::2] /= img_height
                        #Assicura che tutte le coordinate normalizzate siano strettamente comprese tra 0 e 1.
                        normalized_contour = np.clip(normalized_contour, 0.00001, 0.99999)
                        #Converte ogni coordinata normalizzata in una stringa formattata con 6 cifre decimali e poi unisce tutte queste stringhe con uno spazio.
                        contour_str = ' '.join(map(lambda x: f"{x:.6f}", normalized_contour))
                        #Scrive una riga nel file di etichetta.
                        f.write(f"{class_index} {contour_str}\n")
                        #Incrementa il contatore dei contorni validi.
                        valid_contours_found += 1
                #Se sono stati trovati dei contorni ma nessuno valido.
                if contours and valid_contours_found == 0:
                    print(f"Info: Trovati contorni in {mask_path}, ma nessuno era valido (>=3 punti e area > {min_contour_area}). File {new_label_filename} creato vuoto.")
                #Se non è stato trovato alcun contorno.
                elif not contours:
                    print(f"Info: Nessun contorno trovato in {mask_path}. File {new_label_filename} creato vuoto.")
                    pass

            #Incrementa il contatore delle immagini processate con successo in questo split.
            processed_count += 1
            #Controlla se il numero di immagini processate è un multiplo di 50.
            if processed_count % 50 == 0: # Stampa ogni 50 immagini
                print(f"   Processate {processed_count}/{len(pairs)} immagini per lo split {split_name}...")

        #Se si verifica un qualsiasi altro errore non gestito specificamente nel blocco 'try'. 'e' contiene l'oggetto eccezione.
        except Exception as e:
            print(f"Errore grave durante il processamento di {img_path} o {mask_path}: {e}")

    print(f"Fine processamento per lo split: {split_name}. Immagini processate correttamente: {processed_count}.")
    #Se alcuni file sono stati saltati a causa del problema con il numero della sottocartella.
    if skipped_no_folder_num > 0:
        print(f"Attenzione: {skipped_no_folder_num} file sono stati saltati perché non è stato possibile estrarre il numero della sottocartella.")


# Processa tutte le coppie trovate come 'test' set
if image_mask_pairs:
    process_dataset_split(image_mask_pairs, 'test')
else:
    print("Nessuna coppia immagine-maschera da processare per il test set.")


# Crea il dizionario per il file YAML del test set
yaml_data = {
    'test': os.path.abspath(os.path.join(yolo_dataset_folder, 'images', 'test')),
    'train': os.path.abspath(os.path.join(yolo_dataset_folder, 'images', 'test')),
    'val': os.path.abspath(os.path.join(yolo_dataset_folder, 'images', 'test')),
    'nc': 1, # Numero di classi
    'names': [class_name] # Lista dei nomi delle classi
}

#Costruisce il percorso completo per il file yaml_output_filename all'interno della cartella del dataset YOLO di test.
yaml_path = os.path.join(yolo_dataset_folder, yaml_output_filename)
#Apre il file YAML in modalità scrittura ('w').
with open(yaml_path, 'w') as f:
    #Scrive il contenuto del dizionario 'yaml_data' nel file 'f' in formato YAML.
    yaml.dump(yaml_data, f, default_flow_style=False, sort_keys=False)

print(f"\nFile {yaml_output_filename} creato in: {yaml_path}")
print(f"Contenuto del {yaml_output_filename}:")
with open(yaml_path, 'r') as f:
    print(f.read())

print(f"\nPreprocessing per il test set completato! La cartella '{yolo_dataset_folder}' contiene le immagini e le etichette per il test ed è pronta per la valutazione YOLO.")

Cartella dataset originale (test set): /content/datasetTest
Cartella dataset YOLO di output (test set): /content/yolo_thyroid_dataset_test
Rimuovo la cartella YOLO (test) esistente: yolo_thyroid_dataset_test
Struttura cartelle YOLO per il test set creata.
Trovate 330 immagini originali candidate nel test set.
Trovate 330 coppie immagine-maschera valide nel test set.

Inizio processamento per lo split: test
Info: Nessun contorno trovato in datasetTest/groundtruth15/unogt230.jpeg. File uno230_15.txt creato vuoto.
Info: Nessun contorno trovato in datasetTest/groundtruth15/unogt228.jpeg. File uno228_15.txt creato vuoto.
Info: Nessun contorno trovato in datasetTest/groundtruth15/unogt226.jpeg. File uno226_15.txt creato vuoto.
Info: Nessun contorno trovato in datasetTest/groundtruth15/unogt229.jpeg. File uno229_15.txt creato vuoto.
Info: Nessun contorno trovato in datasetTest/groundtruth15/unogt223.jpeg. File uno223_15.txt creato vuoto.
Info: Nessun contorno trovato in datasetTest/groundtrut

In [31]:
from ultralytics import YOLO
import torch
import os
import pandas as pd # Importa pandas
import numpy as np  # Importa numpy per np.number
import traceback    # Per un debug più dettagliato

# --- Configurazione ---
PATH_AL_FILE_YAML_DEL_TEST_SET = '/content/yolo_thyroid_dataset_test/data_test.yaml' # Assicurati che questo YAML usi PERCORSI ASSOLUTI
PATH_AI_PESI_FINETUNED = 'best.pt'
OUTPUT_EXCEL_FILE = 'risultati_valutazione_yolo_finetuned.xlsx'

IMG_SIZE = 640
BATCH_SIZE = 8
CONF_THRESHOLD = 0.25
IOU_THRESHOLD = 0.5
DEVICE = torch.device('cuda' if torch.cuda.is_available() else 'cpu')

# Lista per conservare i dati per Excel
excel_data_rows = []

# Verifica l'esistenza del file YAML
if not os.path.exists(PATH_AL_FILE_YAML_DEL_TEST_SET):
    print(f"ERRORE: File YAML del test set non trovato in '{PATH_AL_FILE_YAML_DEL_TEST_SET}'")
    exit()
else:
    print(f"File YAML del test set trovato: '{PATH_AL_FILE_YAML_DEL_TEST_SET}'. Assicurati che usi percorsi assoluti per i dataset.")

# --- Valutare il tuo modello fine-tuned (best.pt) sul tuo test set ---
print(f"\n\n--- Inizio Valutazione del Modello Fine-tuned ({PATH_AI_PESI_FINETUNED}) sul Test Set ---")
metrics_finetuned_data_for_excel = {"Modello": PATH_AI_PESI_FINETUNED, "Numero Immagini": 'N/A'} # Inizializza

if not os.path.exists(PATH_AI_PESI_FINETUNED):
    print(f"ERRORE: File dei pesi fine-tuned non trovato in '{PATH_AI_PESI_FINETUNED}'")
    metrics_finetuned_data_for_excel["mAP@0.5:0.95 (seg)"] = "Pesi non trovati"
    metrics_finetuned_data_for_excel["mAP@0.5 (seg)"] = "Pesi non trovati"
    metrics_finetuned_data_for_excel["Precision (seg)"] = "Pesi non trovati"
    metrics_finetuned_data_for_excel["Recall (seg)"] = "Pesi non trovati"
    excel_data_rows.append(metrics_finetuned_data_for_excel)
else:
    try:
        model_finetuned = YOLO(PATH_AI_PESI_FINETUNED)
        model_finetuned.to(DEVICE)

        print(f"Avvio di model.val() per il modello fine-tuned...")
        metrics_finetuned_obj = model_finetuned.val(
            data=PATH_AL_FILE_YAML_DEL_TEST_SET, # Assicurati che questo YAML usi percorsi assoluti
            imgsz=IMG_SIZE,
            batch=BATCH_SIZE,
            conf=CONF_THRESHOLD,
            iou=IOU_THRESHOLD,
            split='test',
            device=DEVICE,
            project='YOLOv8_Finetuned_Eval_Runs', # I risultati di questa esecuzione verranno salvati qui
            name='eval_finetuned_thyroid_test'  # Puoi cambiare questo nome per ogni esecuzione se vuoi tenere traccia
        )

        print("\n--- Risultati Valutazione Modello Fine-tuned (da results_dict) ---")

        if hasattr(metrics_finetuned_obj, 'results_dict'):
            results_d_finetuned = metrics_finetuned_obj.results_dict

            # Estrai il numero di immagini
            num_images_finetuned = metrics_finetuned_obj.dataset.len if hasattr(metrics_finetuned_obj, 'dataset') and hasattr(metrics_finetuned_obj.dataset, 'len') else 'N/A'
            if num_images_finetuned == 'N/A':
                 # Fallback se .dataset.len non è disponibile (es. da output precedente 330)
                 # Potresti inserire un valore noto o lasciare 'N/A'
                 print("Numero immagini non trovato tramite metrics_finetuned_obj.dataset.len. Controlla output della tabella YOLO.")


            metrics_finetuned_data_for_excel["Numero Immagini"] = num_images_finetuned
            metrics_finetuned_data_for_excel["mAP@0.5:0.95 (seg)"] = results_d_finetuned.get('metrics/mAP50-95(M)')
            metrics_finetuned_data_for_excel["mAP@0.5 (seg)"] = results_d_finetuned.get('metrics/mAP50(M)')
            metrics_finetuned_data_for_excel["Precision (seg)"] = results_d_finetuned.get('metrics/precision(M)')
            metrics_finetuned_data_for_excel["Recall (seg)"] = results_d_finetuned.get('metrics/recall(M)')

            # Stampa le metriche che andranno in Excel
            for key, value in metrics_finetuned_data_for_excel.items():
                if isinstance(value, (float, np.number)):
                     print(f"  {key}: {value:.4f}")
                else:
                     print(f"  {key}: {value}")

            excel_data_rows.append(metrics_finetuned_data_for_excel)
        else:
            print("  ERRORE: metrics_finetuned_obj.results_dict non trovato. Impossibile estrarre le metriche.")
            metrics_finetuned_data_for_excel["mAP@0.5:0.95 (seg)"] = "Errore (no results_dict)"
            metrics_finetuned_data_for_excel["mAP@0.5 (seg)"] = "Errore (no results_dict)"
            metrics_finetuned_data_for_excel["Precision (seg)"] = "Errore (no results_dict)"
            metrics_finetuned_data_for_excel["Recall (seg)"] = "Errore (no results_dict)"
            excel_data_rows.append(metrics_finetuned_data_for_excel)


    except Exception as e:
        print(f"Errore GRAVE durante la valutazione del modello fine-tuned: {e}")
        traceback.print_exc()
        metrics_finetuned_data_for_excel["mAP@0.5:0.95 (seg)"] = "Errore (eccezione)"
        metrics_finetuned_data_for_excel["mAP@0.5 (seg)"] = "Errore (eccezione)"
        metrics_finetuned_data_for_excel["Precision (seg)"] = "Errore (eccezione)"
        metrics_finetuned_data_for_excel["Recall (seg)"] = "Errore (eccezione)"
        excel_data_rows.append(metrics_finetuned_data_for_excel)

# --- Salvataggio in Excel ---
if excel_data_rows:
    df = pd.DataFrame(excel_data_rows)
    # Definisci l'ordine desiderato delle colonne
    col_order = ["Modello", "Numero Immagini", "mAP@0.5:0.95 (seg)", "mAP@0.5 (seg)", "Precision (seg)", "Recall (seg)"]
    # Filtra le colonne per mantenere solo quelle presenti nel DataFrame e nell'ordine specificato
    df_cols_existing = [col for col in col_order if col in df.columns]
    df = df[df_cols_existing]

    try:
        df.to_excel(OUTPUT_EXCEL_FILE, index=False, engine='openpyxl')
        print(f"\nMetriche del modello fine-tuned salvate con successo nel file Excel: '{OUTPUT_EXCEL_FILE}'")
    except Exception as e:
        print(f"\nErrore durante il salvataggio del file Excel: {e}")
        print("Assicurati di avere installato 'openpyxl': pip install openpyxl")
else:
    print("\nNessun dato di metrica del modello fine-tuned da salvare nel file Excel.")

print("\n--- Valutazione Completata ---")

File YAML del test set trovato: '/content/yolo_thyroid_dataset_test/data_test.yaml'. Assicurati che usi percorsi assoluti per i dataset.


--- Inizio Valutazione del Modello Fine-tuned (best.pt) sul Test Set ---
Avvio di model.val() per il modello fine-tuned...
YOLOv8s-seg summary (fused): 85 layers, 11,779,987 parameters, 0 gradients, 42.4 GFLOPs
[34m[1mval: [0mFast image access ✅ (ping: 0.0±0.0 ms, read: 597.0±226.4 MB/s, size: 19.9 KB)


[34m[1mval: [0mScanning /content/yolo_thyroid_dataset_test/labels/test.cache... 330 images, 63 backgrounds, 0 corrupt: 100%|██████████| 330/330 [00:00<?, ?it/s]
                 Class     Images  Instances      Box(P          R      mAP50  mAP50-95)     Mask(P          R      mAP50  mAP50-95): 100%|██████████| 42/42 [00:05<00:00,  7.38it/s]


                   all        330        268      0.975       0.44      0.712      0.478      0.975       0.44      0.712      0.437
Speed: 0.7ms preprocess, 11.3ms inference, 0.0ms loss, 0.9ms postprocess per image
Results saved to [1mYOLOv8_Finetuned_Eval_Runs/eval_finetuned_thyroid_test8[0m

--- Risultati Valutazione Modello Fine-tuned (da results_dict) ---
Numero immagini non trovato tramite metrics_finetuned_obj.dataset.len. Controlla output della tabella YOLO.
  Modello: best.pt
  Numero Immagini: N/A
  mAP@0.5:0.95 (seg): 0.4375
  mAP@0.5 (seg): 0.7117
  Precision (seg): 0.9752
  Recall (seg): 0.4403

Metriche del modello fine-tuned salvate con successo nel file Excel: 'risultati_valutazione_yolo_finetuned.xlsx'

--- Valutazione Completata ---


In [32]:
! ls /content/yolo_thyroid_dataset_test/images/test/ | wc -l

330
