In [23]:
import os
import xml.etree.ElementTree as ET
from PIL import Image, ImageDraw

def parse_xml_annotation(xml_filepath):
    """Parse the XML annotation file and extract annotation information."""
    tree = ET.parse(xml_filepath)
    root = tree.getroot()
    
    microns_per_pixel = float(root.get('MicronsPerPixel'))
    regions = root.find('Annotation').find('Regions')
    
    return microns_per_pixel, regions

def get_image_filepath(annotation_filename, image_directory):
    """Construct the full path of the corresponding image file based on the annotation filename."""
    image_name = os.path.splitext(annotation_filename)[0] + '.tif'
    image_filepath = os.path.join(image_directory, image_name)
    return image_filepath

def draw_regions(image, regions, microns_per_pixel):
    """Draw annotated regions on the image."""
    draw = ImageDraw.Draw(image)
    
    for region in regions.findall('Region'):
        description = region.get('Description')
        vertices = [(float(vertex.get('X')) / microns_per_pixel, float(vertex.get('Y')) / microns_per_pixel) for vertex in region.findall('Vertices/Vertex')]
        draw.polygon(vertices, outline="red", fill='red')
        if description:
            draw.text((vertices[0][0], vertices[0][1]), description, fill="black")

def process_annotations(annotation_directory, image_directory, output_directory):
    """Process all annotation files in the specified directory."""
    os.makedirs(output_directory, exist_ok=True)
    
    for filename in os.listdir(annotation_directory):
        if filename.endswith(".xml"):
            xml_filepath = os.path.join(annotation_directory, filename)
            microns_per_pixel, regions = parse_xml_annotation(xml_filepath)
            
            image_filepath = get_image_filepath(filename, image_directory)
            
            if not os.path.exists(image_filepath):
                print(f"File immagine corrispondente non trovato per {filename}.")
                continue
            
            with Image.open(image_filepath) as img:
                image_width, image_height = img.size
                image = Image.new("RGB", (image_width, image_height), color="white")
                draw_regions(image, regions, microns_per_pixel)
                
                xml_filename = os.path.splitext(filename)[0]
                output_filepath = os.path.join(output_directory, xml_filename + '.png')
                image.save(output_filepath)

# Definizione dei percorsi delle directory
annotation_directory = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\labels MoNuSAC'
image_directory = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\images MoNuSAC'
output_directory = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\labelsPNGMoNuSAC'

# Elaborazione delle annotazioni
process_annotations(annotation_directory, image_directory, output_directory)


File immagine corrispondente non trovato per TCGA-E2-A108-01Z-00-DX1_001.xml.
File immagine corrispondente non trovato per TCGA-E2-A108-01Z-00-DX1_002.xml.
File immagine corrispondente non trovato per TCGA-E2-A108-01Z-00-DX1_003.xml.
File immagine corrispondente non trovato per TCGA-E2-A108-01Z-00-DX1_004.xml.
File immagine corrispondente non trovato per TCGA-E2-A108-01Z-00-DX1_005.xml.
File immagine corrispondente non trovato per TCGA-EW-A6SB-01Z-00-DX1_001.xml.
File immagine corrispondente non trovato per TCGA-EW-A6SB-01Z-00-DX1_002.xml.
File immagine corrispondente non trovato per TCGA-EW-A6SB-01Z-00-DX1_003.xml.
File immagine corrispondente non trovato per TCGA-EW-A6SB-01Z-00-DX1_004.xml.
File immagine corrispondente non trovato per TCGA-EW-A6SB-01Z-00-DX1_005.xml.


In [25]:
import os
from PIL import Image

# Definisci il percorso della directory contenente le immagini PNG
input_directory = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\labelsPNGMoNuSAC'

# Definisci il percorso della directory di output per le immagini in bianco e nero
output_directory = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\labelsMoNuSAC_BW'

# Assicurati che la directory di output esista, altrimenti creala
os.makedirs(output_directory, exist_ok=True)

# Scansiona tutti i file nella directory delle immagini PNG
for filename in os.listdir(input_directory):
    if filename.endswith(".png"):
        # Costruisci il percorso completo dell'immagine PNG
        input_filepath = os.path.join(input_directory, filename)
        
        # Carica l'immagine
        image = Image.open(input_filepath)
        
        # Converte l'immagine in scala di grigi
        image_gray = image.convert("L")
        
        # Inverti i colori (nero diventa bianco e viceversa)
        image_bw = image_gray.point(lambda x: 255 if x < 128 else 0, '1')
        
        # Salva l'immagine in bianco e nero nella directory di output
        output_filepath = os.path.join(output_directory, filename)
        image_bw.save(output_filepath)


In [29]:
import os

# Definisci il percorso della directory contenente le immagini PNG
input_directory = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\images MoNuSAC'

# Scansiona tutti i file nella directory delle immagini PNG
image_files = os.listdir(input_directory)
image_files.sort()  # Ordina i file per garantire una sequenza corretta

# Definisci il prefisso per i nuovi nomi delle immagini
prefix = "monusac_"
start_index = 1

# Rinomina tutte le immagini in sequenza a partire da monu_038.png
for i, filename in enumerate(image_files):
    if filename.endswith(".tif"):
        # Costruisci il nuovo nome del file
        new_filename = f"{prefix}{start_index + i:03d}.png"
        
        # Costruisci il percorso completo del file originale e del nuovo file
        old_filepath = os.path.join(input_directory, filename)
        new_filepath = os.path.join(input_directory, new_filename)
        
        # Rinomina il file
        os.rename(old_filepath, new_filepath)


In [17]:
import os
import numpy as np
from PIL import Image
import imgaug.augmenters as iaa
from imgaug.augmentables.segmaps import SegmentationMapsOnImage
import glob

# Definizione del percorso di input per le immagini e le etichette
input_dir_images = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\imagesTrAug'
input_dir_labels = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\labelsTrBW'

# Definizione del percorso di output per le immagini e le etichette
output_dir_images = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\imagesTrFinal'
output_dir_labels = r'C:\Users\utente\Desktop\Università\Tesi magistrale\FedMix\data\labelsTrFinal'

# Creazione della directory di output se non esiste già
os.makedirs(output_dir_images, exist_ok=True)
os.makedirs(output_dir_labels, exist_ok=True)

# Numero totale desiderato di immagini generate
total_images_desired = 700

# Definizione dell'augmenter con diverse trasformazioni
augmenter = iaa.Sequential([
    iaa.Affine(
        scale=(0.8, 1.2),  # Zoom in/out
        translate_percent={"x": (-0.2, 0.2), "y": (-0.2, 0.2)},  # Traslazione
        rotate=(-45, 45),  # Rotazione
        shear=(-16, 16),  # Shear
    ),
    iaa.Fliplr(0.5),  # Ribalta orizzontalmente con una probabilità del 50%
    iaa.Flipud(0.5),  # Ribalta verticalmente con una probabilità del 50%
    # Aggiungi altre trasformazioni desiderate qui
])

# Scansiona tutte le immagini nella directory di input
image_files = sorted(glob.glob(os.path.join(input_dir_images, 'monu_*.png')))
label_files = sorted(glob.glob(os.path.join(input_dir_labels, 'monu_*.png')))

# Contatore per il numero totale di immagini generate
total_images_created = 104  # Inizia da 104

# Applica la data augmentation alle immagini e alle etichette
for image_path, label_path in zip(image_files, label_files):
    # Carica l'immagine
    image = np.array(Image.open(image_path))
    # Carica l'etichetta di segmentazione
    label = np.array(Image.open(label_path))

    # Applica la data augmentation sia all'immagine che all'etichetta
    augmented = augmenter(image=image, segmentation_maps=SegmentationMapsOnImage(label, shape=image.shape))
    augmented_image = augmented[0]
    augmented_label = augmented[1].get_arr_int()  # Converti in array numpy

    # Salva le immagini risultanti
    Image.fromarray(augmented_image).save(os.path.join(output_dir_images, f"monu_{total_images_created:03d}.png"))
    Image.fromarray(augmented_label).save(os.path.join(output_dir_labels, f"monu_{total_images_created:03d}.png"))

    total_images_created += 1

    # Esci se il numero totale di immagini generate è raggiunto
    if total_images_created >= 200:
        break

print("Data augmentation completata.")


Data augmentation completata.
