<a href="https://colab.research.google.com/github/MarzoliLeo/Challenge-LogoUnibo/blob/main/Challenge_LogoUnibo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Operazioni preliminari.
Unzippare i dataset zippati e importati nell'ambiente colab dal proprio file system.

In [2]:
import zipfile
import os

def extract_and_rename(zip_filename, target_directory):
    with zipfile.ZipFile(zip_filename, 'r') as zip_ref:
        zip_ref.extractall(target_directory)

# Estrarre il primo file ZIP in una directory chiamata directory1
extract_and_rename('/content/task_test-set-2023_12_04_21_10_14-yolo 1.1.zip', '/content/test-set-YOLO')

# Estrarre il secondo file ZIP in una directory chiamata directory2
extract_and_rename('/content/task_training-2023_12_04_21_10_08-yolo 1.1.zip', '/content/train-set-YOLO')



# Installare KerasCV
La libreria KerasCV mette a disposizione componenti specifiche per svolgere task di Computer Vision come modelli pre-addestrati, metriche e layer.

La cella seguente permette di installare l'ultima versione di KerasCV.

In [3]:
!pip install --upgrade -q git+https://github.com/keras-team/keras-cv

  Installing build dependencies ... [?25l[?25hdone
  Getting requirements to build wheel ... [?25l[?25hdone
  Preparing metadata (pyproject.toml) ... [?25l[?25hdone
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m950.8/950.8 kB[0m [31m13.0 MB/s[0m eta [36m0:00:00[0m
[?25h  Building wheel for keras-cv (pyproject.toml) ... [?25l[?25hdone


# Import delle librerie


In [5]:
import os
import tensorflow as tf
import numpy as np
import keras_cv
import cv2
import random
import math
from tensorflow import keras
from matplotlib import pyplot as plt

Using TensorFlow backend


# **Functioni di utilità per l'addestramento**
Tramite la cella sottostante è possibile definire alcune funzioni di utilità usate durante l'esercitazione:
- **plot_images_with_xywh_bounding_boxes** visualizza un *mini-batch* di immagini con le corrispondenti *bounding box*;
- **plot_images_with_y_preds** visulizza un *mini-batch* di immagini con le corrispondenti *prediction*;
- **parse_yolov8_annotation** legge da un file di testo le annotazioni di un'immagine nel formato YOLOv8;
- **load_dataset_info** carica in memoria i percorsi assoluti di tutte le immagini e le rispettive annotazioni di un dataset;
- **from_rel_xywh_to_xywh** converte le annotazioni dal formato relativo al formato assoluto date in input le dimensioni delle immagini;
- **load_dataset_element** carica in memoria un'immagine dato in input il percorso in cui è memorizzara e la associa alle corrispondenti *bounding box*;
- **prepare_dataset** prepara il dataset dato in input caricando le immangini e applicando alcune operazioni di preprocessing tra cui il ridimensionamento delle immagini alle dimensioni di input del modello;
- **plot_history** visualizza il grafico delle loss sui dataset di training e validation;
- **compute_mean_average_precision** calcola la *mean Average Precision* (mAP) date in input le *bounding box* vere e quelle predette dalla rete.

In [22]:
def plot_images_with_xywh_bounding_boxes(images, boxes, class_ids, class_labels, image_per_row=4, show_labels=True, confidences=None):
    class_colors = plt.cm.hsv(np.linspace(0, 1, len(class_labels)+1)).tolist()

    image_count = len(images)
    row_count = math.ceil(image_count/image_per_row)
    col_count = image_per_row

    _, axs = plt.subplots(nrows=row_count, ncols=col_count, figsize=(18, 4*row_count), squeeze=False)
    for r in range(row_count):
        for c in range(col_count):
            axs[r, c].axis('off')

    for i in range(image_count):
        r = i // image_per_row
        c = i % image_per_row

        image_path = train_image_path_list[i]
        axs[r, c].imshow(plt.imread(image_path))
        for box_idx in range(len(boxes[i])):
            box = boxes[i][box_idx]
            class_idx = class_ids[i][box_idx]
            color = class_colors[class_idx]
            xmin = box[0]
            ymin = box[1]
            w = box[2]
            h = box[3]
            axs[r, c].add_patch(plt.Rectangle((xmin, ymin), w, h, color=color, fill=False, linewidth=2))
            if show_labels:
                label = '{}'.format(class_labels[class_idx])
                if confidences is not None:
                    label += ' {:.2f}'.format(confidences[i][box_idx])
                axs[r, c].text(xmin, ymin, label, size='large', color='white', bbox={'facecolor': color, 'alpha': 1.0})



def plot_images_with_y_preds(images,y_preds,class_labels,image_per_row=4,show_labels=True):
  image_count=images.shape[0]
  plot_images_with_xywh_bounding_boxes(images,
                                      [y_preds['boxes'][i,:y_preds['num_detections'][i]] for i in range(image_count)],
                                      [y_preds['classes'][i,:y_preds['num_detections'][i]] for i in range(image_count)],
                                      class_labels,
                                      image_per_row=image_per_row,
                                      show_labels=show_labels,
                                      confidences=[y_preds['confidence'][i,:y_preds['num_detections'][i]] for i in range(image_count)])

def parse_yolov8_annotation(txt_file):
    yolov8_boxes = []
    class_ids = []
    with open(txt_file) as file:
      for line in file:
        splitted_line = line.split()
        class_ids.append(int(splitted_line[0]))
        rcx = float(splitted_line[1])
        rcy = float(splitted_line[2])
        rw = float(splitted_line[3])
        rh = float(splitted_line[4])
        rxmin=rcx-rw/2
        rymin=rcy-rh/2
        yolov8_boxes.append([rxmin, rymin, rw, rh]) #rel_xywh

    return yolov8_boxes, class_ids

def load_dataset_info(txt_file_list,image_path):
  image_path_list = []
  image_yolov8_box_list = []
  image_class_id_list = []
  for txt_file in txt_file_list:
      yolov8_boxes, class_ids = parse_yolov8_annotation(txt_file)
      image_path_list.append(image_path+os.path.basename(os.path.splitext(txt_file)[0])+'.jpg')
      image_yolov8_box_list.append(yolov8_boxes)
      image_class_id_list.append(class_ids)

  return image_path_list,image_yolov8_box_list,image_class_id_list

def from_rel_xywh_to_xywh(dataset_rel_xywh_bboxes,image_shape):
  image_height=image_shape[0]
  image_width=image_shape[1]

  dataset_xywh_bboxes=[]
  for image_bboxes in dataset_rel_xywh_bboxes:
    image_xywh_bboxes=[]
    for image_bbox in image_bboxes:
      xmin=image_bbox[0]*image_width
      ymin=image_bbox[1]*image_height
      w=image_bbox[2]*image_width
      h=image_bbox[3]*image_height
      image_xywh_bboxes.append([xmin, ymin, w, h])
    dataset_xywh_bboxes.append(image_xywh_bboxes)

  return dataset_xywh_bboxes

def load_dataset_element(image_path, bboxes,classes):
    image = tf.io.read_file(image_path)
    image = tf.image.decode_jpeg(image, channels=3)
    bounding_boxes = {
        'classes': tf.cast(classes, dtype=tf.float32),
        'boxes': bboxes,
    }
    return {'images': tf.cast(image, tf.float32), 'bounding_boxes': bounding_boxes}

def prepare_dataset(dataset,batch_size,model_input_size):
  resizer = keras.Sequential(layers=[keras_cv.layers.Resizing(model_input_size,model_input_size,pad_to_aspect_ratio=True,bounding_box_format='xywh')])

  ds = dataset.map(load_dataset_element, num_parallel_calls=tf.data.AUTOTUNE)
  ds = ds.shuffle(dataset.cardinality())
  ds = ds.ragged_batch(batch_size, drop_remainder=True)
  ds = ds.map(resizer, num_parallel_calls=tf.data.AUTOTUNE)
  ds = ds.map(lambda inputs: (inputs['images'], inputs['bounding_boxes']), num_parallel_calls=tf.data.AUTOTUNE)
  ds = ds.prefetch(tf.data.AUTOTUNE)
  return ds

def plot_history(history):
  fig, ax1 = plt.subplots(figsize=(10, 8))

  epoch_count=len(history.history['loss'])

  line1,=ax1.plot(range(1,epoch_count+1),history.history['loss'],label='train_loss',color='orange')
  ax1.plot(range(1,epoch_count+1),history.history['val_loss'],label='val_loss',color = line1.get_color(), linestyle = '--')
  ax1.set_xlim([1,epoch_count])
  ax1.set_ylim([0, max(max(history.history['loss']),max(history.history['val_loss']))])
  ax1.set_ylabel('loss',color = line1.get_color())
  ax1.tick_params(axis='y', labelcolor=line1.get_color())
  ax1.set_xlabel('Epochs')
  _=ax1.legend(loc='lower left')

def compute_mean_average_precision(y_true, y_pred):
  coco_metrics=keras_cv.metrics.BoxCOCOMetrics(bounding_box_format='xywh',evaluate_freq=1)
  coco_metrics.update_state(y_true, y_pred)
  return coco_metrics.result(force=True)['MaP'].numpy()

# YOLOv8
YOLOv8 è l'ultimo modello basato sull'architettura YOLO (You Only Look Once) in grado di individuare in tempo reale oggetti multipli all'interno di un'immagine con un elevato livello di accuratezza. Quest'ultima versione è in grado di supportare diversi tipi di task tra cui: detection, segmentazione e classificazione.

# Preparazione del dataset.
Ora facciamo una serie di operazioni per la preparazione del dataset.

In [15]:
# Classi del problema
chess_class_labels = ['none','logo']

#Imposto una dimensione fissa per le immagini.
original_image_size=(512,512)

# Percorsi in cui si trovano le immagini dei set di training, validation e test
train_path_images = '/content/train-set-YOLO/images/'
val_path_images = '/content/validation-set-YOLO/images/'
test_path_images = '/content/test-set-YOLO/images/'

# Percorsi in cui si trovano le annotazioni dei set di training, validation e test
train_path_annotations = '/content/train-set-YOLO//labels/'
val_path_annotations = '/content/validation-set-YOLO/labels/'
test_path_annotations = '/content/test-set-YOLO/labels/'

# Lista dei file delle annotazioni di training
train_txt_files = sorted(
    [
        os.path.join(train_path_annotations, file_name)
        for file_name in os.listdir(train_path_annotations)
        if file_name.endswith(".txt")
    ]
)

# Lista dei file delle annotazioni di validation
val_txt_files = sorted(
    [
        os.path.join(val_path_annotations, file_name)
        for file_name in os.listdir(val_path_annotations)
        if file_name.endswith(".txt")
    ]
)

# Lista dei file delle annotazioni di test
test_txt_files = sorted(
    [
        os.path.join(test_path_annotations, file_name)
        for file_name in os.listdir(test_path_annotations)
        if file_name.endswith(".txt")
    ]
)

print('Numero dei file di training: ',len(train_txt_files))
print('Numero dei file di validation: ',len(val_txt_files))
print('Numero dei file di test: ',len(test_txt_files))


Numero dei file di training:  40
Numero dei file di validation:  10
Numero dei file di test:  10


La cella sottostante permette di caricare in memoria i percorsi assoluti delle immagini e le rispettive annotazioni per i set di training, validation e test.

*   ..._image_path_list = è la lista con i percorsi assoluti delle immagini.
*   ..._yolov8_box_list = è la lista con le dimensioni dei box per la detection.
*   ..._class_id_list = è la lista con la classificiazione (none, logo)



In [16]:
train_image_path_list, train_yolov8_box_list, train_image_class_id_list = load_dataset_info(train_txt_files, train_path_images)
val_image_path_list, val_yolov8_box_list, val_image_class_id_list = load_dataset_info(val_txt_files, val_path_images)
test_image_path_list, test_yolov8_box_list, test_image_class_id_list = load_dataset_info(test_txt_files, test_path_images)

Il formato YOLOv8 con cui sono memorizzate le bounding box dei pezzi degli scacchi riporta  x ,  y ,  w  e  h  come valori relativi (nell'intervallo  [0;1] ) rispetto alla dimensione dell'immagine a cui sono associate.

La cella sottostante stampa a video i valori  (x,y,w,h)  in formato relativo della bounding box associata alla prima immagine del training set.

In [17]:
print(train_yolov8_box_list[0])

[[0.265039, 0.4981835, 0.430566, 0.425527]]


Ai fini dell'addestramento del modello e della visualizzazione dei risultati è conveniente convertire le *bounding box*  da valori relativi a valori assoluti nel formato **'xywh'**. Per fare ciò è sufficiente utilizzare la funzione di utilità **from_rel_xywh_to_xywh** passandogli in input, oltre alle *bounding box* nel formato YOLOv8, le dimensioni delle immagini del dataset ($512\times512$).

In [18]:
train_xywh_box_list=from_rel_xywh_to_xywh(train_yolov8_box_list,original_image_size)
val_xywh_box_list=from_rel_xywh_to_xywh(val_yolov8_box_list,original_image_size)
test_xywh_box_list=from_rel_xywh_to_xywh(test_yolov8_box_list,original_image_size)

La cella sottostante stampa a video i valori $(x,y,w,h)$ in formato assoluto della *bounding box* associata alla prima immagine del training set.

In [19]:
print(train_xywh_box_list[0])

[[135.699968, 255.069952, 220.449792, 217.869824]]


In [25]:
image_count=4
random_idx=random.randint(0,len(train_image_path_list)-image_count)

plot_images_with_xywh_bounding_boxes([plt.imread(train_image_path_list[i]) for i in range(random_idx,random_idx+image_count)],
                                     train_xywh_box_list[random_idx:random_idx+image_count],
                                     train_image_class_id_list[random_idx:random_idx+image_count],
                                     chess_class_labels,
                                     image_per_row=4,
                                     show_labels=False)

FileNotFoundError: ignored