# Semantic Segmantation for cars driving data

## Importing Data

In [25]:
import torch as tch
import numpy as np
import plotly.express as px
import os
import cv2
from pathlib import Path

### Loading and building data

#### Determining the size

The images do not have the same shape so we will crop it to the minimum for all dimensions.

In [26]:
dir = Path("%pwd").resolve().parent
path_data = dir / "data_semantics/training/image_2/"
path_data

WindowsPath('C:/Users/blidi/OneDrive/Bureau/projet/semantic_segmentation/data_semantics/training/image_2')

In [27]:
# Vecteur pour stocker les tailles minimales des images
min_image_sizes = []

# Parcours de chaque fichier dans le répertoire
for filename in os.listdir(path_data):
    # Vérifiez si le fichier est une image
    if filename.endswith('.jpg') or filename.endswith('.png'):
        # Construisez le chemin complet du fichier
        filepath = os.path.join(path_data, filename)
        # Utilisez la déclaration with pour ouvrir le fichier
        with open(filepath, 'rb') as f:    
            # Chargez l'image avec OpenCV
            img = cv2.imread(os.path.join(path_data, filename))
            # Convertissez l'image en BGR en RGB
            img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
            # Ajoutez la taille de l'image au vecteur des tailles minimales
            min_image_sizes.append(img.shape)

# Convertissez le vecteur des tailles minimales en un tenseur PyTorch
min_image_sizes = tch.tensor(min_image_sizes).min(0).values # don't need the indices
min_image_sizes

torch.return_types.min(
values=tensor([ 370, 1224,    3]),
indices=tensor([155, 155,   0]))

Same thing for the masks.

In [30]:
dir = Path("%pwd").resolve().parent
path_mask = dir / "data_semantics/training/semantic_rgb"
path_mask

WindowsPath('C:/Users/blidi/OneDrive/Bureau/projet/semantic_segmentation/data_semantics/training/semantic_rgb')

In [31]:
# Vecteur pour stocker les tailles minimales des images
min_mask_sizes = []

# Parcours de chaque fichier dans le répertoire
for filename in os.listdir(path_mask):
    # Vérifiez si le fichier est une image
    if filename.endswith('.jpg') or filename.endswith('.png'):
        # Construisez le chemin complet du fichier
        filepath = os.path.join(path_mask, filename)
        # Utilisez la déclaration with pour ouvrir le fichier
        with open(filepath, 'rb') as f:    
            # Chargez l'image avec OpenCV
            img = cv2.imread(os.path.join(path_mask, filename))
            # Convertissez l'image en BGR en RGB
            img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
            # Ajoutez la taille de l'image au vecteur des tailles minimales
            min_mask_sizes.append(img.shape)

# Convertissez le vecteur des tailles minimales en un tenseur PyTorch
min_mask_sizes = tch.tensor(min_mask_sizes).min(0).values # don't need the indices
min_mask_sizes

torch.return_types.min(
values=tensor([ 370, 1224,    3]),
indices=tensor([155, 155,   0]))

#### Cropping the images and building the tensor

In [None]:
# Liste pour stocker les images en tant que tenseurs
images_tensor = []

# Parcours de chaque fichier dans le répertoire
for filename in os.listdir(path_data):
    # Vérifiez si le fichier est une image
    if filename.endswith('.jpg') or filename.endswith('.png'):
        # Construisez le chemin complet du fichier
        filepath = os.path.join(path_data, filename)
        # Utilisez la déclaration with pour ouvrir le fichier
        with open(filepath, 'rb') as f:    
            # Chargez l'image avec OpenCV
            img = cv2.imread(os.path.join(path_data, filename))
            # Convertissez l'image en BGR en RGB
            img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)

            ### Add here the method to crop the images 
            # harsh one : pass every image to function (reduce_top = shape_img_H - min_H ; img=img[:,reduce_top:] ; same for the W)
            
            # if instructions to avoid passing the function on images that don't need to be cropped



            # Convertissez l'image en tenseur Pytorch
            img_tensor = tch.from_numpy(img)
            img_tensor = img_tensor.float() / 255.0  # Normalisez les valeurs des pixels entre 0 et 1
            # Ajoutez le tenseur de l'image à la liste
            images_tensor.append(img_tensor)

# Convertissez la liste de tenseurs en un seul tenseur contenant toutes les images
images_tensor = tch.stack(images_tensor, dim=0)