In [97]:
import os
import pandas as pd
from PIL import Image
import torch
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms

In [99]:
# Chemin du dossier contenant les images
image_root = './archive/Train'  # Chemin relatif vers les images

# Liste pour stocker les données
data = []

# Parcourir les sous-dossiers (chaque sous-dossier représente une classe)
for class_id, class_name in enumerate(os.listdir(image_root)):
    class_dir = os.path.join(image_root, class_name)
    
    # Vérifier que c'est un dossier
    if os.path.isdir(class_dir):
        # Parcourir les images dans le dossier de la classe
        for image_name in os.listdir(class_dir):
            image_path = os.path.join(class_name, image_name)  # Chemin relatif de l'image
            data.append({'Path': image_path, 'ClassId': class_id})

# Créer un DataFrame à partir des données
df = pd.DataFrame(data)

# Sauvegarder le DataFrame en CSV
output_csv = './archive/image_labels.csv'
df.to_csv(output_csv, index=False)

print(f"Fichier CSV créé avec succès : {output_csv}")

Fichier CSV créé avec succès : ./archive/image_labels.csv


In [93]:
import os

img_path = "C:/Users/pc/Desktop/Twizzy/archive/Train/4/00004_00022_00021.png"  # Utilise le chemin complet
print(os.path.exists(img_path))  # Cela retournera True si le fichier existe, sinon False


True


In [101]:




# Charger le fichier CSV
train_csv = './archive/image_labels.csv'
train_labels = pd.read_csv(train_csv)

# Transformation des images (si nécessaire)
transform = transforms.Compose([
    transforms.Resize((64, 64)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])
])

# Créer un dataset personnalisé
class ImageDataset(Dataset):
    def __init__(self, root, labels, transform=None):
        self.root = root
        self.labels = labels
        self.transform = transform

    def __len__(self):
        return len(self.labels)

    def __getitem__(self, idx):
        img_path = os.path.join(self.root, self.labels.iloc[idx]['Path'])
        image = Image.open(img_path).convert('RGB')  # Ouvrir l'image et la convertir en RGB
        label = self.labels.iloc[idx]['ClassId']  # Récupérer l'étiquette

        if self.transform:
            image = self.transform(image)  # Appliquer les transformations (si présentes)

        return image, label

# Créer le dataset
train_dataset = ImageDataset(image_root, train_labels, transform=transform)

# Créer le DataLoader
train_loader = DataLoader(dataset=train_dataset, batch_size=128, shuffle=True)

# Vérifier les premières lignes du DataFrame des labels
print(train_labels.head())

# Vérifier si le DataLoader fonctionne
for images, labels in train_loader:
    print('Dimensions des images dans le batch:', images.shape)
    print('Dimensions des labels dans le batch:', labels.shape)
    break


                      Path  ClassId
0  1\00001_00000_00000.png        0
1  1\00001_00000_00001.png        0
2  1\00001_00000_00002.png        0
3  1\00001_00000_00003.png        0
4  1\00001_00000_00004.png        0
Dimensions des images dans le batch: torch.Size([128, 3, 64, 64])
Dimensions des labels dans le batch: torch.Size([128])
