In [91]:
import torch
import torch.nn as nn
import torch.nn.functional as F
from torchvision import datasets
from torch.utils.data import DataLoader
from torchvision.transforms import ToTensor

In [92]:
# Charger les données d'entraînement
training_data = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor()
)

In [93]:
# Charger les données de test
test_data = datasets.FashionMNIST(
    root="data",
    train=False,
    download=True,
    transform=ToTensor()
)

In [94]:
image, label = training_data[0]

In [95]:
batch_size = 64

# Créer un chargeur de données pour les données d'entraînement
train_dataloader = DataLoader(training_data, batch_size=batch_size)

In [96]:
# Créer un chargeur de données pour les données de test
test_dataloader = DataLoader(test_data, batch_size=batch_size)

In [97]:
for images, labels in train_dataloader:
    # Traiter les images et les étiquettes ici
    pass


In [98]:
class NeuralNetwork(nn.Module):
    def __init__(self):
        super(NeuralNetwork, self).__init__()
        # Applatissez les images d'entrée 28x28 en un vecteur 1D de 784 caractéristiques
        self.flatten = nn.Flatten()
        # Définissez une pile séquentielle de couches entièrement connectées (linéaires) avec des activations ReLU
        self.linear_relu_stack = nn.Sequential(
            nn.Linear(28*28, 512), # Première couche cachée avec 512 unités
            nn.ReLU(),
            nn.Linear(512, 512),#  Deuxième couche cachée avec 512 unités
            nn.ReLU(),
            nn.Linear(512, 10), # Couche de sortie avec 10 unités (une pour chaque classe)
            nn.ReLU()
        )

    def forward(self, x):
        # Aplatir les images d'entrée
        x = self.flatten(x)
        # Faire passer les données à travers la pile linéaire ReLU
        logits = self.linear_relu_stack(x)
        return logits

In [99]:
model = NeuralNetwork()

# Exemple de prédiction sur un lot de données
images, labels = next(iter(train_dataloader))
output = model(images)
_, predictions = torch.max(output, dim=1)


In [100]:
learning_rate = 1e-3
batch_size = 64
epochs = 20

# Définir la fonction de perte et l'optimiseur
loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.SGD(model.parameters(), lr=learning_rate)

In [101]:
# Boucle d'entraînement
for epoch in range(epochs):
    for images, labels in train_dataloader:
        # Calculer les prédictions du modèle
        output = model(images)
        loss = loss_fn(output, labels)

        # Mettre à jour les poids du modèle
        optimizer.zero_grad()
        loss.backward()
        optimizer.step()

In [102]:
# Passer en mode d'évaluation
model.eval()

# Prédire les classes des images de test
with torch.no_grad():
    correct = 0
    total = 0
    for images, labels in test_dataloader:
        output = model(images)
        _, predictions = torch.max(output, dim=1)
        total += labels.size(0)
        correct += (predictions == labels).sum().item()

    accuracy = 100 * correct / total
    print(f'Accuracy: {accuracy}%')

Accuracy: 54.64%


En ajoutant le caractère de soulignement (_) avant la variable predictions, vous indiquez à Python que vous ne souhaitez pas récupérer le premier élément du tuple renvoyé par torch.max, qui contient les valeurs maximales. À la place, vous ne récupérez que le second élément du tuple, qui contient les indices des valeurs maximales, c’est-à-dire les prédictions du modèle.