In [13]:
from sklearn.model_selection import GridSearchCV
import torch
from torch.optim import Adam
from torch.optim.lr_scheduler import StepLR
from torch.nn import CrossEntropyLoss
from torch.utils.data import DataLoader

import numpy as np
import pandas as pd

# Chargement des données

In [4]:
#torch.utils.data.DataLoader récupère lui même les classes des images
#Il suffit juste que les données 
train = torchvision.datasets.ImageFolder(root='C:\\Users\\delpi\\Mon Drive\\COURS\\AgroParisTech\\3A IODAA\\Fil rouge\\CIRSE\\training', transform=transforms.ToTensor())
train_loader = torch.utils.data.DataLoader(train_data, batch_size=64, shuffle=True, num_workers=4)

test = torchvision.datasets.ImageFolder(root='C:\\Users\\delpi\\Mon Drive\\COURS\\AgroParisTech\\3A IODAA\\Fil rouge\\CIRSE\\test', transform=transforms.ToTensor())
test_loader = torch.utils.data.DataLoader(test_data, batch_size=64, shuffle=True, num_workers=4)

FileNotFoundError: Found no valid file for the classes neg, pos. Supported extensions are: .jpg, .jpeg, .png, .ppm, .bmp, .pgm, .tif, .tiff, .webp

# Création des modèles

Pour le moment, nous avons enlever juste le dernier neurone.
En fonction des résultats obtenus nous devrons probablement enlever quelques couches vers la fin.

## Fonction d'entrainement du modèle

In [6]:
def train(model, train_loader, optimizer, criterion):
    """
    Cette fonction permet d'entrainer un réseau de neuronne :
        -model : le réseau à entrainer
        -train_loader : le set d'entrainement (issus de torch.utils.data.DataLoader)
        -optimizer : choix de l'optimiseur
        -criterion : choix de la fonction de coût
    """
    model.train()
    for inputs, labels in train_loader:
        #réinitialisation du gradient
        optimizer.zero_grad()
        outputs = model(inputs)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

## Fonction pour valider le modèle

In [7]:
def validate(model, data, criterion):
    """
    Cette fonction permet de calculer la précision d'un modèle déja entrainé:
        -model : modèle pré-entrainé
        -data : set de donnée validation ou entrainement
        -criterion : la fonction de coût utilisé lors de l'apprentissage
    """
    model.eval()
    correct = 0
    total = 0
    with torch.no_grad():
        for inputs, labels in data:
            outputs = model(inputs)
            _, predicted = torch.max(outputs.data, 1)
            total += labels.size(0)
            correct += (predicted == labels).sum().item()
    val_acc = correct / total
    return val_acc

## Liste des modèles

In [9]:
# 2 sorties pour absence et présence de cirses
# Attention, il existe plusieurs versions de Resnet
# Il faudra problablement en essayant d'autre
model = torchvision.models.resnet18(pretrained=False, num_classes=2)



## Fonction pour tester les différents paramètres

In [19]:
def perf_evaluation(model,train, test, num_epochs, early_stopping_threshold, learning_rate, param_grid, criterion, optimizer, scheduler):
    
    """
    Cette fonction permet pour un modèle donner de faire un grid_search afin de determiner le step_size et le gamma
    à partir d'une liste. La fonction renvoi le modèle avec les meilleurs paramètres ainsi qu'une table de données
    avec les statistiques de perofrmance du modèle.
        -model : modèle a entrainer
        -train : 
        -test : 
        -num_epochs : le nombre d'epoques
        -early_stopping_threshold : le nombre d'époque minimum ou l'on n'observe aucune amèliariation des performances
        -learning_rate : 
        -param_grid : liste des step_size et gamma a tester
        -criterion : choix de la fonction de coût
        -optimizer : choix de l'optimiseur
        scheduler : 
    """

    counter = 0
    best_model_wts = model.state_dict()
    best_acc = 0.0
    
    epoch_list = []
    train_acc_list = []
    val_acc_list = []
    parameters_list = []
    time_list = []
    
    for epoch in range(num_epochs):
        
        start = time.time()
        train(model, train, optimizer, criterion)
        end = time.time()

        train_acc = validate(model, train, criterion)
        val_acc = validate(model, test, criterion)
        
        epoch_list.append(epoch)
        train_acc_list.append(train_acc)
        val_acc_list.append(val_acc)
        parameters_list.append(scheduler.get_params())
        time_list.append(round((end-start) * 10**3))
        
        grid_search.step()

        if val_acc > best_acc:
            best_acc = val_acc
            best_model_wts = model.state_dict()
            counter = 0
        else:
            counter += 1

        if counter >= early_stopping_threshold:
            print("Early stopping at epoch: ", epoch+1)
            break
            
    perf = pd.DataFrame({'epoch' : epoch_list,
                         'train_accuracy' : train_acc_list,
                         'validation_accuracy' : val_acc_list,
                         'parameters' : parameters_list,
                         'time_ms': time_list})
    
    return best_model_wts, perf

## Définition des paramètres à tester (gridsearch)

In [20]:
num_epochs = 100
early_stopping_threshold = 10
learning_rate = 0.001
param_grid = {'step_size': [5, 7, 10], 'gamma': [0.001, 0.01, 0.1, 0.5, 1, 10]}

In [21]:
criterion = nn.CrossEntropyLoss()
optimizer = Adam(model.parameters())
scheduler = StepLR(optimizer, step_size=10)
grid_search = GridSearchCV(scheduler, param_grid, cv=3)

# Analyse des modèles

In [None]:
best_model, perf = perf_evaluation(model, num_epochs, early_stopping_threshold,
                                   learning_rate, param_grid, criterion, optimizer, scheduler)