**Table of contents**<a id='toc0_'></a>    
- [Importation des bibliothèques](#toc1_)    
  - [Importation des paquets ou modules de la bibliothèque OpenFL](#toc1_1_)    
  - [Importation des paquets ou modules de la bibliothèque PyTorch](#toc1_2_)    
  - [Importation d’autres paquets ou modules requis](#toc1_3_)    
- [Définition du modèle d‘entraînement](#toc2_)    
  - [Définition des chargeurs de données](#toc2_1_)    
  - [Définition du modèle de réseau CNN](#toc2_2_)    
  - [Définition de la fonction d'inférence utilisée dans le test](#toc2_3_)    
- [Définition des règles de l'apprentissage fédéré](#toc3_)    
  - [Méthode de calcul de la moyenne des poids d'apprentissage fédéré](#toc3_1_)    

<!-- vscode-jupyter-toc-config
	numbering=false
	anchor=true
	flat=false
	minLevel=1
	maxLevel=6
	/vscode-jupyter-toc-config -->
<!-- THIS CELL WILL BE REPLACED ON TOC UPDATE. DO NOT WRITE YOUR TEXT IN THIS CELL -->

# <a id='toc1_'></a>[Importation des bibliothèques](#toc0_)

## <a id='toc1_1_'></a>[Importation des paquets ou modules de la bibliothèque OpenFL](#toc0_)


In [1]:
from openfl.experimental.workflow.interface import Aggregator, Collaborator, FLSpec
from openfl.experimental.workflow.placement import aggregator, collaborator
from openfl.experimental.workflow.runtime import LocalRuntime

## <a id='toc1_2_'></a>[Importation des paquets ou modules de la bibliothèque PyTorch](#toc0_)


In [2]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.utils.data import DataLoader

from torchsummary import summary

import torchvision

## <a id='toc1_3_'></a>[Importation d’autres paquets ou modules requis](#toc0_)


In [3]:
from copy import deepcopy

import numpy as np

from termcolor import cprint

# <a id='toc2_'></a>[Définition du modèle d‘entraînement](#toc0_)

## <a id='toc2_1_'></a>[Définition des chargeurs de données](#toc0_)


In [4]:
"""
01. torchvision.transforms.Compose(transforms)
    - Composes several transforms together.

02. torchvision.transforms.Normalize(mean, std, inplace=False)
    - Normalize a tensor image with mean and standard deviation.
    - output[channel] = (input[channel] - mean[channel]) / std[channel]
"""

mnist_train = torchvision.datasets.MNIST(
    "/tmp/files/",
    train=True,
    download=True,
    transform=torchvision.transforms.Compose(
        [
            torchvision.transforms.ToTensor(),
            # Les valeurs ` 0.1307` et `0.3081` utilisées pour la transformation `Normalize()`
            # ci-dessous sont la moyenne globale et l’écart-type de l’ensemble de données MNIST.
            torchvision.transforms.Normalize((0.1307,), (0.3081,)),
        ]
    ),
)

mnist_test = torchvision.datasets.MNIST(
    "/tmp/files/",
    train=False,
    download=True,
    transform=torchvision.transforms.Compose(
        [
            torchvision.transforms.ToTensor(),
            torchvision.transforms.Normalize((0.1307,), (0.3081,)),
        ]
    ),
)

## <a id='toc2_2_'></a>[Définition du modèle de réseau CNN](#toc0_)


In [5]:
"""
03. torch.nn.Conv2d(in_channels, out_channels, kernel_size, stride=1, padding=0, dilation=1,
    groups=1, bias=True, padding_mode='zeros', device=None, dtype=None)
    - Applies a 2D convolution over an input signal composed of several input planes.

04. torch.nn.Dropout2d(p=0.5, inplace=False)
    - Randomly zero out entire channels.
    - Each channel will be zeroed out independently on every forward call with probability p using
    samples from a Bernoulli distribution.

05. torch.nn.functional.max_pool2d(input, kernel_size, stride=None, padding=0,
    dilation=1, ceil_mode=False, return_indices=False)
    - Applies a 2D max pooling over an input signal composed of several input planes.

06. torch.nn.functional.dropout(input, p=0.5, training=True, inplace=False)
    - During training, randomly zeroes some elements of the input tensor with probability p.
    - Uses samples from a Bernoulli distribution.

07. torch.nn.functional.log_softmax(input, dim=None, _stacklevel=3, dtype=None)
    - Apply a softmax followed by a logarithm.
    - While mathematically equivalent to log(softmax(x)), doing these two operations separately is
    slower and numerically unstable. This function uses an alternative formulation to compute the
    output and gradient correctly.
"""


class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        # La première couche convolutionnelle : le nombre de canaux d’entrée est de 1, c’est-à-dire
        # une image en niveaux de gris, le nombre de canaux de sortie est de 10, la taille du filtre
        # convolutif est de 5x5, le stride est de 1 et le padding est de 0.

        # Par conséquent, après que l'image d'entrée (1x28x28) a été convoluée, la taille de la
        # carte de caractéristiques de sortie est de 10x24x24.
        self.conv1 = nn.Conv2d(1, 10, kernel_size=5)
        # La deuxième couche convolutionnelle : le nombre de canaux d’entrée est de 10, le nombre de
        # canaux de sortie est de 20, la taille du filtre convolutif est de 5x5, le stride est de 1
        # et le padding est de 0.

        # Par conséquent, après que l'image d'entrée (10x12x12) a été convoluée, la taille de la
        # carte de caractéristiques de sortie est de 20x8x8.
        self.conv2 = nn.Conv2d(10, 20, kernel_size=5)
        # Une couche d'abandon.
        self.conv2_drop = nn.Dropout2d()
        # La première couche de fully connected : le nombre de canaux d’entrée est de 20, chaque
        # canal a une taille de 4x4, soit un total de 20x4x4 = 320 nœuds, tandis que la sortie est
        # fixée à 50 nœuds.
        self.fc1 = nn.Linear(320, 50)
        # La deuxième couche de fully connected : l'entrée a 50 nœuds et la sortie a 10 nœuds
        # (correspondant à 10 catégories).
        self.fc2 = nn.Linear(50, 10)

    def forward(self, x):
        # La première couche convolutive est suivie d'une couche de pooling de type max pooling avec
        # un filtre convolutif de taille de 2x2 et un stride égal à la longueur du filtre.

        # La taille d'entrée est de 10x24x24, et après pooling, la taille de sortie est de 10x12x12.
        x = F.relu(F.max_pool2d(self.conv1(x), 2))
        # La deuxième couche convolutive est suivie d'une couche d'abandon.

        # Après la couche d'abandon, suit une autre couche de max-pooling, qui possède un filtre
        # convolutif de taille de 2x2 et un stride aussi égal à la longueur du filtre.

        # La taille d'entrée est de 20x8x8, et après pooling, la taille de sortie est de 20x4x4.
        x = F.relu(F.max_pool2d(self.conv2_drop(self.conv2(x)), 2))
        # La carte de caractéristiques multidimensionnelle est transformée en un vecteur
        # unidimensionnel, d'une taille de 20x4x4 = 320.
        x = x.view(-1, 320)
        # La première couche de fully connected, activée par la fonction d'activation ReLU.
        x = F.relu(self.fc1(x))
        # Pendant l'entraînement du modèle, certains nœuds de la sortie de la première couche de
        # fully connected sont mis à zéro de manière aléatoire avec une probabilité p.
        x = F.dropout(x, training=self.training)
        # La deuxième couche de fully connected sert également de couche de sortie.
        x = self.fc2(x)
        # Les probabilités logarithmiques de tous les nœuds de la couche de sortie sont calculées en
        # appliquant une fonction softmax suivie d'un logarithme.
        return F.log_softmax(x, dim=1)

In [6]:
model = Net()
summary(model, next(iter(mnist_train))[0].shape)

----------------------------------------------------------------
        Layer (type)               Output Shape         Param #
            Conv2d-1           [-1, 10, 24, 24]             260
            Conv2d-2             [-1, 20, 8, 8]           5,020
         Dropout2d-3             [-1, 20, 8, 8]               0
            Linear-4                   [-1, 50]          16,050
            Linear-5                   [-1, 10]             510
Total params: 21,840
Trainable params: 21,840
Non-trainable params: 0
----------------------------------------------------------------
Input size (MB): 0.00
Forward/backward pass size (MB): 0.06
Params size (MB): 0.08
Estimated Total Size (MB): 0.15
----------------------------------------------------------------


In [7]:
def count_parameters(model):
    length = 67
    names = [n for (n, p) in model.named_parameters() if p.requires_grad]
    name = "total parameters"
    names.append(name)
    max_length = max(map(len, names))
    formatted_names = [f"{f'  {n} ':.<{max_length + 3}}" for n in names]
    params = [p.numel() for p in model.parameters() if p.requires_grad]
    params.append(sum(params))
    formatted_params = [f"{f' {p}  ':.>{length - max_length - 3}}" for p in params]

    for n, p in zip(formatted_names[:-1], formatted_params[:-1]):
        cprint((n + p), "magenta")
    cprint(" " + "_" * (length - 2) + " ", "magenta")
    cprint(
        (formatted_names[-1] + formatted_params[-1]),
        "magenta",
        end="\n\n",
    )

    return names, params


names, params = count_parameters(model)

[35m  conv1.weight .............................................. 250  [0m
[35m  conv1.bias ................................................. 10  [0m
[35m  conv2.weight ............................................. 5000  [0m
[35m  conv2.bias ................................................. 20  [0m
[35m  fc1.weight .............................................. 16000  [0m
[35m  fc1.bias ................................................... 50  [0m
[35m  fc2.weight ................................................ 500  [0m
[35m  fc2.bias ................................................... 10  [0m
[35m _________________________________________________________________ [0m
[35m  total parameters ........................................ 21840  [0m



## <a id='toc2_3_'></a>[Définition de la fonction d'inférence utilisée dans le test](#toc0_)

In [8]:
"""
08. torch.nn.functional.nll_loss(input, target, weight=None, size_average=None, ignore_index=-100,
    reduce=None, reduction='mean')
    - Compute the negative log likelihood loss.
"""


def inference(network, test_loader):
    # Mettre le module en mode évaluation.
    network.eval()
    test_loss = 0
    correct = 0
    with torch.no_grad():
        for data, target in test_loader:
            output = network(data)
            # L'entropie est une mesure de l'incertitude, c'est-à-dire que, si un résultat est
            # ertain, l'entropie est faible.

            # La perte d'entropie croisée, ou perte logarithmique mesure les performances d'un
            # modèle de classification dont le résultat est une valeur de probabilité comprise entre
            # 0 et 1.

            # La perte d'entropie croisée augmente à mesure que la probabilité prédite s'écarte de
            # l'étiquette réelle.

            # L’entropie croisée catégorielle sert au classement en plusieurs classes.

            # Le log-vraisemblance négatif est également connu sous le nom d'entropie croisée
            # catégorielle, car il s'agit en fait de deux interprétations différentes de la même
            # formule.

            # test_loss += F.cross_entropy(output, target, reduction="sum").item()
            test_loss += F.nll_loss(output, target, reduction="sum").item()

            # Si `keepdim` est `True`, le tenseur de sortie est de la même taille que celui
            # d'entrée, sauf dans la (les) dimension(s) `dim` où il est de taille 1.
            pred = output.data.max(dim=1, keepdim=True)[1]
            # Calcul de l'égalité par éléments.
            correct += pred.eq(target.data.view_as(pred)).sum()
    test_loss /= len(test_loader.dataset)
    cprint(
        "Test set: Avg. loss: {:.4f}, Accuracy: {}/{} ({:.0f}%)".format(
            test_loss,
            correct,
            len(test_loader.dataset),
            100.0 * correct / len(test_loader.dataset),
        ),
        "magenta",
        attrs=["bold"],
        end="\n\n",
    )
    accuracy = float(correct / len(test_loader.dataset))
    return accuracy

In [9]:
test_loader = DataLoader(mnist_test, batch_size=500, shuffle=False)

inference(model, test_loader)

[1m[35mTest set: Avg. loss: 2.3068, Accuracy: 814/10000 (8%)[0m



0.08139999955892563

# <a id='toc3_'></a>[Définition des règles de l'apprentissage fédéré](#toc0_)

## <a id='toc3_1_'></a>[Méthode de calcul de la moyenne des poids d'apprentissage fédéré](#toc0_)

In [10]:
def FedAvg(models, weights=None):
    new_model = models[0]
    state_dicts = [model.state_dict() for model in models]
    state_dict = new_model.state_dict()
    for key in models[1].state_dict():
        state_dict[key] = torch.from_numpy(
            np.average(
                [state[key].numpy() for state in state_dicts], axis=0, weights=weights
            )
        )
    new_model.load_state_dict(state_dict)
    return new_model

In [11]:
keys = [k for k in model.state_dict().keys()]
names = [n for (n, p) in model.named_parameters() if p.requires_grad]
keys == names

True

In [None]:
class FederatedFlow(FLSpec):

    def __init__(self, model=None, optimizer=None, rounds=3, **kwargs):
        super().__init__(**kwargs)
        if model is not None:
            self.model = model
            self.optimizer = optimizer
        else:
            self.model = Net()
            self.optimizer = optim.SGD(
                self.model.parameters(), lr=learning_rate, momentum=momentum
            )
        self.rounds = rounds

    @aggregator
    def start(self):
        print(f"Performing initialization for model")
        self.collaborators = self.runtime.collaborators
        self.private = 10
        self.current_round = 0
        self.next(
            self.aggregated_model_validation,
            foreach="collaborators",
            exclude=["private"],
        )

    @collaborator
    def aggregated_model_validation(self):
        print(f"Performing aggregated model validation for collaborator {self.input}")
        self.agg_validation_score = inference(self.model, self.test_loader)
        print(f"{self.input} value of {self.agg_validation_score}")
        self.next(self.train)

    @collaborator
    def train(self):
        self.model.train()
        self.optimizer = optim.SGD(
            self.model.parameters(), lr=learning_rate, momentum=momentum
        )
        train_losses = []
        for batch_idx, (data, target) in enumerate(self.train_loader):
            self.optimizer.zero_grad()
            output = self.model(data)
            loss = F.nll_loss(output, target)
            loss.backward()
            self.optimizer.step()
            if batch_idx % log_interval == 0:
                print(
                    "Train Epoch: 1 [{}/{} ({:.0f}%)]\tLoss: {:.6f}".format(
                        batch_idx * len(data),
                        len(self.train_loader.dataset),
                        100.0 * batch_idx / len(self.train_loader),
                        loss.item(),
                    )
                )
                self.loss = loss.item()
                torch.save(self.model.state_dict(), "model.pth")
                torch.save(self.optimizer.state_dict(), "optimizer.pth")
        self.training_completed = True
        self.next(self.local_model_validation)

    @collaborator
    def local_model_validation(self):
        self.local_validation_score = inference(self.model, self.test_loader)
        print(
            f"Doing local model validation for collaborator {self.input}: {self.local_validation_score}"
        )
        self.next(self.join, exclude=["training_completed"])

    @aggregator
    def join(self, inputs):
        self.average_loss = sum(input.loss for input in inputs) / len(inputs)
        self.aggregated_model_accuracy = sum(
            input.agg_validation_score for input in inputs
        ) / len(inputs)
        self.local_model_accuracy = sum(
            input.local_validation_score for input in inputs
        ) / len(inputs)
        print(
            f"Average aggregated model validation values = {self.aggregated_model_accuracy}"
        )
        print(f"Average training loss = {self.average_loss}")
        print(f"Average local model validation values = {self.local_model_accuracy}")
        self.model = FedAvg([input.model for input in inputs])
        self.optimizer = [input.optimizer for input in inputs][0]
        self.current_round += 1
        if self.current_round < self.rounds:
            self.next(
                self.aggregated_model_validation,
                foreach="collaborators",
                exclude=["private"],
            )
        else:
            self.next(self.end)

    @aggregator
    def end(self):
        print(f"This is the end of the flow")