# Algorithme Particle Swarm Optimization (PSO)

L'optimisation par essaim de particules (PSO) est un algorithme d'optimisation inspiré du comportement social des oiseaux et des poissons. Il a été développé par James Kennedy et Russel Eberhart en 1995.

## Principe

L'algorithme PSO repose sur la recherche collaborative d'une solution optimale par un groupe de particules se déplaçant dans l'espace de recherche. Chaque particule représente une solution potentielle au problème d'optimisation.

Les particules sont mises à jour en suivant deux composantes principales :

1. **Composante cognitive** : La particule est attirée vers sa meilleure position personnelle trouvée (pBest) : Exploration.
2. **Composante sociale** : La particule est attirée vers la meilleure position globale trouvée par l'ensemble des particules (gBest) : Exploitation.

La mise à jour de la position et de la vitesse de chaque particule est effectuée en utilisant les formules suivantes :

$v_{i,t+1} = w * v_{i,t} + c_1 * r_1 * (pBest_i - x_{i,t}) + c_2 * r_2 * (gBest - x_{i,t})$

$x_{i,t+1} = x_{i,t} + v_{i,t+1}$

où $v_{i,t}$ est la vitesse de la particule `i` à l'instant `t`, $x_{i,t}$ est sa position, `w` est le facteur d'inertie, $c_1$ et $c_2$ sont les coefficients d'accélération cognitive et sociale, et $r_1$ et $r_2$ sont des nombres aléatoires uniformes.

## Utilité

Le PSO est utilisé pour résoudre de nombreux problèmes d'optimisation, tels que :

- Optimisation de fonctions mathématiques
- Optimisation de réseaux de neurones
- Optimisation de la conception de structures
- Planification de trajets pour robots mobiles
- Optimisation de portefeuilles d'investissement
- Et bien d'autres problèmes d'optimisation combinatoire et continue

L'algorithme PSO présente plusieurs avantages, notamment sa simplicité, sa rapidité de convergence et sa capacité à échapper aux minima locaux dans de nombreux cas.

## Avantages :

- Ne nécessite pas de gradient analytique ou une approximation numérique
- Évite de tomber dans les pièges de minimums locaux et dépend moins de la position initiale
- L'importance des hyperparamètres est réduite si le nombre d'itérations tend vers l'infini

## Limites :

La vitesse et l'inertie doivent s'adapter au degré de convexité / concavité de la fonction. Si la vitesse est trop élevée sur une fonction qui admet une dérivée seconde très grande en valeur absolue, les particules risquent d'aller trop vite et de dépasser les points stationnaires. Au contraire, une vitesse très faible ralentira la convergence si la fonction est plane avec des dérivées secondes proches de zéro.

Deux solutions possibles pour remédier à ces problèmes sont :

1. Effectuer des simulations de Monte-Carlo en modifiant la vitesse aléatoirement et apprendre de chaque simulation.
2. Actualiser le facteur d'inertie à chaque itération pour réduire la vitesse au fil de la simulation.

Ces approches permettent d'adapter l'algorithme PSO aux différentes propriétés de la fonction d'optimisation et d'améliorer sa convergence.

#### Référence
Kennedy, J., & Eberhart, R. (1995). Particle Swarm Optimization. Proceedings of ICNN'95 - International Conference on Neural Networks.

## Exemple sur une fonction  complexe à optimiser : Rastrigin function 

### Fonction Rastrigin

La fonction Rastrigin est une fonction mathématique couramment utilisée pour évaluer les performances des algorithmes d'optimisation. Elle a été introduite par Léonid Rastrigin en 1974 et est considérée comme une fonction de test difficile en raison de ses nombreux minimums locaux.

La fonction Rastrigin est une fonction non linéaire, multimodale et continue, définie comme suit pour un espace de recherche à `n` dimensions :

$f(x) = A_n + \sum_{i=1}^n [x_i^2 - A * cos(2πx_i)]$ 

La fonction Rastrigin est généralement évaluée sur une plage de valeurs pour chaque dimension, par exemple `x_i ∈ [-5.12, 5.12]`.

L'optimum global de la fonction Rastrigin est atteint lorsque toutes les composantes du vecteur `x` sont égales à zéro, c'est-à-dire `x_i = 0` pour `i = 1, ..., n`. La valeur minimale de la fonction Rastrigin est alors égale à 0 :

$f(x) = f(0, 0, ..., 0) = 0$


#### Références

1. Rastrigin, L. A. (1974). Systems of extremal control. Nauka, Moscow.

In [1]:
# On montre une visualisation de la function en 2D 
import plotly.graph_objects as go 
import numpy as np 
import math as mt

def Rastrigin(input):
    """
    Here, we will take the function : Rastrigin(input) = 10*2 + (input[0]**2-10*np.cos(2*mt.pi*input[0])) + (input[1]**2-10*np.cos(2*mt.pi*input[1]))

    x_1,x_2 in [-5.12,5.12]
    
    SOLUTION : x_1 = x_2 = 0 with f*(x_1,x_2) = 0
    

    
    Args:
        input (np.array): contains all the inputs of the function here we have 2 variables (shape of input 2x1)
        
    Returns:
        np.array : contains all the outputs of the function 
    """
    return np.array(10*2 + (input[0]**2-10*np.cos(2*mt.pi*input[0])) + (input[1]**2-10*np.cos(2*mt.pi*input[1]))) 


In [5]:
#Voila une configuration type pso 

params = {
        "nb_part" : 50, #Number of birds/ particules in one simulation
        "vit" : 0.1, # The velocity of the bird (will be decrease across the iteration) move it when the support of the function is large
        "c1" : 0.2, # The independance level of the particule from the group (Exploration level) c1 in [0,+inf[
        "c2" : 0.2, # The dependance level of the particule from the group (Exploitation level) c2 in [0,+inf[
        "max_ite" : 1000, # Number of iteration (moves) of each particules in the space in one MC simulation 
        "nb_simulation_MC" : 20 , # The number of Monte Carlo simulation you want to do (to see the convergence)
        "min_x" : -5.12, # the minimum value that x_i can take, for all i = 1,...,"Dim"
        "max_x" : 5.12, # the maximum value that x_i can take, for all i = 1,...,"Dim"
        "Dim" : 2, # The number of variable in input if f(x) = y "Dim" = 1, if f(x,z) = y : "Dim" = 2 ... 
        "min_max" : "min",  # "min" if you want to minimize your function else "maximize"
        "function" :Rastrigin , # change here the function you want to optimize 
        }


In [6]:
x1 = np.linspace(params['min_x'], params['max_x'], 50)
x2 = np.linspace(params['min_x'], params['max_x'], 50)
v_x1, v_x2 = np.meshgrid(x1, x2)
y = params['function'](np.array([v_x1,v_x2]))
max_y = 90 #to show the limit of the function
min_y= -2

fig = go.Figure()
fig.add_trace(go.Surface(z=y,text="Function Rastrigin in 3D"))
fig.update_layout(title="Function Rastrigin in 3D")
fig.show()


En utilisant le PSO avec full information, on va essayer de trouver la solution ! 

Dans le git hub, vous trouverez un dossier dash_bord avec un fichier python app.py qui est un dashbord présentant la progression en temps réel des particules sur la fonction avec des slides pour modifier les hyperparamètres de l'algorithme sur une pluralité de fonctions complexes dont la Rastrigin. 

In [7]:
from PSO_scripts.pso_JSON import pso_json_v1

df_result, best_of_info_df, df_birds, time_json_v1 = pso_json_v1(params["function"], params)

La meilleure image obtenue est 0.0
Cette image a été obtenue à la simulation n°0 avec l'oiseau n° 5 avec les inputs suivants : {'x_0': 0.0, 'x_1': 0.0}
PSO run in 0.42' s


## Optimisation du temps d'exécution de l'algorithme

Dans cette section, nous allons tester trois structures de code différentes, chacune intégrant des techniques de multi-threading et de multi-processing.

### Comment accélérer l'algorithme ?

Utiliser du multi-threading / multi-processing pour les simulations de Monte-Carlo indépendantes.
Utiliser des technologies GPU, comme TensorFlow, pour accélérer les opérations vectorielles.
Par manque de temps, nous nous concentrerons sur la première option.

Nous nous attendons à de meilleures performances avec le multi-processing. Le threading pourrait consommer beaucoup de mémoire vive, ce qui risque de ne pas améliorer les performances.

### Métriques d'évaluation

Pour évaluer notre optimisation, nous ferons varier trois paramètres (les autres resteront fixes) :

-Nombre de particules (dimension des vecteurs)
-Nombre d'itérations (mémoire bloquée)
-Nombre de simulations de Monte-Carlo (répétitions)

Nous mesurerons le temps d'exécution en secondes pour des paramètres fixes et la moyenne des moyennes des positions des particules à chaque simulation de Monte-Carlo à la dernière itération. La seconde métrique indique la convergence de l'algorithme ; nous souhaitons un algorithme rapide mais aussi convergent !

#### Version 1 : PSO_JSON
Toutes les informations inter-simulation-itération sont stockées dans un fichier JSON massif qui se remplit au fur et à mesure de l'exécution de l'algorithme. Cette version permet de conserver l'historique des particules pour chaque simulation.

Avantages : rapide à exécuter et information complète
Limites : très lourd en termes de mémoire pour l'ordinateur, assez difficile à comprendre, et ne permet pas le multi-threading en raison de conflits entre les fichiers JSON

#### Version 2 : PSO Low Memory
Nous conserverons uniquement les informations essentielles pour l'algorithme en mettant à jour un fichier JSON fixe pour chaque simulation de Monte-Carlo.

Avantages : moins rapide, moins coûteux en termes de mémoire vive, et permet le multi-processing
Limites : conserve uniquement les résultats importants, l'historique de l'algorithme n'est pas conservé


#### Version 3 : PSO Low Memory avec variables locales
Nous conserverons uniquement les informations essentielles pour l'algorithme en mettant à jour des variables locales pour chaque simulation de Monte-Carlo.

Avantages : moins rapide et permet le multi-processing
Limites : conserve uniquement les résultats importants, l'historique de l'algorithme n'est pas conservé

### Versions disponibles et testées : 

- V1 : version naive avec des boucles for simple 
- V2 : version avec Multi-Threading (pas disponible sur le Code 2)
- V3 : version avec Multi-Processing


L'ensemble des résultats ont été run sur le script run_comparaison.py et sont stocké dans des dataframes (data) 



## En modifiant le nombre d'itération (nombre des mouvements par simulation) 

In [15]:
import pandas as pd 
import plotly.graph_objects as go 
df_ite = pd.read_csv('/Users/theoalegretti/Documents/GitHub/PSO/data/iteration_speed_perf.csv').drop(columns='Unnamed: 0')

In [17]:
fig = go.Figure()
columns_timer = ['timer_LM_v1','timer_LM_v2','timer_LM_v3','timer_json_v1','timer_json_v3','timer_var_v1','timer_var_v2','timer_var_v3']
for exe in columns_timer : 
    fig.add_trace(go.Scatter(x=df_ite['nb_ite'],y=df_ite[exe],name=exe))
fig.update_layout(title_text='Execution time (s) on the number of iteration for each code and each version.')
fig.show()

Nous observons que les performances des versions naïves et multi-threadées sont proportionnelles au nombre d'itérations. L'utilisation du multi-threading n'améliore pas le temps d'exécution, car le stockage n'est pas impacté. En revanche, il est intéressant de noter que le multi-processing devient avantageux à partir de 4500 itérations ou plus, mais est moins performant pour un faible nombre d'itérations comparé aux versions naïves.

L'intégration de l'optimisation NUMBA pourrait améliorer l'efficacité du paramètre en question, mais cela nécessiterait de modifier le code pour remplacer les fichiers JSON par des DataFrames pandas.

In [19]:
fig = go.Figure()
columns_timer = ['timer_LM_v1','timer_LM_v2','timer_LM_v3','timer_json_v1','timer_json_v3','timer_var_v1','timer_var_v2','timer_var_v3','nb_ite','perf_json_v1','perf_json_v3']
for exe in df_ite.drop(columns=columns_timer).columns : 
    fig.add_trace(go.Scatter(x=df_ite['nb_ite'],y=df_ite[exe],name=exe))
fig.update_layout(title_text='Mean of optimal value on the number of iteration for each code and each version.')
fig.show()

D'autre part, nous constatons que l'algorithme converge assez rapidement vers l'optimum, rendant ainsi les améliorations apportées par le multi-processing ou le multi-threading moins bénéfiques dans cette configuration et pour cette fonction spécifique.

Nous allons maintenant tester l'impact du nombre de simulations de Monte-Carlo par exécution.

## Ajustement du nombre de simulations de Monte-Carlo

Il est connu que l'algorithme a plus de chances d'atteindre l'extrema global (minimum ou maximum) de la fonction si le nombre de simulations de Monte-Carlo est augmenté. En effet, chaque simulation commence avec un tirage aléatoire des positions initiales. En augmentant le nombre de tirages aléatoires, nous explorerons de manière plus approfondie la fonction et son domaine

In [20]:
import pandas as pd 
import plotly.graph_objects as go 
df_ite = pd.read_csv('/Users/theoalegretti/Documents/GitHub/PSO/data/monte_carlo_speed_perf.csv').drop(columns='Unnamed: 0')

In [21]:
fig = go.Figure()
columns_timer = ['timer_LM_v1','timer_LM_v2','timer_LM_v3','timer_json_v1','timer_json_v3','timer_var_v1','timer_var_v2','timer_var_v3']
for exe in columns_timer : 
    fig.add_trace(go.Scatter(x=df_ite['nb_part'],y=df_ite[exe],name=exe))
fig.update_layout(title_text='Execution time (s) on the number of simulation of Monte-Carlo for each code and each version.')
fig.show()

Dans ce cas, nous observons une tendance similaire à celle du nombre d'itérations : le multi-processing améliore les performances d'exécution. Cependant, pour le nombre de simulations de Monte-Carlo, le point de basculement qui favorise le multi-processing se situe à partir de 150 simulations.

Nous constatons également que lorsque le nombre de simulations est important, tous les cœurs sont occupés et surchargés, ce qui entraîne une augmentation linéaire du temps d'exécution par la suite. Néanmoins, cette augmentation reste moins rapide que celle des processus naïfs.

Recommandation : Utilisez le multi-processing pour un grand nombre de simulations de Monte-Carlo (plus de 150) si la fonction à optimiser présente des contraintes importantes sur ses entrées ou si la fonction a un large domaine d'image. L'objectif est de couvrir le plus d'espace possible dans l'exploration.

In [22]:
fig = go.Figure()
columns_timer = ['timer_LM_v1','timer_LM_v2','timer_LM_v3','timer_json_v1','timer_json_v3','timer_var_v1','timer_var_v2','timer_var_v3','nb_part','perf_json_v1','perf_json_v3']
for exe in df_ite.drop(columns=columns_timer).columns : 
    fig.add_trace(go.Scatter(x=df_ite['nb_part'],y=df_ite[exe],name=exe))
fig.update_layout(title_text='Mean of optimal on the number of simulation of Monte-Carlo for each code and each version.')
fig.show()

En ce qui concerne les performances, nous constatons que la moyenne des résultats à la dernière étape reste globalement la même, tandis que la variance diminue mécaniquement avec l'augmentation du nombre de simulations.

Comme mentionné précédemment, les fonctions ayant un large domaine peuvent poser problème au PSO si les particules ne sont pas bien réparties dès le départ (en raison de la randomisation ou d'une vitesse trop faible combinée à un trop petit nombre d'itérations). Chaque simulation apporte de l'information, réduisant ainsi mécaniquement la variance des résultats finaux. Il est donc important de combiner la métrique de moyenne classique à celle de la variance pour s'assurer que le PSO a bien convergé vers la même valeur à travers un grand nombre de simulations. Cette approche permet de confirmer que l'extrema trouvé est bien global, compte tenu des contraintes imposées.

### Le nombre de particules

Dans cette section, nous allons faire varier le nombre de particules utilisées dans la fonction. Intuitivement, plus le nombre de particules augmente, plus les calculs vectoriels pour mettre à jour les positions et les vitesses seront complexes et lourds. Sachant que nous utilisons le multi-processing et le multi-threading pour les simulations de Monte-Carlo, nous ne devrions pas observer d'amélioration significative des performances.

À mon avis, l'optimisation computationnelle pourrait être réalisée en décomposant les calculs vectoriels sur les cœurs de processeur en utilisant des tenseurs ou d'autres techniques de calcul vectoriel. Toutefois, cette approche n'a pas été explorée en raison de contraintes de temps.

In [23]:
import pandas as pd 
import plotly.graph_objects as go 
df_ite = pd.read_csv('/Users/theoalegretti/Documents/GitHub/PSO/data/particule_speed_perf.csv').drop(columns='Unnamed: 0')

In [25]:
fig = go.Figure()
columns_timer = ['timer_LM_v1','timer_LM_v2','timer_LM_v3','timer_json_v1','timer_json_v3','timer_var_v1','timer_var_v2','timer_var_v3']
for exe in columns_timer : 
    fig.add_trace(go.Scatter(x=df_ite['nb_part'],y=df_ite[exe],name=exe))
fig.update_layout(title_text='Execution time (s) on the number of particule for each code and each version.')
fig.show()

Conformément à notre intuition, les deux techniques d'optimisation ne se révèlent pas efficaces pour ce paramètre. De plus, nous observons que l'augmentation du nombre de particules n'alourdit pas significativement le temps de calcul.

Dans une configuration fixe, le multi-processing rallonge le temps d'exécution, tandis que le multi-threading demeure à un niveau similaire à la méthode naïve.

Parmi les trois codes possibles, nous constatons que le stockage dans un fichier JSON contenant toutes les informations est le plus rapide. Cela peut être dû au fait que le nombre de simulations (20) et d'itérations (200) est relativement faible. La mémoire occupée par le fichier JSON n'interfère pas avec les performances de calcul.

In [26]:
fig = go.Figure()
columns_timer = ['timer_LM_v1','timer_LM_v2','timer_LM_v3','timer_json_v1','timer_json_v3','timer_var_v1','timer_var_v2','timer_var_v3','nb_part']
for exe in df_ite.drop(columns=columns_timer).columns : 
    fig.add_trace(go.Scatter(x=df_ite['nb_part'],y=df_ite[exe],name=exe))
fig.update_layout(title_text='Mean of optimal on the number of particule for each code and each version.')
fig.show()

En ce qui concerne les performances, nous observons que l'augmentation du nombre de particules est cruciale pour la convergence vers l'optimum. L'ensemble des processus converge vers la solution avec un peu plus de 150 particules.

Étant donné que nous ne sommes pas confrontés à des contraintes computationnelles importantes, il est possible de fixer ce paramètre à une valeur relativement élevée afin de garantir la convergence de l'algorithme.

# Conclusion

Au cours de ce rapport, nous avons exploré l'implémentation de l'algorithme PSO et tenté d'optimiser son temps d'exécution en utilisant des techniques de multi-processing et de multi-threading. Plusieurs structures de code ont été testées pour comparer leurs performances en termes de temps d'exécution et de convergence vers l'optimum.

## Synthèse des résultats

Dans l'ensemble, nous avons observé que le multi-processing présente des avantages pour les problèmes nécessitant un grand nombre de simulations de Monte-Carlo (plus de 150) ou pour les fonctions ayant des contraintes importantes sur leurs entrées ou un large domaine d'image. Toutefois, le multi-threading n'a pas apporté d'amélioration significative des performances par rapport à la méthode naïve.

Parmi les trois structures de code testées, la version stockant toutes les informations inter-simulation-itération dans un fichier JSON (PSO_JSON) s'est révélée être la plus rapide, malgré sa consommation de mémoire importante. Cependant, elle ne permet pas l'utilisation du multi-threading en raison de conflits entre les fichiers JSON. Les autres versions (PSO Low Memory et PSO Low Memory avec variables locales) ont été moins rapides, mais ont permis le multi-processing tout en réduisant la mémoire utilisée.

## Recommandations

Pour les futurs travaux, il pourrait être intéressant d'explorer d'autres méthodes d'optimisation computationnelle, telles que l'utilisation de technologies GPU (par exemple, TensorFlow) pour accélérer les opérations vectorielles. De plus, il est recommandé de fixer le nombre de particules à une valeur relativement élevée (plus de 150) afin de garantir la convergence de l'algorithme, étant donné que cela n'a pas engendré de contraintes computationnelles majeures dans nos expérimentations.

En conclusion, l'optimisation de l'algorithme PSO en termes de temps d'exécution dépend des caractéristiques du problème à résoudre et des contraintes de ressources disponibles. Les techniques de multi-processing peuvent être avantageuses dans certaines situations, tandis que le multi-threading n'a pas montré d'amélioration notable des performances.