# Le Miel et les Abeilles : Optimisation par Algorithmes Génétiques

## Contexte du Projet

Ce projet explore l'application des algorithmes génétiques à travers une métaphore naturelle : l'optimisation du butinage des abeilles. Une colonie de 101 abeilles (incluant leur reine) s'est installée dans un pommier sauvage au centre d'un champ de fleurs mellifères composé de pissenlits et de sauges des prés. 

La problématique consiste à **optimiser les parcours de butinage** pour maximiser l'efficacité de la collecte de nectar, en s'inspirant des mécanismes de sélection naturelle.

## Objectifs Techniques

### 1. Implémentation d'un Algorithme Génétique
- Modéliser l'évolution des connaissances du champ de fleurs au fil des générations
- Optimiser les parcours de butinage (problème du voyageur de commerce)
- Maintenir une population constante de 100 abeilles + 1 reine

### 2. Analyse Comparative des Paramètres
Justifier le paramétrage optimal par des comparaisons expérimentales :
- Taux de mutation (fixe vs évolutif)
- Mécanismes de sélection
- Stratégies de reproduction
- Métriques de fitness
- Taux de remplacement générationnel

### 3. Visualisation et Analyse
- Génération de graphiques représentant les parcours optimaux
- Visualisation des arbres généalogiques
- Évolution des performances moyennes par génération
- Interface accessible pour publics non-spécialistes

## Problématique d'Optimisation

Le problème sous-jacent est une variante du **Traveling Salesman Problem (TSP)** :
- **Point de départ/arrivée** : La ruche en position (500, 500)
- **Objectif** : Visiter toutes les fleurs en minimisant la distance totale
- **Contraintes** : Parcours fermé, visite unique de chaque fleur

## Algorithmes Génétiques : La "Sélection Naturelle Numérique"

Les algorithmes génétiques transposent les principes darwiniens à l'optimisation informatique :

### Mécanismes Biologiques → Computationnels
- **Individus** → Solutions candidates (parcours d'abeilles)
- **Population** → Ensemble de solutions
- **Reproduction** → Croisement de solutions performantes
- **Mutation** → Modifications aléatoires légères
- **Sélection naturelle** → Élimination des solutions les moins adaptées
- **Évolution** → Amélioration progressive sur les générations

### Avantages de cette Approche
- **Exploration globale** de l'espace des solutions
- **Évitement des optimums locaux** grâce à la diversité populationnelle
- **Robustesse** face aux problèmes complexes et multimodaux
- **Parallélisabilité** naturelle

## Défis Techniques

### 1. Représentation des Solutions
Encoder efficacement un parcours de butinage dans une structure génétique manipulable.

### 2. Opérateurs Génétiques Spécialisés
Adapter les mécanismes de croisement et mutation au contexte du TSP pour préserver la validité des parcours.

### 3. Équilibrage Exploration/Exploitation
Maintenir la diversité génétique tout en convergeant vers des solutions optimales.

### 4. Paramétrage Optimal
Déterminer expérimentalement les configurations les plus performantes.

## Enjeux de Vulgarisation

Au-delà de l'implémentation technique, ce projet vise à **démocratiser la compréhension** des algorithmes d'optimisation bio-inspirés en s'appuyant sur des analogies naturelles intuitives pour expliquer les concepts d'intelligence artificielle évolutionniste.

## X Cross: Stratégies de Croisement dans un Algorithme Génétique pour la Résolution du TSP

# Test du X-cross à compléter ici

# Notre algorithme génétique : Transmission préférentielle des motifs communs sous sélection dégressive

## Vue d'ensemble
Notre algorithme génétique se distingue par un mécanisme de croisement innovant qui privilégie la transmission des segments de parcours validés par les deux parents. Cette approche garantit la conservation des "bonnes pratiques" de navigation tout en maintenant la diversité génétique nécessaire à l'exploration.

## Sélection parentale (rappel)
Le processus utilise un élitisme dégressif où seules les meilleures abeilles de chaque génération sont sélectionnées comme reproducteurs, avec une pression sélective qui s'intensifie progressivement (50% → 20% d'élite conservé).

### **Mécanisme de croisement : Héritage d'arêtes communes**

**1. Construction des arêtes parentales**  
L'algorithme identifie les segments de parcours (arêtes) de chaque parent :

```python
edges_1 = [(parent_1[i], parent_1[i+1]) for i in range(len(parent_1)-1)]
edges_2 = [(parent_2[i], parent_2[i+1]) for i in range(len(parent_2)-1)]
```

**2. Identification des motifs communs**  
Les arêtes communes sont détectées en utilisant des ensembles non orientés :

```python
set_edges_1 = {frozenset((a, b)) for a, b in edges_1}
set_edges_2 = {frozenset((a, b)) for a, b in edges_2}
common_edges = set_edges_1 & set_edges_2
```

**3. Construction du parcours enfant**

- **Phase d'héritage prioritaire** :  
L'enfant hérite des segments communs avec une orientation aléatoire parmi celles des parents :

```python
for edge_set in common_edges:
    orientations = []
    for (a, b) in edges_1 + edges_2:
        if frozenset((a, b)) == edge_set:
            orientations.append((a, b))
    if orientations:
        a, b = random.choice(orientations)
        if a not in visited:
            child.append(a)
            visited.add(a)
        if b not in visited:
            child.append(b)
            visited.add(b)
```

- **Phase de complétion exploratoire** :  
Les nœuds restants sont ajoutés aléatoirement pour compléter le parcours :

```python
remaining = [n for n in all_nodes if n not in visited]
while remaining:
    next_node = random.choice(remaining)
    child.append(next_node)
    visited.add(next_node)
    remaining.remove(next_node)
```

### **Avantages de cette approche**

- **Conservation des bonnes pratiques** : Transmission systématique des segments efficaces.
- **Diversité génétique** : Orientation aléatoire des arêtes communes et complétion aléatoire.
- **Robustesse** : Respect des contraintes du TSP (départ et retour à la ruche, pas de doublons).
- **Équilibre** : Combinaison optimale entre exploitation des solutions existantes et exploration de nouvelles possibilités.

Cette approche hybride maximise l'héritage des connaissances parentales tout en favorisant l'innovation.

## Structure de la base de données bees_log.csv

In [None]:
import pandas as pd
df = pd.read_csv("bees_log.csv")

In [13]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 2500 entries, 0 to 2499
Data columns (total 12 columns):
 #   Column            Non-Null Count  Dtype  
---  ------            --------------  -----  
 0   id                2500 non-null   int64  
 1   simulation_id     2500 non-null   int64  
 2   generation        2500 non-null   int64  
 3   distance          2500 non-null   float64
 4   parent_1          2400 non-null   float64
 5   parent_2          2400 non-null   float64
 6   chemin            2500 non-null   object 
 7   n_generations     2500 non-null   int64  
 8   mutation_rate     2500 non-null   float64
 9   elitisme_rate     2500 non-null   float64
 10  crossover_method  2500 non-null   object 
 11  timestamp         2500 non-null   object 
dtypes: float64(5), int64(4), object(3)
memory usage: 234.5+ KB


In [12]:
pd.concat([df.head(1), df.tail(1)])

Unnamed: 0,id,simulation_id,generation,distance,parent_1,parent_2,chemin,n_generations,mutation_rate,elitisme_rate,crossover_method,timestamp
0,1,1,0,26382.728124,,,"[0, 38, 8, 3, 43, 25, 42, 35, 32, 28, 46, 47, ...",30,0.2,0.2,order_crossover,2025-10-03 16:03:57.015377
2499,2500,1,30,13047.489723,2341.0,2408.0,"[0, 29, 18, 28, 33, 7, 16, 44, 45, 17, 50, 14,...",30,0.2,0.2,order_crossover,2025-10-03 16:04:00.973818


## Autres algorythmes heuristiques

### 1. Recuit Simulé : Accepter le Pire pour Trouver le Meilleur

#### Principe Central

Le recuit simulé transpose le processus métallurgique de refroidissement contrôlé à l'optimisation. L'idée clé : accepter temporairement des solutions dégradées pour éviter les optimums locaux, puis devenir progressivement plus exigeant.

#### Fonctionnement

L'algorithme utilise une "température" qui décroît dans le temps :
- **Haute température** : Accepte facilement les mauvaises solutions pour explorer largement
- **Basse température** : Devient sélectif et n'accepte que les améliorations

La probabilité d'accepter une solution dégradée suit la formule : **exp(-ΔE/T)**

Plus la dégradation (ΔE) est importante ou la température (T) faible, moins la solution a de chances d'être acceptée.

#### Exemple Concret

Pour un parcours passant de 100 km à 110 km :
- Début (T=50) : 82% de chance d'acceptation
- Milieu (T=10) : 37% de chance d'acceptation  
- Fin (T=1) : 0,005% de chance d'acceptation

#### Paramètres Critiques

- **T₀** : Température initiale (niveau d'exploration)
- **α** : Coefficient de refroidissement (vitesse de convergence)
- **T_min** : Température d'arrêt (critère de fin)

#### Avantages et Inconvénients

**Points forts :**
- Évite efficacement les optimums locaux
- Simple à implémenter
- Excellent pour les problèmes de parcours

**Limitations :**
- Réglage délicat des paramètres
- Convergence parfois lente
- Traite une seule solution à la fois

#### Pertinence

Dans votre contexte d'optimisation du parcours des abeilles, le recuit simulé offre une approche complémentaire aux algorithmes génétiques. Sa philosophie - sacrifier temporairement la performance pour une exploration plus riche - illustre une stratégie d'optimisation sophistiquée qui dépasse les approches gloutonnes classiques.

### 2. Optimisation par Essaims Particulaires (PSO) : L'Intelligence Collective

#### Principe Central

Le PSO s'inspire du comportement des oiseaux migrateurs ou des bancs de poissons. Chaque "particule" (solution candidate) ajuste sa trajectoire en combinant son expérience personnelle et celle du groupe, créant un mouvement collectif vers les meilleures zones.

#### Fonctionnement

Chaque particule possède :
- **Position** : sa solution actuelle
- **Vitesse** : sa direction et intensité de mouvement
- **Mémoire personnelle** : sa meilleure position trouvée
- **Mémoire collective** : la meilleure position trouvée par tout l'essaim

La nouvelle vitesse combine trois influences : l'inertie (continuer dans sa direction), l'attraction vers sa meilleure expérience personnelle, et l'attraction vers la meilleure expérience collective.

#### Exemple Concret

Une particule à la position 120 km, ayant trouvé son meilleur à 100 km, tandis que l'essaim a trouvé 85 km :
- Elle continuera partiellement dans sa direction actuelle (inertie)
- Elle sera attirée vers ses 100 km personnels
- Elle sera encore plus attirée vers les 85 km collectifs

#### Paramètres Critiques

- **w** : Inertie (0.4-0.9) - tendance à maintenir la direction
- **c₁** : Confiance personnelle (~2) - attraction vers sa meilleure expérience
- **c₂** : Confiance collective (~2) - attraction vers l'expérience du groupe

#### Avantages et Inconvénients

**Points forts :**
- Convergence souvent rapide
- Équilibre automatique exploration/exploitation
- Parallélisable naturellement

**Limitations :**
- Risque de convergence prématurée
- Adaptation aux problèmes discrets complexe
- Peu de mécanismes de diversification

#### Pertinence

Pour l'optimisation du parcours des abeilles, le PSO offre une approche populationnelle différente des algorithmes génétiques. Plutôt que la reproduction et mutation, il mise sur la communication et l'apprentissage collectif continu, illustrant comment l'intelligence de groupe peut émerger de règles individuelles simples.

### 3. Recherche Tabou : La Mémoire Intelligente

#### Principe Central

La recherche tabou s'inspire d'un explorateur méthodique qui note soigneusement les endroits visités pour éviter de tourner en rond. L'algorithme maintient une "liste tabou" des mouvements récents interdits, forçant l'exploration vers de nouvelles zones même quand elles semblent moins prometteuses.

#### Fonctionnement

À chaque itération, l'algorithme :
- Examine tous les voisins de la solution actuelle
- Élimine ceux générés par des mouvements "tabou" (récemment utilisés)
- Choisit le meilleur voisin non-tabou, même s'il dégrade la performance
- Ajoute le mouvement inverse à la liste tabou pour une durée déterminée

Un "critère d'aspiration" permet d'ignorer l'interdiction si le mouvement améliore le record global.

#### Exemple Concret

Pour un parcours de villes, si l'algorithme vient d'échanger les villes A et B :
- Échanger à nouveau A et B devient "tabou" pour 7 itérations
- L'algorithme explore d'autres modifications forcément
- Exception : si échanger A-B améliore le meilleur parcours jamais trouvé

#### Paramètres Critiques

- **Durée tabou** : Nombre d'itérations pendant lesquelles un mouvement reste interdit
- **Taille du voisinage** : Nombre de solutions alternatives explorées
- **Critères d'aspiration** : Conditions pour lever une interdiction

#### Avantages et Inconvénients

**Points forts :**
- Évite efficacement les cycles
- Exploration systématique et déterministe
- Souvent très performant sur les problèmes de parcours

**Limitations :**
- Réglage critique de la durée tabou
- Exploration locale uniquement
- Peut être gourmand en mémoire

#### Pertinence

Dans le contexte du parcours des abeilles, la recherche tabou propose une philosophie radicalement différente : plutôt que l'aléatoire des algorithmes génétiques, elle mise sur une exploration déterministe mais contrainte. Cette approche méthodique garantit de ne jamais "perdre de temps" à revisiter des solutions récentes, maximisant l'efficacité de chaque évaluation.