# Analyse et résumé de la reproductibilité des expériences

Ce carnet jupyter explique le processus d'analyse et de reproduction des expériences du papier **"Learning Moore Machines from Input-Output Traces"**. Le travail inclut la configuration de l'environnement, l'exécution des expériences telles que décrites dans le papier et dans le dépôt GitHub associé, et l'analyse critique des résultats.

---

## Objectifs :
1. Reproduire les expériences menées par les chercheurs, auteurs de la publication, à l'aide du code fourni.
2. Analyser la configuration des expériences, leur mise en œuvre et leurs résultats.
3. Documenter les observations, les défis rencontrés et les enseignements pour une compréhension approfondie et de futures travaux de recherches basées sur ce papier.

---

**Lien vers le dépôt GitHub des auteurs :** [Dépôt GitHub associé à la publication](https://github.com/ggiorikas/FSM-learning)

---

### Plan :
1. **Configuration de l'environnement** : guide étape par étape pour configurer l'environnement selon les spécifications des auteurs.
2. **Exécution des expériences** : lancement et relance des expériences, gestion des problèmes de mémoire, et suivi de la progression.
3. **Analyse des résultats** : étude des sorties stockées dans `all-results.txt` et interprétation des résultats obtenus.
4. **Observations critiques** : défis rencontrés et suggestions d'amélioration.
5. **Conclusion** : résumé des observations et prochaines étapes.

## Configuration de l'environnement

La configuration de l'environnement nécessaire pour reproduire les expériences telles que décrites dans le papier.

### Prérequis :
1. **Python version 2.7** : utilisé pour la génération des traces et pour les étapes intermédiaires du traitement.
2. **Langage D (D Compiler)** : utilisé pour exécuter les scripts principaux, notamment ceux permettant de faire l'expérience d'apprentissage des machines de Moore.
3. **Dépendances supplémentaires** :
   - Mémoire vive suffisante pour éviter les arrêts fréquents dus à des limites de mémoire.
   - Accès à un système compatible (Linux, Windows, ou MacOS).

### Vérification de l'environnement :
Les commandes ci-dessous permettent de vérifier que les outils nécessaires sont correctement installés et configurés selon ce qui a été demandé par les auteurs (voir [Dépôt GitHub associé à la publication](https://github.com/ggiorikas/FSM-learning)) :
- **Vérification de la version de Python :**

In [None]:
$ python --version

- **Vérification de la version du compilateur D :**

In [None]:
$ dmd --version

## Une fois que ces versions sont validées, vous pouvez passer à l'exécution des expériences.

### Méthodologie
Les expériences suivent les étapes suivantes :

1. **Génération des Machines de Moore** :
   - Machines aléatoires générées avec un nombre spécifique d'états, d'entrées et de sorties.

2. **Génération des Traces d'Entraînement et de Test** :
   - Les machines générées sont utilisées pour produire des traces qui servent à l'apprentissage et à l'évaluation.

3. **Application des Algorithmes d'Apprentissage** :
   - Trois algorithmes sont utilisés :
     - **Algorithme 1** : apprentissage basique.
     - **Algorithme 2** : amélioration avec un processus d'agrégation d'états.
     - **Algorithme 3** : optimisation avancée pour une précision élevée. (algorithme choisi pour notre étude)

4. **Évaluation de la Précision** :
   - Les machines apprises sont évaluées selon trois politiques :
     - **Faible (Weak)** : évaluation basique.
     - **Moyenne (Medium)** : évaluation intermédiaire.
     - **Forte (Strong)** : évaluation stricte (isomorphisme avec la machine originale).

### Commandes Principales
Les commandes suivantes sont utilisées pour exécuter les expériences :

- **Expérience d'apprentissage des machines de Moore génerées aléatoirement :**

In [None]:
$ dmd -m64 -i -O -release -inline -boundscheck=off generate.d
$ dmd -m64 -i -O -release -inline -boundscheck=off run_rand_fsm_experiments.d
$ ./run_rand_fsm_experiments

Les résultats seront stockés dans le fichier suivant :  
`o/all-results.txt`

En cas d'arrêt du processus dû à une utilisation excessive de mémoire (un message indiquant **"out of memory"** apparaît), il est nécessaire de relancer la commande. Le système utilise un mécanisme de mise en cache pour éviter de répéter les expériences déjà effectuées.

- **Expérience d'apprentissage des machines de Moore de Benchmark**

In [None]:
$ dmd -m64 -i -O -release -inline -boundscheck=off generate.d
$ dmd -m64 -i -O -release -inline -boundscheck=off run_real_fsm_experiments.d
$ ./run_rand_fsm_experiments

Les résultats seront stockés dans le fichier suivant :  
`o2/all-results.txt`