PROJET MAJEURE - Reinforcement Learning

Code du projet de majeure a CPE Lyon Ce projet met en place l'apprentissage de 2 équipes d'agents dans un environement (un jeu). L'apprentissage ce fait par Q-Learning, l'implémentation est en Python sans aucune library (except Numpy) Ce projet à été réalisé dans le cardre du projet 'majeur' de spécialisation en fin de 4ème année à l'école de CPE Lyon.

Faire un apprentissage par Q-Learning 'from scratch' (aucune bibliothèque d'apprentissage): Le but de ce projet de creer son propre environement avec des règles simples puis d'entrainer un certain nombre d'agent par Q-Learning.

Description: L'environement est une arène dans laquelle des pommes apparaissent de manière aléatoire. L'équipe bleue (blue agents) gagne des points en récoltant les pommes. L'équipe rouge (red agents) gagne des points en tuant les agents blue. Action possible : [Rotation Left, Rotation Right, Fire projectile, Forward, Nothing ] Les agents tués respawn dans leur camp.

Les auteurs:

ERBACHER, Pierre
FOLETTO PIMENTA, Pedro
TIZON, Nicolas

Pour executer:

Pour charger des q-tables déjà existante :

python projetMajeure.py -l

(l comme load => il faut que les tables porte le nom q_table_E1.npy et q_table_E2.npy et doivent être dans le même répertoire que projetMajeure.py) Il y a des tables que nous avons entraînés et sauvegardés dans le dossier 'Saves', il suffit de changer leur nom et de les sortir de ce dossier.

Pour entraîner et générer de nouvelles q-table :

python projetMajeure.py -t

Vous pouvez changez les paramètres d'entrainement dans l'entête du fichier projetMajeure.py ( ces paramètres commence par TRAINING)

TRAINING_N_EPISODE (: nombre de partie effectué) TRAINING_N_STEP (: nombre d'action effectué par partie) TRAINING_GAMMA TRAINING_LEARNING_RATE

Pour modifier et expérimenter de nouvelle Recompenses, il faut modifier la fonction def calcul_reward ( et se servir des attributs des états : State.py)

A la fin de l'entrainement s'affiche dans la console dans l'ordre:

Le nombre de pommes ramassées par les bleus pour chaque episode
Le nombre de pommes ramassées par les rouges pour chaque episode
Le nombre de victimes faites par les bleus pour chaque episode
Le nombre de victimes faites par les rouges pour chaque episode

Pour lancer la visualisation avec les nouvelles q-tables: python projetMajeure.py -l

Name		Name	Last commit message	Last commit date
Latest commit History 71 Commits
Images		Images
Saves		Saves
__pycache__		__pycache__
Presentation.odp		Presentation.odp
README.md		README.md
TODO_List		TODO_List
TODO_List~		TODO_List~
interface.py		interface.py
interface.py~		interface.py~
postermajeure.pdf		postermajeure.pdf
postermajeure.pdn		postermajeure.pdn
postermajeure.png		postermajeure.png
projetMajeure.py		projetMajeure.py
projetMajeure.py~		projetMajeure.py~
q_table_E1.npy		q_table_E1.npy
q_table_E2.npy		q_table_E2.npy
state.py		state.py
state.py~		state.py~

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PROJET MAJEURE - Reinforcement Learning

About

Releases

Packages

Contributors 3

Languages

pfpimenta/projet_majeure

Folders and files

Latest commit

History

Repository files navigation

PROJET MAJEURE - Reinforcement Learning

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 3

Languages

Packages