# Votre premier algorithme génétique

Maintenant que vous comprenez les briques fondamentales qui permettent de créer un réseau de neurones, nous allons pouvoir débuter la création d'un algorithme génétique.<br>
Vous aurez d'abord besoin d'installer la librairie gym_snake de nicomon24.<br><br>

<center><b><a href="https://github.com/nicomon24/Sneks" target="_blank">https://github.com/nicomon24/Sneks</a></b></center><br><br>
Pour installer la librarie, il suffit de lancer les cellules suivantes (cela peut prendre plusieurs minutes.<br>
L'installation requiert GIT. Je vous invite à l'installer préalablement sur votre machine si vous ne l'avez pas déjà fait (la commande "git clone" doit pouvoir fonctionner depuis l'invite de commande).<br>
Si vous ne l'avez pas encore faire, vous pouvez suivre le processus d'installation décrit 
<a href="https://www.atlassian.com/git/tutorials/install-git">ici</a>.

In [1]:
!git clone https://github.com/nicomon24/Sneks
!pip install -e ./Sneks

Cloning into 'Sneks'...


Obtaining file:///C:/git_dir/neural_networks_tutorial_fr/Sneks
Collecting opencv-python (from sneks==0.0.1)
  Downloading https://files.pythonhosted.org/packages/dc/54/a6b7727c67d4e14194549a9e1a1acd7902ebae2f4a688d84b658ae40b5fb/opencv_python-4.1.0.25-cp36-cp36m-win_amd64.whl (37.3MB)
Installing collected packages: opencv-python, sneks
  Running setup.py develop for sneks
Successfully installed opencv-python-4.1.0.25 sneks


You are using pip version 18.1, however version 19.1 is available.
You should consider upgrading via the 'python -m pip install --upgrade pip' command.


Si vous êtes sur windows, executez la cellule suivante.

In [2]:
!move ./Sneks/sneks ./snek
!rd /s /q Sneks
!move ./snek ./sneks

        1 r‚pertoires d‚plac‚s.
        1 r‚pertoires d‚plac‚s.


Si vous êtes sur Linux, la suivante.

In [None]:
!mv ./Sneks/sneks ./snek
!rm -rf gym-snake
!mv ./snek ./sneks

# Les bases de "gym"

Maintenant que notre environement est prêt à l'usage, nous allons détailler son fonctionnement.<br>
Commençons par l'importation.

In [3]:
import gym #Importe la librairie gym d'OpenAI
import sneks

env = gym.make('babysnek-raw-16-v1') #Crée

Si vous rencontrez des difficultés lors de l'exécution de la cellule ci-avant, vérifiez que vous avez correctement installé le dossier sneks (il doit être dans le même dossier que le notebook... et sans majuscule!)

<center><img src="ipynb_images/install_snake.jpg"></img></center><br>

A présent, nous allons comprendre comment lancer l'environnement.

In [4]:
env.reset(); #Cette fonction doit être appelée avant chaque "partie" ne soit lancée.
#Elle a pour but de réinitialiser le jeu et vous retourne une matrice d'observation (state).
#Nous reviendrons là-dessus plus tard.

In [5]:
env.render(); #Cette fonction vous permet de créer une représentation visuelle du jeu.
#Vous devriez voir une interface s'ouvrir. Si elle freeze, pas de panique, c'est normal.

En règle générale, la fonction <i>env.render()</i> est appelée quand vous voulez voir comment votre IA résout le problème.<br>
Toutefois, vous verrez que nous n'utiliserons pas cette fonction la plupart du temps.<br>
Au lieu de cela, nous voulons entraîner un agent, et le faire rapidement. Le rendement visuel de .render() restitue l'état du jeu à mesure qu'il est joué, ce qui réduit grandement nos performances en terme de temps.<br><br><br>
A présent que nous avons démarré l'environnement, nous allons jouer des actions aléatoires afin de voir comment fonctionne ces actions.<br>
Que ces sont actions ? Si vous jouyiez à Mario, il s'agirait de "sauter, bouger à droite, à gauche...)<br>
Dans l'environement snake, cela correspond à "aller en haut", "aller en bas", "aller à gauche", "aller à droite"... Voyons comment cela marche.

In [6]:
env.action_space #action_space décrit l'ensemble des actions de l'environnement.
#Nous allons voir comment les choses fonctionnent.

Discrete(4)

la variable action_space dérive de l'objet env. Il nous apprend que nous ne pouvons réaliser que 4 actions différentes : 0, 1, 2 ou 3.<br><br>
L'environment est dit <b><u>discrete (discret)</u></b>, ce qui signifie que seul des nombres entiers seront acceptés.<br>
Discrete est à opposé à <b><u>continuous</u></b>, qui représente une variable continue.<br><br>
Une variable discrète pourrait correspondre aux face d'un dé que l'on jette. Vous n'aurez que des résultats entiers : 1, 2, 3, 4, 5 or 6.<br> Si vous pensez néanmoins au poids d'un animal, vous obtiendrez une variable continue, quelque chose comme 17,841Kg.<br>
    Votre chien ne passera pas directement de 17Kg à 18Kg, comme si il y avait un saut entre les deux. Son poids monte en <u>continu</u> de 17 à 18... d'où le nom de variable continue. 

In [7]:
env.action_space.sample() #Retourne un exemple aléatoire de ce
#qui peut être envoyé comme action.

3

Maintenant que nous savons quoi envoyer pour signifier une action, nous voulons que ce choix d'action soit pris en considération. Pour cela, nous allons appeler la fonction **env.step()**.<br>
Cela nous retournera les informations suivantes:<br>
- <u>Observation:</u> Ce à quoi le plateau de jeu ressemble, une fois votre action prise en compte. Il est ainsi possible de suivre l'évolution de la partie qui se joue. L'observation est donnée lorsque vous exécutez une étape (*env.step()*) ou quand vous réinitialisez une partie (*env.reset()*)
- <u>reward:</u> La reward est la récompense. Elle qualifie si votre agent accumule des points. Dans le cas de l'environnement que nous utilisons, cela vous informe si votre agent a attrapé le fruit... ou bien s'est suicidé en se mordant la queue/sautant de la falaise.
- <u>done:</u> Le jeu continue-t-il encore ? Si votre serpent saute de la falaise ou se mord la queue, cette variable passera à True
- <u>info:</u> Des informations complémentaires au sujet de l'environnement.

In [8]:
env.step(env.action_space.sample())

(array([[  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0., 101., 100.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0., 100.,
           0.,   0.,   0.,   0.,   0.],
        [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0., 100.,
     

Si vous regardez sur l'image rendue, vous verrez qu'aucun des serpents n'a bougé. C'est parce que env.render() n'a pas encore été appelé pour mettre à jour l'affichage.

In [9]:
env.reset();
print(env.step(env.action_space.sample()))
env.render();

(array([[  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0., 255.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,   0.,   0.,   0.],
       [  0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,   0.,
          0.,   0.,  

Comme vous pouvez le voir, env.step() retourne une matrice contenant toutes les observations.<br>
- 0 signifie que la cellule est vide.
- 255 est l'objectif, la nourriture à attraper.
- 101 est la tête du serpent.
- 100 est la queue du serpent.<br><br>

In [10]:
#Généralement, les 4 variables sont extraites de la sorte:
observation, reward, done, info = env.step(env.action_space.sample())

Exercice : En utilisant l'environment, créez  un code qui parvient à atteindre la pomme.

Vous pouvez utilisez les portes logiques précédement introduites.

In [11]:
from lexml.lexmlcourses import test_direction_with_gym_snek


def my_snake_movement(observations):
    #Entrée : les observations de l'état du jeu
    
    #Sortie : l'action sélectionnée (0, 1, 2 ou 3)
    return None
test_direction_with_gym_snek(my_snake_movement)

Maintenant que nous avons couvert gym, nous allons pouvoir nous intéresser à la structure du réseau.