# Démonstration 1

## Exemple : quelques bots codés à la main

D'abord, on importe les classes dont on aura besoin...

In [None]:
import random
import math
from pod.board import PodBoard
from pod.player import Player
from pod.controller import SimpleController, MediumController, CleverController
from pod.ai.greedy_controller import GreedyController
from pod.ai.tree_search_controller import TreeSearchController
from pod.ai.action_discretizer import ActionDiscretizer
from pod.drawer import Drawer, draw_board
from pod.constants import Constants
from vec2 import Vec2
from pod.ai.rewards import speed_reward, dist_reward, ang_reward, check_reward, make_reward, pgr, re_dc

Le terrain de jeu est de taille fixe, mais le placement des **checkpoints** est aléatoire.

Pour tester, on peut imaginer plusieurs configurations...

In [None]:
# Les checkpoints sont arrangés dans un cercle
#board = PodBoard.circle(num_points=5, radius=3500)

# Les checkpoints forment une grille
board = PodBoard.grid(rows=2, cols=3, x_spacing=4000, y_spacing=5000)

# Garder les checkpoints, mais les mélanger aléatoirement
board = board.shuffle();

draw_board(board)

Ensuite, on crée les joueurs :

In [None]:
manual_bots = [
    # SimpleController : fonce à 100% accélération au prochain check
    SimpleController(board),
    # Un peu plus intelligent : il ajuste sa direction en fonction de sa vitesse, et n'accélère
    # pas s'il va dans le mauvais sens
    MediumController(board),
    # Tente d'ajuster son approche pour anticiper le checkpoint suivant
    CleverController(board),
]

On peut enfin les jouer et voir le résultat.

In [None]:
manual_drawer = Drawer(board, controllers = manual_bots)

manual_drawer.animate(
    max_laps = 2,
    trail_len = 20,
    show_vel = False,
    highlight_checks = True
)

Enfin, on peut visualiser l'évolution de la récompense de chaque joueur

In [None]:
manual_drawer.chart_rewards(speed_reward)
#manual_drawer.chart_rewards(dist_reward)
#manual_drawer.chart_rewards(check_reward)
#manual_drawer.chart_rewards(re_dc)

# Utilisation de récompense : Avare et Arborescent

On peut maintenant voir le résultat en utilisant une fonction de récompense, avec une discrétisation de l'espace des actions.

In [None]:
reward_bots = [
    GreedyController(board, re_dc),
    TreeSearchController(board, re_dc, max_depth=2),
    TreeSearchController(board, re_dc, max_depth=3),
    TreeSearchController(board, re_dc, max_depth=4)
]
bot_labels = [
    'Avare',
    'Arbo 2',
    'Arbo 3',
    'Arbo 4'
]

In [None]:
reward_drawer = Drawer(
    board,
    controllers = reward_bots,
    labels = bot_labels
)

reward_drawer.animate(
    max_laps = 2,
    trail_len = 20,
    show_vel = False,
    highlight_checks = True
)

In [None]:
#reward_drawer.chart_rewards(speed_reward)
#reward_drawer.chart_rewards(dist_reward)
#reward_drawer.chart_rewards(check_reward)
reward_drawer.chart_rewards(re_dc)