Evaluation
============

We use the terms from [arc42](https://docs.arc42.org/section-7/) for the different views.

Building Block View Trajectory Generation and Evaluation
--------------------------------------------------------

This is a conceptual view and reflects the target state of the implementation. In Flatland implementation, we currently do not yet distinguish between configuration and state, they go together in `RailEnvPersister` and a trajectory currently consists of full snapshots.

```mermaid
classDiagram
    class Runner {
        Trajectory: +generate_trajectory_from_policy(Policy policy, ObservationBuilder obs_builder, int snapshot_interval)$ Trajectory
    }
    
    class Evaluator {
        Trajectory: +evaluate(Trajectory trajectory)
    }
    
    class Trajectory {
        Trajectory: +Path data_dir
        Trajectory: +UUID ep_id
        Trajectory: +run(int from_step, int to_step=-1)
    }



    

    class EnvSnapshot {
        EnvSnapshot: +Path data_dir
        Trajectory: +UUID ep_id
    }

    class EnvConfiguration
    EnvConfiguration: +int max_episode_steps
    EnvConfiguration: +int height
    EnvConfiguration: +int width
    EnvConfiguration: +Rewards reward_function
    EnvConfiguration: +MalGen
    EnvConfiguration: +RailGen etc. reset

    class EnvState {
        EnvState: +Grid rail
    }

    
        class EnvConfiguration

        class EnvState

        class EnvSnapshot
        
        class EnvActions

        class EnvRewards
    

    

    EnvSnapshot --> "1" EnvConfiguration
    EnvSnapshot --> "1" EnvState
    Trajectory --> "1" EnvConfiguration
    Trajectory --> "1..*" EnvState
    Trajectory --> "1..*" EnvActions
    Trajectory --> "1..*" EnvRewards

    class Policy
    Policy: act(int handle, Observation observation)

    class ObservationBuilder
    ObservationBuilder: get()
    ObservationBuilder: get_many()

    class Submission
    Submission --> "1" Policy
    Submission --> ObservationBuilder
```

Remarks:

* Trajectory needs not start at step 0
* Trajectory needs not contain state for every step - however, when starting the trajectory from an intermediate step, the snapshot must exist.

Runtime View Trajectory Generation
--------------------------------

```mermaid
flowchart TD
    subgraph Trajectory.create_from_policy
        start(("&nbsp;")) -->|data_dir| D0
        D0(RailEnvPersister.load_new) -->|env| E{env done?}
        E -->|no:<br/>observations| G{Agent loop:<br/> more agents?}
        G --->|observation| G1(policy.act)
        G1 -->|action| G
        G -->|no:<br/> actions| F3(env.step)
        F3 -->|observations,rewards,info| E
        E -->|yes:<br/> rewards| H((("&nbsp;")))
    end

    style Policy fill: #ffe, stroke: #333, stroke-width: 1px, color: black
    style G1 fill: #ffe, stroke: #333, stroke-width: 1px, color: black
    style Env fill: #fcc, stroke: #333, stroke-width: 1px, color: black
    style F3 fill: #fcc, stroke: #333, stroke-width: 1px, color: black
    subgraph legend
        Env(Environment)
        Policy(Policy)
        Trajectory(Trajectory)
    end

    Trajectory.create_from_policy~~~legend
```

Trajectory Generation and Evaluation
------------------------------------

Create a trajectory from a random policy and inspect the output

In [13]:
import tempfile
from pathlib import Path
from typing import Any, Optional

from flatland.env_generation.env_generator import env_generator
from flatland.trajectories.trajectories import Policy
from flatland.utils.seeding import np_random, random_state_to_hashablestate
from flatland.evaluators.trajectory_evaluator import TrajectoryEvaluator, evaluate_trajectory
from flatland.trajectories.trajectories import Trajectory

In [4]:
class RandomPolicy(Policy):
    def __init__(self, action_size: int = 5, seed=42):
        super(RandomPolicy, self).__init__()
        self.action_size = action_size
        self.np_random, _ = np_random(seed=seed)

    def act(self, handle: int, observation: Any, **kwargs):
        return self.np_random.choice(self.action_size)

In [25]:
with tempfile.TemporaryDirectory() as tmpdirname:
    data_dir = Path(tmpdirname)
    trajectory = Trajectory.create_from_policy(policy=RandomPolicy(), data_dir=data_dir, snapshot_interval=15)
    # np_random in loaded episode is same as if it comes directly from env_generator incl. reset()!
    env = trajectory.restore_episode()
    gen, _, _ = env_generator()
    assert random_state_to_hashablestate(env.np_random) == random_state_to_hashablestate(gen.np_random)

    
    # inspect output
    for p in sorted(data_dir.rglob("**/*")):
        print(p)

    # inspect the actions taken by the policy
    print(trajectory.read_actions())

    # verify steps 5 to 15 - we can start at 5 as there is a snapshot for step 5.
    TrajectoryEvaluator(trajectory).evaluate(start_step=15,end_step=25)

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 470/471 [00:07<00:00, 66.92it/s]


/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/event_logs
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/event_logs/ActionEvents.discrete_action.tsv
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/event_logs/TrainMovementEvents.trains_arrived.tsv
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/event_logs/TrainMovementEvents.trains_positions.tsv
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/outputs
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/serialised_state
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/serialised_state/4eb42575-e47d-4a5e-b96a-420d0947e174.pkl
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/serialised_state/4eb42575-e47d-4a5e-b96a-420d0947e174_step0000.pkl
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/serialised_state/4eb42575-e47d-4a5e-b96a-420d0947e174_step0015.pkl
/var/folders/4x/y75rw_lj5xx6xc0bmv1gxmq80000gn/T/tmpzhwsrjjg/serialised_state

100%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 10/10 [00:00<00:00, 87.16it/s]

0.0% trains arrived. Expected 0.0%. 24 elapsed steps.





Flatland Callbacks
------------------
Flatland callbacks can be used for custom metrics and custom postprocessing.

In [42]:
import inspect
from flatland.envs.rail_env import RailEnv
from flatland.callbacks.callbacks import FlatlandCallbacks, make_multi_callbacks

In [57]:
lines, _ = inspect.getsourcelines(FlatlandCallbacks)
for s in lines:
    print(s)

class FlatlandCallbacks:

    """

    Abstract base class for Flatland callbacks similar to rllib, see https://github.com/ray-project/ray/blob/master/rllib/callbacks/callbacks.py.



    These callbacks can be used for custom metrics and custom postprocessing.



    By default, all of these callbacks are no-ops.

    """



    def on_episode_start(

        self,

        *,

        env: Optional[Environment] = None,

        data_dir: Path = None,

        **kwargs,

    ) -> None:

        """Callback run right after an Episode has been started.



        This method gets called after `env.reset()`.



        Parameters

        ---------

            env : Environment

                the env

            data_dir : Path

                trajectory data dir

            kwargs:

                Forward compatibility placeholder.

        """

        pass



    def on_episode_step(

        self,

        *,

        env: Optional[Environment] = None,

        data_dir: Path 

In [44]:
class DummyCallbacks(FlatlandCallbacks):
    def on_episode_step(
        self,
        *,
        env: Optional[RailEnv] = None,
        **kwargs,
    ) -> None:
        print(f"step{env._elapsed_steps - 1}")

100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 470/471 [00:06<00:00, 69.01it/s]
  6%|████████████████████                                                                                                                                                                                                                                                                                                                 | 29/471 [00:00<00:04, 93.10it/s]

step0
step1
step2
step3
step4
step5
step6
step7
step8
step9
step10
step11
step12
step13
step14
step15
step16
step17
step18
step19
step20
step21
step22
step23
step24
step25
step26
step27
step28


 10%|█████████████████████████████████▊                                                                                                                                                                                                                                                                                                   | 49/471 [00:00<00:04, 93.82it/s]

step29
step30
step31
step32
step33
step34
step35
step36
step37
step38
step39
step40
step41
step42
step43
step44
step45
step46
step47
step48
step49
step50
step51
step52
step53
step54
step55
step56
step57
step58


 17%|██████████████████████████████████████████████████████▌                                                                                                                                                                                                                                                                              | 79/471 [00:00<00:04, 92.63it/s]

step59
step60
step61
step62
step63
step64
step65
step66
step67
step68
step69
step70
step71
step72
step73
step74
step75
step76
step77
step78
step79
step80
step81
step82
step83
step84
step85
step86


 23%|██████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                                                                                         | 109/471 [00:01<00:03, 93.08it/s]

step87
step88
step89
step90
step91
step92
step93
step94
step95
step96
step97
step98
step99
step100
step101
step102
step103
step104
step105
step106
step107
step108


 27%|████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                                                                           | 129/471 [00:01<00:03, 92.61it/s]

step109
step110
step111
step112
step113
step114
step115
step116
step117
step118
step119
step120
step121
step122
step123
step124
step125
step126
step127
step128
step129
step130
step131
step132
step133
step134
step135
step136
step137
step138


 34%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                                                                                      | 159/471 [00:01<00:03, 94.20it/s]

step139
step140
step141
step142
step143
step144
step145
step146
step147
step148
step149
step150
step151
step152
step153
step154
step155
step156
step157
step158


 38%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                                                                        | 179/471 [00:01<00:03, 94.99it/s]

step159
step160
step161
step162
step163
step164
step165
step166
step167
step168
step169
step170
step171
step172
step173
step174
step175
step176
step177
step178


 42%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                           | 199/471 [00:02<00:02, 95.16it/s]

step179
step180
step181
step182
step183
step184
step185
step186
step187
step188
step189
step190
step191
step192
step193
step194
step195
step196
step197
step198


 49%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                      | 229/471 [00:02<00:02, 95.54it/s]

step199
step200
step201
step202
step203
step204
step205
step206
step207
step208
step209
step210
step211
step212
step213
step214
step215
step216
step217
step218
step219
step220
step221
step222
step223
step224
step225
step226
step227
step228


 51%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                               | 239/471 [00:02<00:02, 94.60it/s]

step229
step230
step231
step232
step233
step234
step235
step236
step237
step238
step239
step240
step241
step242
step243
step244
step245
step246
step247
step248


 59%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                    | 279/471 [00:02<00:02, 93.72it/s]

step249
step250
step251
step252
step253
step254
step255
step256
step257
step258
step259
step260
step261
step262
step263
step264
step265
step266
step267
step268
step269
step270
step271
step272
step273
step274
step275
step276
step277
step278


 63%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                      | 299/471 [00:03<00:01, 92.03it/s]

step279
step280
step281
step282
step283
step284
step285
step286
step287
step288
step289
step290
step291
step292
step293
step294
step295
step296
step297
step298


 68%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                        | 319/471 [00:03<00:01, 93.95it/s]

step299
step300
step301
step302
step303
step304
step305
step306
step307
step308
step309
step310
step311
step312
step313
step314
step315
step316
step317
step318
step319
step320
step321
step322
step323
step324
step325
step326
step327
step328


 76%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                             | 359/471 [00:03<00:01, 95.50it/s]

step329
step330
step331
step332
step333
step334
step335
step336
step337
step338
step339
step340
step341
step342
step343
step344
step345
step346
step347
step348
step349
step350
step351
step352
step353
step354
step355
step356
step357
step358


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                               | 379/471 [00:04<00:00, 95.09it/s]

step359
step360
step361
step362
step363
step364
step365
step366
step367
step368
step369
step370
step371
step372
step373
step374
step375
step376
step377
step378
step379
step380
step381
step382
step383
step384
step385
step386
step387
step388


 87%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                          | 409/471 [00:04<00:00, 94.28it/s]

step389
step390
step391
step392
step393
step394
step395
step396
step397
step398
step399
step400
step401
step402
step403
step404
step405
step406
step407
step408


 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                             | 429/471 [00:04<00:00, 93.91it/s]

step409
step410
step411
step412
step413
step414
step415
step416
step417
step418
step419
step420
step421
step422
step423
step424
step425
step426
step427
step428
step429
step430
step431
step432
step433
step434
step435
step436
step437
step438


 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋        | 459/471 [00:04<00:00, 94.93it/s]

step439
step440
step441
step442
step443
step444
step445
step446
step447
step448
step449
step450
step451
step452
step453
step454
step455
step456
step457
step458


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎| 470/471 [00:05<00:00, 93.49it/s]

step459
step460
step461
step462
step463
step464
step465
step466
step467
step468
step469
step470
0.0% trains arrived. Expected 0.0%. 470 elapsed steps.





In [None]:
with tempfile.TemporaryDirectory() as tmpdirname:
    data_dir = Path(tmpdirname)
    trajectory = Trajectory.create_from_policy(policy=RandomPolicy(), data_dir=data_dir, snapshot_interval=15)
    TrajectoryEvaluator(trajectory, callbacks=make_multi_callbacks(DummyCallbacks())).evaluate()