# FrozenLake 4x4 (Action History) 

In [61]:
import gymnasium as gym

In [62]:
from gymcts.gymcts_agent import GymctsAgent
from gymcts.gymcts_action_history_wrapper import ActionHistoryMCTSGymEnvWrapper

In [63]:
from gymcts.logger import log

In [64]:
# set log level to 20 (INFO)
# set log level to 10 (DEBUG) to see more detailed information
log.setLevel(20)

In [65]:
if __name__ == '__main__':
    # 0. create the environment
    env = gym.make('FrozenLake-v1', desc=None, map_name="4x4", is_slippery=False, render_mode="ansi")
    env.reset()

    # 1. wrap the environment with the wrapper
    env = ActionHistoryMCTSGymEnvWrapper(env)

    # 2. create the agent
    agent = GymctsAgent(
        env=env,
        clear_mcts_tree_after_step=False,
        render_tree_after_step=True,
        number_of_simulations_per_step=50,
        exclude_unvisited_nodes_from_render=True
    )

    # 3. solve the environment
    actions = agent.solve()

    # 4. render the environment solution in the terminal
    print(env.render())
    for a in actions:
        obs, rew, term, trun, info = env.step(a)
        print(env.render())

    # 5. print the solution
    # read the solution from the info provided by the RecordEpisodeStatistics wrapper
    # (that DeterministicSoloMCTSGymEnvWrapper uses internally)
    episode_length = info["episode"]["l"]
    episode_return = info["episode"]["r"]

    if episode_return == 1.0:
        print(f"Environment solved in {episode_length} steps.")
    else:
        print(f"Environment not solved in {episode_length} steps.")

([33mN[0m=50, [33mQ_v[0m=0.00, [33mbest[0m=0.00)
├── ([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m13[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.39[0m)
│   [38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m3[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.65[0m)
│   [38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.74[0m)
│   [38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;128;254;179m2[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.74[0m)
│   [38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m3[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.65[0m)
│   [38;2;127;0;255m│   [0m[38;2;0;180;235m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m63[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.19[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m16[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.36[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.59[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;128;

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m66[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.19[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m17[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.35[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.60[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;128;

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m67[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.19[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m17[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.35[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.60[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=0.00, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;128;

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m67[0m, [33mQ_v[0m=[38;2;240;107;130m0.07[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.26[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m12[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.42[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m3[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.64[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.74[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0

([33ma[0m=[38;2;255;178;96m3[0m, [33mN[0m=[96m80[0m, [33mQ_v[0m=[38;2;233;110;131m0.11[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.28[0m)
[38;2;255;178;96m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m12[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.43[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m3[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.64[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.74[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;255;178;96m3[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33m

([33ma[0m=[38;2;128;254;179m2[0m, [33mN[0m=[96m80[0m, [33mQ_v[0m=[38;2;233;110;131m0.11[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.29[0m)
[38;2;128;254;179m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m16[0m, [33mQ_v[0m=[38;2;242;106;130m0.06[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.43[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.59[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, 

([33ma[0m=[38;2;128;254;179m2[0m, [33mN[0m=[96m83[0m, [33mQ_v[0m=[38;2;232;111;131m0.12[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.29[0m)
[38;2;128;254;179m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m40[0m, [33mQ_v[0m=[38;2;212;121;135m0.23[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.46[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m16[0m, [33mQ_v[0m=[38;2;206;124;136m0.25[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.59[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=[38;2;206;124;136m0.25[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.84[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=[38;2;206;124;136m0.25[0m, [33mbest[0m=[96m1.00[0m, 

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m90[0m, [33mQ_v[0m=[38;2;236;109;131m0.10[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.26[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m31[0m, [33mQ_v[0m=[38;2;230;112;132m0.13[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.40[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m8[0m, [33mQ_v[0m=[38;2;230;112;132m0.13[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.59[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m2[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.72[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m2[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0

([33ma[0m=[38;2;255;178;96m3[0m, [33mN[0m=[96m80[0m, [33mQ_v[0m=[38;2;236;109;131m0.10[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.28[0m)
[38;2;255;178;96m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m40[0m, [33mQ_v[0m=[38;2;216;119;134m0.20[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.43[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m8[0m, [33mQ_v[0m=[38;2;230;112;132m0.13[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.61[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m2[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.72[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m2[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mu

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m90[0m, [33mQ_v[0m=[38;2;229;112;132m0.13[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.30[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m16[0m, [33mQ_v[0m=[38;2;242;106;130m0.06[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.44[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.59[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0

([33ma[0m=[38;2;128;254;179m2[0m, [33mN[0m=[96m79[0m, [33mQ_v[0m=[38;2;242;106;130m0.06[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.24[0m)
[38;2;128;254;179m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m15[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.38[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.58[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, 

([33ma[0m=[38;2;128;254;179m2[0m, [33mN[0m=[96m83[0m, [33mQ_v[0m=[38;2;245;104;129m0.05[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.22[0m)
[38;2;128;254;179m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m21[0m, [33mQ_v[0m=[38;2;245;104;129m0.05[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.37[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m5[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.55[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.90[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, 

([33ma[0m=[38;2;128;254;179m2[0m, [33mN[0m=[96m70[0m, [33mQ_v[0m=[38;2;252;101;128m0.01[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.20[0m)
[38;2;128;254;179m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m18[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.34[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m5[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.54[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.90[0m)
[38;2;128;254;179m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, 

([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m68[0m, [33mQ_v[0m=[38;2;235;109;131m0.10[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.29[0m)
[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m11[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.44[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m3[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.63[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.74[0m)
[38;2;127;0;255m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m└── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0

([33ma[0m=[38;2;255;178;96m3[0m, [33mN[0m=[96m84[0m, [33mQ_v[0m=[38;2;239;107;130m0.08[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.25[0m)
[38;2;255;178;96m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m14[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.40[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m4[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.57[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.83[0m)
[38;2;255;178;96m│   [0m[38;2;127;0;255m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mu

([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m91[0m, [33mQ_v[0m=[38;2;240;107;130m0.08[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.24[0m)
[38;2;0;180;235m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m24[0m, [33mQ_v[0m=[38;2;239;107;130m0.08[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.39[0m)
[38;2;0;180;235m├── [0m([33ma[0m=[38;2;0;180;235m1[0m, [33mN[0m=[96m24[0m, [33mQ_v[0m=[38;2;239;107;130m0.08[0m, [33mbest[0m=[96m1.00[0m, [33mubc[0m=[96m0.39[0m)
[38;2;0;180;235m│   [0m[38;2;0;180;235m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m5[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.56[0m)
[38;2;0;180;235m│   [0m[38;2;0;180;235m│   [0m[38;2;127;0;255m├── [0m([33ma[0m=[38;2;127;0;255m0[0m, [33mN[0m=[96m1[0m, [33mQ_v[0m=[38;2;255;100;128m0.00[0m, [33mbest[0m=[31m0.00[0m, [33mubc[0m=[96m0.90[0m)
[38;2;0;180;235m│   [0m[38;2;

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Up)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Up)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Left)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Up)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Down)
SFFF
FHFH
FFFH
HFF[41mG[0m

  (Right)
SFFF
FHFH
FFFH
HFF[41mG[0m

Environment solved in 36 steps.
