In [11]:

import os
import numpy as np
import torch
import random
from tqdm import tqdm

from fancy_einsum import einsum
from data.othello import OthelloBoardState
from mech_int.tl_othello_utils import (
    load_hooked_model,
    state_stack_to_one_hot_threeway,
    ITOS,
)
from constants import OTHELLO_HOME

random.seed(42)


DATA_DIR = os.path.join(OTHELLO_HOME, "data")

In [12]:


def seq_to_state_stack(str_moves):
    if isinstance(str_moves, torch.Tensor):
        str_moves = str_moves.tolist()
    board = OthelloBoardState()
    states = []
    valid_moves = []
    all_flipped = []
    for move in str_moves:
        flipped = board.umpire_return_flipped(move)
        states.append(np.copy(board.state))
        valid_moves.append(board.get_valid_moves())
        all_flipped.append(flipped)
    states = np.stack(states, axis=0)
    return states, valid_moves, all_flipped


def build_state_stack(board_seqs_string):
    """
    Construct stack of board-states.
    This function will also filter out corrputed game-sequences.
    """
    state_stack = []
    moves = []
    flipped = []
    for idx, seq in enumerate(board_seqs_string):
        _stack, _moves, _flipped = seq_to_state_stack(seq)
        state_stack.append(_stack)
        moves.append(_moves)
        flipped.append(_flipped)
    return state_stack, moves, flipped

In [13]:


eights = [[-1, 0], [-1, 1], [0, 1], [1, 1], [1, 0], [1, -1], [0, -1], [-1, -1]]


def get_min_boardstate(board, moves):
    """
    Get minimum board-state that needs to be satisfied to correctly derive moves.
    """
    me = 2
    you = 1

    min_board = torch.zeros((8, 8))
    for move in moves:
        r, c = move // 8, move % 8
        for direction in eights:
            cur_r, cur_c = r, c
            inbetween = False
            while 1:
                cur_r, cur_c = cur_r + direction[0], cur_c + direction[1]
                if cur_r < 0 or cur_r > 7 or cur_c < 0 or cur_c > 7:
                    break
                elif board[cur_r, cur_c] == 0:
                    break
                elif board[cur_r, cur_c] == you:
                    inbetween = True
                    continue

                elif board[cur_r, cur_c] == me:
                    if not inbetween:
                        break
                    min_board[cur_r, cur_c] = me
                    while not (cur_r == r and cur_c == c):
                        cur_r = cur_r - direction[0]
                        cur_c = cur_c - direction[1]
                    min_board[cur_r, cur_c] = 0
                    break

    return min_board

In [14]:

othello_gpt = load_hooked_model("synthetic")
board_seqs_int = torch.load(
    os.path.join(
        DATA_DIR,
        "board_seqs_int_valid.pth",
    )
)

board_seqs_string = torch.load(
    os.path.join(
        DATA_DIR,
        "board_seqs_string_valid.pth",
    )
)

In [15]:

test_size = 1000
board_seqs_int = board_seqs_int[-test_size:]
board_seqs_string = board_seqs_string[-test_size:]

games_int = board_seqs_int
games_str = board_seqs_string
all_indices = torch.arange(test_size)
print("Building state stacks...")
orig_state_stack, valid_moves, flips = build_state_stack(games_str)

Building state stacks...


In [17]:

pos_start = 0
pos_end = othello_gpt.cfg.n_ctx - 0

unembed = othello_gpt.unembed

probes = [
    torch.load(
        os.path.join(
            OTHELLO_HOME,
            f"mech_int/probes/linear/resid_{layer}_linear.pth",
        )
    )
    for layer in range(8)
]
probes = torch.stack(probes)

In [18]:

earliest_layers_move = []
earliest_layers_board = []
batch_size = 128
for idx in tqdm(range(0, test_size, batch_size)):
    indices = all_indices[idx : idx + batch_size]
    _games_int = games_int[indices]

    state_stack = torch.tensor(np.stack(orig_state_stack))[
        indices, pos_start:pos_end, :, :
    ]
    state_stack_one_hot = state_stack_to_one_hot_threeway(state_stack).cuda()

    logits, cache = othello_gpt.run_with_cache(
        _games_int.cuda()[:, :-1], return_type="logits"
    )
    _valid_moves = [valid_moves[_idx] for _idx in indices]
    _flips = [flips[_idx] for _idx in indices]

    for batch_idx in tqdm(range(indices.shape[0])):
        for move_idx in range(59):
            move_groundtruth = sorted(_valid_moves[batch_idx][move_idx])
            board_groundtruth = state_stack_one_hot.argmax(-1)
            curr_board_gold = board_groundtruth[0, batch_idx, move_idx]

            min_board_state = get_min_boardstate(
                curr_board_gold, move_groundtruth
            )
            debug_board = curr_board_gold.clone()
            for _move in move_groundtruth:
                debug_board[_move // 8, _move % 8] = 99
            earliest_layer_board = 9
            earliest_layer_move = 9
            for layer in range(8):
                resid_post = cache["resid_post", layer][:, pos_start:pos_end]
                probe_out = einsum(
                    "batch pos d_model, modes d_model rows cols options -> modes batch pos rows cols options",
                    resid_post,
                    probes[layer],
                )
                unembedded = einsum(
                    "batch pos d_model, d_model vocab -> batch pos vocab",
                    resid_post,
                    unembed.W_U,
                )

                # Board match.
                board_preds = probe_out.argmax(-1)[0, batch_idx, move_idx]
                if (
                    torch.equal(
                        board_preds,
                        curr_board_gold,
                    )
                    and layer < earliest_layer_board
                ):
                    earliest_layer_board = layer

                # Moves match.
                topk_preds, topk_indices = unembedded[
                    batch_idx, move_idx
                ].topk(k=len(move_groundtruth))
                move_preds = sorted([ITOS[x.item()] for x in topk_indices])
                if (
                    move_groundtruth == move_preds
                ) and layer < earliest_layer_move:
                    earliest_layer_move = layer

                if earliest_layer_move != 9 and earliest_layer_board != 9:
                    break

            earliest_layers_move.append(earliest_layer_move)
            earliest_layers_board.append(earliest_layer_board)

  0%|                                                                                                                                                                                                                                                                                                                        | 0/8 [00:00<?, ?it/s]
  0%|                                                                                                                                                                                                                                                                                                                      | 0/128 [00:00<?, ?it/s][A
  1%|██▎                                                                                                                                                                                                                                                                                                           | 1/128 [0

 17%|███████████████████████████████████████████████████▋                                                                                                                                                                                                                                                         | 22/128 [00:09<00:42,  2.47it/s][A
 18%|██████████████████████████████████████████████████████                                                                                                                                                                                                                                                       | 23/128 [00:09<00:42,  2.45it/s][A
 19%|████████████████████████████████████████████████████████▍                                                                                                                                                                                                                                                    | 24/128

 35%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                                                                   | 45/128 [00:19<00:34,  2.38it/s][A
 36%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                                                                | 46/128 [00:19<00:33,  2.43it/s][A
 37%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                              | 47/128

 53%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                             | 68/128 [00:28<00:25,  2.39it/s][A
 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                          | 69/128 [00:29<00:24,  2.45it/s][A
 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                        | 70/128

 71%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                       | 91/128 [00:38<00:15,  2.43it/s][A
 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                    | 92/128 [00:38<00:14,  2.46it/s][A
 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 93/128

 89%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                | 114/128 [00:48<00:05,  2.39it/s][A
 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 115/128 [00:48<00:05,  2.37it/s][A
 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                            | 116/128

  5%|████████████████▌                                                                                                                                                                                                                                                                                             | 7/128 [00:02<00:49,  2.43it/s][A
  6%|██████████████████▉                                                                                                                                                                                                                                                                                           | 8/128 [00:03<00:50,  2.37it/s][A
  7%|█████████████████████▏                                                                                                                                                                                                                                                                                        | 9/128

 23%|██████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                                                                      | 30/128 [00:12<00:41,  2.36it/s][A
 24%|████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                                                                    | 31/128 [00:12<00:42,  2.30it/s][A
 25%|███████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                                                                                 | 32/128

 41%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                | 53/128 [00:22<00:31,  2.36it/s][A
 42%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                              | 54/128 [00:22<00:31,  2.36it/s][A
 43%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                           | 55/128

 59%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                          | 76/128 [00:32<00:22,  2.33it/s][A
 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                        | 77/128 [00:32<00:21,  2.35it/s][A
 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                     | 78/128

 77%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                    | 99/128 [00:41<00:12,  2.35it/s][A
 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 100/128 [00:42<00:11,  2.37it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                               | 101/128

 95%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉              | 122/128 [00:51<00:02,  2.36it/s][A
 96%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎           | 123/128 [00:52<00:02,  2.35it/s][A
 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 124/128

 12%|███████████████████████████████████▎                                                                                                                                                                                                                                                                         | 15/128 [00:06<00:48,  2.34it/s][A
 12%|█████████████████████████████████████▋                                                                                                                                                                                                                                                                       | 16/128 [00:06<00:47,  2.37it/s][A
 13%|███████████████████████████████████████▉                                                                                                                                                                                                                                                                     | 17/128

 30%|█████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                                                                   | 38/128 [00:16<00:38,  2.33it/s][A
 30%|███████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                                                 | 39/128 [00:16<00:38,  2.30it/s][A
 31%|██████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                                                                               | 40/128

 48%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                             | 61/128 [00:25<00:28,  2.39it/s][A
 48%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                           | 62/128 [00:26<00:27,  2.38it/s][A
 49%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                        | 63/128

 66%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                       | 84/128 [00:35<00:19,  2.24it/s][A
 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                     | 85/128 [00:36<00:19,  2.22it/s][A
 67%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                  | 86/128

 84%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                 | 107/128 [00:45<00:09,  2.31it/s][A
 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              | 108/128 [00:46<00:08,  2.27it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                            | 109/128

  0%|                                                                                                                                                                                                                                                                                                                      | 0/128 [00:00<?, ?it/s][A
  1%|██▎                                                                                                                                                                                                                                                                                                           | 1/128 [00:00<01:02,  2.03it/s][A
  2%|████▋                                                                                                                                                                                                                                                                                                         | 2/128

 18%|██████████████████████████████████████████████████████                                                                                                                                                                                                                                                       | 23/128 [00:09<00:44,  2.36it/s][A
 19%|████████████████████████████████████████████████████████▍                                                                                                                                                                                                                                                    | 24/128 [00:10<00:44,  2.33it/s][A
 20%|██████████████████████████████████████████████████████████▊                                                                                                                                                                                                                                                  | 25/128

 36%|████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                                                                | 46/128 [00:19<00:35,  2.33it/s][A
 37%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                              | 47/128 [00:20<00:34,  2.37it/s][A
 38%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                            | 48/128

 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                          | 69/128 [00:29<00:25,  2.31it/s][A
 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                        | 70/128 [00:29<00:24,  2.32it/s][A
 55%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                      | 71/128

 72%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                    | 92/128 [00:39<00:15,  2.32it/s][A
 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 93/128 [00:39<00:15,  2.27it/s][A
 73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                | 94/128

 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                              | 115/128 [00:49<00:05,  2.36it/s][A
 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                            | 116/128 [00:49<00:05,  2.31it/s][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                         | 117/128

  6%|██████████████████▉                                                                                                                                                                                                                                                                                           | 8/128 [00:03<00:50,  2.37it/s][A
  7%|█████████████████████▏                                                                                                                                                                                                                                                                                        | 9/128 [00:03<00:49,  2.39it/s][A
  8%|███████████████████████▌                                                                                                                                                                                                                                                                                     | 10/128

 24%|████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                                                                    | 31/128 [00:13<00:40,  2.39it/s][A
 25%|███████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                                                                                 | 32/128 [00:13<00:40,  2.38it/s][A
 26%|█████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                                                               | 33/128

 42%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                              | 54/128 [00:22<00:31,  2.33it/s][A
 43%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                                           | 55/128 [00:23<00:31,  2.31it/s][A
 44%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                         | 56/128

 60%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                        | 77/128 [00:32<00:21,  2.35it/s][A
 61%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                     | 78/128 [00:33<00:21,  2.35it/s][A
 62%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                   | 79/128

 78%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 100/128 [00:42<00:12,  2.33it/s][A
 79%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                               | 101/128 [00:42<00:11,  2.32it/s][A
 80%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                             | 102/128

 96%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎           | 123/128 [00:52<00:02,  2.33it/s][A
 97%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋         | 124/128 [00:52<00:01,  2.35it/s][A
 98%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉       | 125/128

 12%|█████████████████████████████████████▋                                                                                                                                                                                                                                                                       | 16/128 [00:06<00:46,  2.42it/s][A
 13%|███████████████████████████████████████▉                                                                                                                                                                                                                                                                     | 17/128 [00:07<00:46,  2.38it/s][A
 14%|██████████████████████████████████████████▎                                                                                                                                                                                                                                                                  | 18/128

 30%|███████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                                                                                 | 39/128 [00:16<00:37,  2.34it/s][A
 31%|██████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                                                                                               | 40/128 [00:17<00:37,  2.33it/s][A
 32%|████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                                                                            | 41/128

 48%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                                           | 62/128 [00:26<00:27,  2.36it/s][A
 49%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                        | 63/128 [00:27<00:27,  2.35it/s][A
 50%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                      | 64/128

 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                     | 85/128 [00:36<00:17,  2.41it/s][A
 67%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                  | 86/128 [00:36<00:17,  2.42it/s][A
 68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                | 87/128

 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                              | 108/128 [00:46<00:08,  2.31it/s][A
 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                            | 109/128 [00:46<00:08,  2.32it/s][A
 86%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                          | 110/128

  1%|██▎                                                                                                                                                                                                                                                                                                           | 1/128 [00:00<00:59,  2.12it/s][A
  2%|████▋                                                                                                                                                                                                                                                                                                         | 2/128 [00:00<00:56,  2.22it/s][A
  2%|███████                                                                                                                                                                                                                                                                                                       | 3/128

 19%|████████████████████████████████████████████████████████▍                                                                                                                                                                                                                                                    | 24/128 [00:10<00:44,  2.33it/s][A
 20%|██████████████████████████████████████████████████████████▊                                                                                                                                                                                                                                                  | 25/128 [00:10<00:43,  2.35it/s][A
 20%|█████████████████████████████████████████████████████████████▏                                                                                                                                                                                                                                               | 26/128

 37%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                              | 47/128 [00:19<00:34,  2.38it/s][A
 38%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                                                            | 48/128 [00:20<00:32,  2.44it/s][A
 38%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                                                                         | 49/128

 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                        | 70/128 [00:29<00:25,  2.28it/s][A
 55%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                      | 71/128 [00:30<00:23,  2.43it/s][A
 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                   | 72/128

 73%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                  | 93/128 [00:39<00:14,  2.34it/s][A
 73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                | 94/128 [00:40<00:14,  2.36it/s][A
 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                             | 95/128

 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                            | 116/128 [00:49<00:05,  2.39it/s][A
 91%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                         | 117/128 [00:49<00:04,  2.35it/s][A
 92%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                       | 118/128

  9%|██████████████████████████▏                                                                                                                                                                                                                                                                                   | 9/104 [00:03<00:39,  2.41it/s][A
 10%|████████████████████████████▉                                                                                                                                                                                                                                                                                | 10/104 [00:04<00:38,  2.45it/s][A
 11%|███████████████████████████████▊                                                                                                                                                                                                                                                                             | 11/104

 31%|████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                                                | 32/104 [00:12<00:28,  2.55it/s][A
 32%|███████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                                                                                                             | 33/104 [00:13<00:27,  2.56it/s][A
 33%|██████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                                                                          | 34/104

 53%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                                             | 55/104 [00:21<00:19,  2.48it/s][A
 54%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                           | 56/104 [00:22<00:19,  2.48it/s][A
 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                        | 57/104

 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                           | 78/104 [00:31<00:10,  2.48it/s][A
 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                        | 79/104 [00:31<00:10,  2.46it/s][A
 77%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                     | 80/104

 97%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎        | 101/104 [00:40<00:01,  2.39it/s][A
 98%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏     | 102/104 [00:40<00:00,  2.44it/s][A
 99%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████   | 103/104

In [24]:

earliest_moves = torch.tensor(earliest_layers_move).reshape(test_size, -1)
earliest_boards = torch.tensor(earliest_layers_board).reshape(test_size, -1)
assert len(earliest_moves) == len(earliest_boards)

wrong_move = 0
wrong_board = 0
board_first = 0
same = 0
move_first = 0
earliers = []
sames = []
laters = []
wrong_moves = []
wrong_boards = []

for idx in range(earliest_moves.shape[1]):
    move_layers = earliest_moves[:, idx]
    board_layers = earliest_boards[:, idx]
    mask = board_layers.ne(9) * move_layers.ne(9)
    mask_idxs = mask.nonzero().squeeze()
    _move_layers = move_layers[mask_idxs]
    _board_layers = board_layers[mask_idxs]

    assert (_move_layers == 9).sum() == 0
    assert (_board_layers == 9).sum() == 0

    earlier = (
        _board_layers.lt(_move_layers).sum() / board_layers.shape[0]
    ).item()
    same = (
        _board_layers.eq(_move_layers).sum() / board_layers.shape[0]
    ).item()
    later = (
        _board_layers.gt(_move_layers).sum() / board_layers.shape[0]
    ).item()

    wrong_move = ((move_layers == 9).sum() / move_layers.shape[0]).item()
    wrong_board = ((board_layers == 9).sum() / board_layers.shape[0]).item()

    earliers.append(earlier)
    sames.append(same)
    laters.append(later)
    wrong_moves.append(wrong_move)
    wrong_boards.append(wrong_board)

In [31]:

_mask = earliest_boards.ne(9)
avg_first_layer_board = (earliest_boards * _mask).sum(dim=0) / _mask.sum(dim=0)
_mask = earliest_moves.ne(9)
avg_first_layer_move = (earliest_moves * _mask).sum(dim=0) / _mask.sum(dim=0)

tensor([0.0000, 0.0000, 0.0000, 0.0500, 0.1530, 0.2250, 0.4070, 0.5050, 0.6640,
        0.7920, 0.9690, 1.0410, 1.1513, 1.2615, 1.3737, 1.5120, 1.6359, 1.7753,
        1.8656, 1.9870, 2.0732, 2.1354, 2.2608, 2.3719, 2.4849, 2.5464, 2.6898,
        2.7238, 2.8186, 2.9505, 3.0397, 3.1330, 3.2721, 3.3476, 3.4837, 3.5231,
        3.6035, 3.6931, 3.7582, 3.8466, 3.8758, 4.0054, 4.0448, 4.1698, 4.1553,
        4.2958, 4.3482, 4.4157, 4.4958, 4.6053, 4.6634, 4.6877, 4.7785, 4.7935,
        4.9363, 5.0145, 5.0971, 5.1712, 5.2182])


In [44]:

from plotly.subplots import make_subplots
import plotly
import plotly.graph_objects as go
import plotly.express as px

greys = px.colors.sequential.gray

data = {
    "Before": earliers,
    "Same": sames,
    "After": laters,
    "Incorrect (Move)": wrong_moves,
    "Incorrect (Boards)": wrong_boards,
}

INCLUDE_EARLIEST_LAYER_BOARDSTATE = 1
INCLUDE_EARLIEST_LAYER_MOVES = 1

BARCHART_KEYS = [
    "Before",
    "Same",
    "After",
    "Incorrect (Move)",
    "Incorrect (Boards)",
]
COLORS = [
    greys[9],
    greys[5],
    greys[1],
    "blue",
    "#d62728",
]


widths = [1] * len(earliers)
fig = make_subplots(specs=[[{"secondary_y": True}]])
for idx, key in enumerate(BARCHART_KEYS):
    fig.add_trace(
        go.Bar(
            name=key,
            y=data[key],
            x=list(range(len(earliers))),
            width=widths,
            offset=0,
            marker_color=COLORS[idx],
        )
    )

if INCLUDE_EARLIEST_LAYER_BOARDSTATE:
    fig.add_trace(
        dict(
            x=list(range(len(earliers))),
            y=avg_first_layer_board,
            name="Earliest Layer, Board-state",
            type="scatter",
            line=dict(color="greenyellow"),
        ),
        secondary_y=True,
    )

if INCLUDE_EARLIEST_LAYER_MOVES:
    fig.add_trace(
        dict(
            x=list(range(len(earliers))),
            y=avg_first_layer_move,
            name="Earliest Layer, Moves",
            type="scatter",
            line=dict(color="aqua"),
        ),
        secondary_y=True,
    )

fig.update_layout(
    barmode="stack",
)
fig.update_yaxes(range=[0, 7], secondary_y=True)
fig.update_layout(
    yaxis1_tickvals = [0, 0.2, 0.4, 0.6, 0.8, 1],
    yaxis2_tickvals = [0, 1, 2, 3, 4, 5, 6, 7],
)
fig.show()