In [8]:
import pandas as pd
import torch
import torch.optim as optim
import torch.nn as nn
import time
import SquareData
import PoorEyesightModel

In [9]:
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
device

device(type='cuda')

In [10]:
net = PoorEyesightModel.PoorEyesightModel(64*2*16, 64*2*64, 64*2*32)
net.to(device)
optimizer = optim.SGD(net.parameters(), lr=0.001, momentum=0.9)
#criterion = PoorEyesightLoss
criterion = nn.CrossEntropyLoss()

In [11]:
net.nonlinearity

Sigmoid()

In [12]:
n_epochs = 30
batch_size = 1000
n_batches_per_file = int(100000/batch_size)
total_files = 55

In [13]:
start = time.time()
for epoch in range(n_epochs):
    print(f'EPOCH: {epoch}')
    epoch_loss = 0
    for file_idx in range(total_files):
        #print(f'Loading file ./processed_data/processed_data_{file_idx}.csv')
        df = pd.read_csv(f'./processed_data/processed_data_{file_idx}.csv')
        input_data = torch.FloatTensor(df[SquareData.input_features].values).to(device)
        output_data = torch.FloatTensor(df[SquareData.output_features].values).to(device)

        data_idx = 0
        for batch_idx in range(n_batches_per_file):
            input_data_batch = input_data[data_idx:(data_idx+batch_size)]
            output_data_batch = output_data[data_idx:(data_idx+batch_size)]

            optimizer.zero_grad()
            output = net(input_data_batch)
            loss = criterion(output,output_data_batch)
            loss.backward()
            optimizer.step()
            data_idx += batch_size
            epoch_loss += loss
            #print(f'Batch {batch_idx} loss: {loss:.4f}, total time: {(time.time()-start):.2f}')
    print(f'Epoch {epoch} loss: {epoch_loss:.4f}, average board state loss: {epoch_loss/5500000:.4f}, total time: {(time.time()-start):.2f}')


EPOCH: 0
Epoch 0 loss: 2158664.5000, average board state loss: 0.3925, total time: 552.93
EPOCH: 1
Epoch 1 loss: 2152810.2500, average board state loss: 0.3914, total time: 1100.30
EPOCH: 2
Epoch 2 loss: 2150826.5000, average board state loss: 0.3911, total time: 1643.14
EPOCH: 3
Epoch 3 loss: 2149963.2500, average board state loss: 0.3909, total time: 2153.16
EPOCH: 4


KeyboardInterrupt: 

In [17]:
torch.save(net.state_dict(), './30epoch_net2.pt')

In [17]:
input_data_batch[0]

tensor([0., 0., 1., 1., 0., 0., 0., 0., 1., 0., 0., 1., 0., 0., 1., 0., 0., 1.,
        0., 1., 0., 0., 0., 1., 0., 0., 1., 1., 0., 0., 0., 0., 1., 0., 0., 1.,
        0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 0., 1., 0., 0., 1., 1., 0., 0.,
        0., 0., 1., 0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 0., 1., 0., 0., 1.,
        1., 0., 0., 0., 0., 1., 1., 0., 0., 0., 1., 0., 0., 0., 1., 0., 0., 1.,
        0., 0., 1., 0., 1., 0., 0., 0., 1., 0., 0., 1., 1., 0., 0., 0., 1., 0.,
        0., 0., 1., 0., 0., 1., 0., 0., 1., 0., 1., 0., 1., 0., 0., 1., 0., 0.,
        0., 0., 1., 0., 0., 1., 0., 0., 1., 0., 0., 1., 0., 0., 1., 0., 0., 1.,
        0., 0., 1., 1., 0., 0., 1., 0., 0., 0., 0., 1., 0., 0., 1., 0., 1., 0.,
        0., 1., 0., 0., 0., 1., 0., 0., 1., 1., 0., 0., 0., 0., 1., 0., 0., 1.,
        0., 0., 1., 0., 0., 1., 0., 1., 0., 0., 0., 1.], device='cuda:0')

In [18]:
testout = net(input_data_batch)

In [30]:
PoorEyesightPredictBoardState(testout[0])

{'a1': 'x',
 'a2': 'wp',
 'a3': 'x',
 'a4': 'x',
 'a5': 'x',
 'a6': 'x',
 'a7': 'bp',
 'a8': 'x',
 'b1': 'x',
 'b2': 'wp',
 'b3': 'x',
 'b4': 'x',
 'b5': 'x',
 'b6': 'x',
 'b7': 'x',
 'b8': 'x',
 'c1': 'x',
 'c2': 'x',
 'c3': 'x',
 'c4': 'x',
 'c5': 'x',
 'c6': 'x',
 'c7': 'x',
 'c8': 'x',
 'd1': 'x',
 'd2': 'x',
 'd3': 'x',
 'd4': 'x',
 'd5': 'x',
 'd6': 'x',
 'd7': 'x',
 'd8': 'x',
 'e1': 'x',
 'e2': 'x',
 'e3': 'x',
 'e4': 'x',
 'e5': 'x',
 'e6': 'x',
 'e7': 'x',
 'e8': 'x',
 'f1': 'x',
 'f2': 'wp',
 'f3': 'x',
 'f4': 'x',
 'f5': 'x',
 'f6': 'x',
 'f7': 'bp',
 'f8': 'x',
 'g1': 'x',
 'g2': 'wp',
 'g3': 'x',
 'g4': 'x',
 'g5': 'x',
 'g6': 'x',
 'g7': 'bp',
 'g8': 'x',
 'h1': 'x',
 'h2': 'wp',
 'h3': 'x',
 'h4': 'x',
 'h5': 'x',
 'h6': 'x',
 'h7': 'bp',
 'h8': 'x'}

In [31]:
PoorEyesightPredictBoardState(output_data_batch[0])

{'a1': 'x',
 'a2': 'wp',
 'a3': 'x',
 'a4': 'x',
 'a5': 'x',
 'a6': 'x',
 'a7': 'bp',
 'a8': 'x',
 'b1': 'x',
 'b2': 'wp',
 'b3': 'x',
 'b4': 'x',
 'b5': 'x',
 'b6': 'bp',
 'b7': 'x',
 'b8': 'x',
 'c1': 'x',
 'c2': 'wp',
 'c3': 'x',
 'c4': 'x',
 'c5': 'bp',
 'c6': 'x',
 'c7': 'x',
 'c8': 'x',
 'd1': 'wr',
 'd2': 'x',
 'd3': 'wr',
 'd4': 'bp',
 'd5': 'x',
 'd6': 'x',
 'd7': 'x',
 'd8': 'br',
 'e1': 'x',
 'e2': 'x',
 'e3': 'wb',
 'e4': 'bq',
 'e5': 'x',
 'e6': 'x',
 'e7': 'x',
 'e8': 'br',
 'f1': 'wk',
 'f2': 'wp',
 'f3': 'x',
 'f4': 'x',
 'f5': 'x',
 'f6': 'x',
 'f7': 'x',
 'f8': 'x',
 'g1': 'x',
 'g2': 'wp',
 'g3': 'wq',
 'g4': 'x',
 'g5': 'x',
 'g6': 'bp',
 'g7': 'bb',
 'g8': 'x',
 'h1': 'x',
 'h2': 'wp',
 'h3': 'x',
 'h4': 'x',
 'h5': 'x',
 'h6': 'x',
 'h7': 'bk',
 'h8': 'x'}

In [20]:
testout

tensor([[1.2496e-09, 9.5996e-10, 1.2459e-09,  ..., 2.3640e-09, 5.0241e-09,
         1.0000e+00],
        [2.0145e-07, 1.3505e-07, 1.9613e-07,  ..., 1.1117e-08, 1.4129e-08,
         1.0000e+00],
        [2.2429e-08, 1.2148e-08, 1.2452e-08,  ..., 7.9614e-09, 1.8573e-08,
         1.0000e+00],
        ...,
        [1.2445e-09, 8.8979e-10, 1.1421e-09,  ..., 2.4875e-09, 4.5412e-09,
         1.0000e+00],
        [1.3085e-08, 7.4193e-09, 6.4804e-09,  ..., 6.3021e-09, 1.0924e-08,
         1.0000e+00],
        [6.4931e-08, 6.5663e-08, 9.1911e-08,  ..., 4.0254e-09, 5.7009e-09,
         1.0000e+00]], device='cuda:0', grad_fn=<CatBackward0>)

In [24]:
testout.shape

torch.Size([1000, 800])

In [None]:
{'a1': 'x','a2': 'wp','a3': 'x','a4': 'x','a5': 'x','a6': 'x','a7': 'bp','a8': 'x',
 'b1': 'x','b2': 'wp','b3': 'x','b4': 'x','b5': 'x','b6': 'bp','b7': 'x','b8': 'x',
 'c1': 'x','c2': 'wp','c3': 'x','c4': 'x','c5': 'bp','c6': 'x','c7': 'x','c8': 'x',
 'd1': 'wr','d2': 'x','d3': 'wr','d4': 'bp','d5': 'x','d6': 'x','d7': 'x','d8': 'br',
 'e1': 'x','e2': 'x','e3': 'wb','e4': 'bq','e5': 'x','e6': 'x','e7': 'x','e8': 'br',
 'f1': 'wk','f2': 'wp','f3': 'x','f4': 'x','f5': 'x','f6': 'x','f7': 'x','f8': 'x',
 'g1': 'x','g2': 'wp','g3': 'wq','g4': 'x','g5': 'x','g6': 'bp','g7': 'bb','g8': 'x',
 'h1': 'x','h2': 'wp','h3': 'x','h4': 'x','h5': 'x','h6': 'x','h7': 'bk','h8': 'x'}

{'a1': 'x','a2': 'wp','a3': 'x','a4': 'x','a5': 'x','a6': 'x','a7': 'bp','a8': 'x',
 'b1': 'x','b2': 'wp','b3': 'x','b4': 'x','b5': 'x','b6': 'x','b7': 'x','b8': 'x',
 'c1': 'x','c2': 'x','c3': 'x','c4': 'x','c5': 'x','c6': 'x','c7': 'x','c8': 'x',
 'd1': 'x','d2': 'x','d3': 'x','d4': 'x','d5': 'x','d6': 'x','d7': 'x','d8': 'x',
 'e1': 'x','e2': 'x','e3': 'x','e4': 'x','e5': 'x','e6': 'x','e7': 'x','e8': 'x',
 'f1': 'x','f2': 'wp','f3': 'x','f4': 'x','f5': 'x','f6': 'x','f7': 'bp','f8': 'x',
 'g1': 'x','g2': 'wp','g3': 'x','g4': 'x','g5': 'x','g6': 'x','g7': 'bp','g8': 'x',
 'h1': 'x','h2': 'wp','h3': 'x','h4': 'x','h5': 'x','h6': 'x','h7': 'bp','h8': 'x'}