In [87]:
from gym import Env
from gym.spaces import Discrete, Box
import numpy as np
import math
from itertools import combinations
from datetime import datetime
from music21 import *

For the reward function:  
if correct segmentation: output +1 #(change of roughness)  
if incorrect segmentation: output -1#(correct change of roughness in the next segmentation)  
if correct do nothing : output +1  
if incorrect do nothing: output -1 #(correct change of roughness)  
if illegal: output 0  

In [93]:
class SegmentationEnv(Env):  # Fit one particular coin first
    def __init__(self, pieces):
        #Preprocess the pieces
        self.notes = []
        self.offset = []
        self.beat = []
        self.duration = []
        self.octave = []
        self.correct_offset = []
#         self.beatchanges = []
        for piece in pieces:
            print(piece)
            xnotes = []
            xoffset = []
            xbeat = []
            xduration = []
            xoctave = []
            xcoroffset = []
            c = converter.parse(piece)
            post = c.flattenParts().flat
            for note in post.notes:
                duration = note.duration.quarterLength
                offset = note.offset
                beat = note.beat
                if note.lyric is not None and note.offset != 0:
                    xcoroffset.append(note.offset//1)
                allnotes = list(note.pitches)
                for note1 in allnotes:
                    xnotes.append(note1.name)
                    xoffset.append(offset)
                    xbeat.append(beat)
                    xduration.append(duration)
                    xoctave.append(note1.octave)
            self.notes.append(xnotes)
            self.offset.append(xoffset)
            self.beat.append(xbeat)
            self.duration.append(xduration)
            self.octave.append(xoctave)
            self.correct_offset.append(xcoroffset)
            #             xbeatchange = {}
#             for ts in post.recurse().getElementsByClass(meter.TimeSignature):
#                 assert ts.denominator in [2,4,8]
#                 if ts.denominator == 2:
#                     xbeatchange[ts.offset] = 2
#                 elif ts.denominator == 4:
#                     xbeatchange[ts.offset] = 1
#                 else:
#                     xbeatchange[ts.offset] = 0.5
#             self.beatchanges.append(xbeatchange)

        #Actions: Remain segment (0), segment (1)
        self.action_space = Discrete(2)
        
        #Observations: First dim 12 pitch classes, Second dim Octave (1-7), Value is total duration.
        self.observation_space = Box(
            low=np.zeros((12,7),dtype=np.float32),
            high=np.ones((12,7),dtype=np.float32), 
        )
        
        #internal state: check where the time currently is 
        self.current_piece = 0
        self.current_noteoffset = 0
        self.notelistfirst = 0
        self.notelistlast = 0
        self.latestbeatfirst = 0
        self.latestbeatlast = 0
        self.state = np.zeros((12,7))
        
        #save segmentation for rendering purposes
        self.determined_offset = []
        
    def step(self, action):
        #Calculating reward
        if action == 0: # do nothing
            is_segment = False
            if self.current_noteoffset not in self.correct_offset[self.current_piece]: #correct
                reward = 1
            else:
                reward = max(-self.change_in_roughness()/20,-1)
        else: # segmentation
            is_segment = True
            if self.current_noteoffset == 0: #illegal operations
                reward = -0.7
            else:
                self.determined_offset.append((self.current_piece,self.current_noteoffset))
                if self.current_noteoffset in self.correct_offset[self.current_piece]:
                    reward = 1
                else:
                    reward = -1    
        #determine new obs state
        if is_segment and self.current_noteoffset != 0:
            self.notelistfirst = self.latestbeatfirst
        done = False
        if self.latestbeatlast == len(self.beat[self.current_piece]): #Finished a piece
            self.current_piece += 1
            if self.current_piece == len(self.notes):
                done = True
            else:
                done = False
                self.current_noteoffset = 0
                self.notelistfirst = 0
                self.notelistlast = 0 
                self.latestbeatfirst = 0
                self.latestbeatlast = 0
        if not done:
            self.current_noteoffset = self.offset[self.current_piece][self.latestbeatlast]
            currentbeat = self.beat[self.current_piece][self.latestbeatlast]//1
            currentindex = self.latestbeatlast + 1
            self.latestbeatfirst = self.latestbeatlast
            while len(self.beat[self.current_piece]) > currentindex and self.beat[self.current_piece][currentindex]//1 == currentbeat:
                currentindex += 1
            self.notelistlast = currentindex
            self.latestbeatlast = currentindex
        info = {}
        return self.staterender(done), reward, done, info

    def render(self):
        print("Current piece:",self.current_piece)
        print("Current notelist:",self.notelistfirst,self.notelistlast)
        for segment in self.determined_offset:
            print(segment)
        return
    
    def change_in_roughness(self):
        def roughness(notes):
            '''
            Calculate the Roughness of notes according to sum of ideal ratio N+M
            Reference: https://www.researchgate.net/publication/276905584_Measuring_Musical_Consonance_and_Dissonance
            '''
            def interval_to_ratio(interval):
                interval_ratio_mapping = {
                    0:1+1,
                    1:18+17,
                    2:9+8,
                    3:6+5,
                    4:5+4,
                    5:4+3,
                    6:17+12,
                    7:3+2,
                    8:8+5,
                    9:5+3,
                    10:16+9,
                    11:17+9,
                    12:2+1
                }
                interval_pitch_mapping = {
                    1:0,
                    2:2,
                    3:4,
                    4:5,
                    5:7,
                    6:9,
                    7:11,
                    8:12
                }
                ans = interval_pitch_mapping[int(interval[-1])]
                if int(interval[-1]) in [4,5,8]:
                    intname = interval[:-1]
                    if intname == "dd":
                        ans -= 2
                    elif intname == "d":
                        ans -= 1
                    elif intname == "A":
                        ans += 1
                    elif intname == "AA":
                        ans += 2
                else:
                    intname = interval[:-1]
                    if intname == "m":
                        ans -= 1
                    elif intname == "d":
                        ans -= 2
                    elif intname == "A":
                        ans += 1
                    elif intname == "AA":
                        ans += 2
                ans = ans%12
                return interval_ratio_mapping[ans]
            ans = 0
            for combo in combinations(notes,2):
                n1 = note.Note(combo[0])
                n2 = note.Note(combo[1])
                xinterval = interval.Interval(noteStart=n1,noteEnd=n2)
                ans += interval_to_ratio(xinterval.semiSimpleName)
            return ans/len(notes) if len(notes)!= 0 else 0
        notelist1 = []
        for i in range(self.notelistfirst,self.latestbeatfirst):
            notelist1.append(self.notes[self.current_piece][i]+str(self.octave[self.current_piece][i]))
        notelist2 = notelist1.copy()
        for i in range(self.latestbeatfirst,self.latestbeatlast):
            notelist2.append(self.notes[self.current_piece][i]+str(self.octave[self.current_piece][i]))
        notelist1 = list(dict.fromkeys(notelist1))
        notelist2 = list(dict.fromkeys(notelist2))
        return abs(roughness(notelist2)-roughness(notelist1))
    
    def staterender(self,done):
        pitch_to_index = {"C": 0, "D": 2, "E": 4, "F": 5, "G": 7, "A": 9, "B": 11}
        obsarray = np.zeros((12,7))
        notelist = []
        if done:
            return obsarray
        for idx in range(self.notelistfirst,self.notelistlast):
            current_note = self.notes[self.current_piece][idx]
            notelist.append(current_note)
            current_duration = self.duration[self.current_piece][idx]
            current_octave = self.octave[self.current_piece][idx]
            pitchindex = pitch_to_index[current_note[0]]
            current_note = current_note[1:]
            if current_note == "#":
                pitchindex += 1
            elif current_note == "##":
                pitchindex += 2
            elif current_note == "-":
                pitchindex -= 1
            elif current_note == "--":
                pitchindex -= 2
            pitchindex = pitchindex % 12
            if current_octave < 1 or current_octave > 7:
                continue
            current_octave -= 1
            obsarray[pitchindex][current_octave] += current_duration
            obsarray[pitchindex][current_octave] = min(20,obsarray[pitchindex][current_octave])
#         print(notelist)
        obsarray = obsarray/20
        return obsarray

    def reset(self):
        self.current_piece = 0
        self.current_noteoffset = 0
        self.notelistfirst = 0
        self.notelistlast = 0 #exclusive
        self.latestbeatfirst = 0
        self.latestbeatlast = 0 #exclusive
        currentbeat = self.beat[self.current_piece][self.latestbeatlast]//1
        currentindex = self.latestbeatlast + 1
        while len(self.beat[self.current_piece]) > currentindex and self.beat[self.current_piece][currentindex]//1 == currentbeat:
            currentindex += 1
        self.notelistlast = currentindex
        self.latestbeatlast = currentindex
        return self.staterender(False)

In [85]:
import time
env = SegmentationEnv(["../review/not1_Prelude_I.musicxml","../review/not_Arabesque_No._1_in_E_Major.musicxml"])
cur_state = env.reset()
done = False
while not done:
    env.render()
    action = env.action_space.sample()
    print("Action taken:",action)
    new_state, reward, done, _ = env.step(action)
    print("Reward:",reward)


Current piece: 0
Current notelist: 0 4
Action taken: 1
Reward: 0
Current piece: 0
Current notelist: 0 9
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 0 13
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 0 18
Action taken: 1
Reward: -1
Current piece: 0
Current notelist: 13 22
(0, 3.0)
Action taken: 0
Reward: -1
Current piece: 0
Current notelist: 13 27
(0, 3.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 13 31
(0, 3.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 13 36
(0, 3.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 13 40
(0, 3.0)
Action taken: 1
Reward: 1
Current piece: 0
Current notelist: 36 45
(0, 3.0)
(0, 8.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 36 49
(0, 3.0)
(0, 8.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 36 54
(0, 3.0)
(0, 8.0)
Action taken: 1
Reward: -1
Current piece: 0
Current notelist: 49 58
(0, 3.0)
(0, 8.0)
(0, 11.0)
Action taken: 1
Reward: 1
Curre

(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 346 360
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 346 364
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70

(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
Action taken: 0
Reward: 1
Current piece: 0
Current notelist: 526 540
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)


Reward: -0.3777777777777779
Current piece: 1
Current notelist: 21 44
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
Action taken: 0
Reward: 1
Current piece: 1
Current notelist: 21 50
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0

Reward: -0.695
Current piece: 1
Current notelist: 126 139
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
Action taken: 1
Reward: -1
Current piece: 1
Current notelist: 136 141
(0, 3.0)
(0, 8

(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
Action taken: 0
Reward: 1
Current piece: 1
Current notelist: 183 195
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1,

Action taken: 0
Reward: 1
Current piece: 1
Current notelist: 242 256
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1,

(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
Action taken: 0
Reward: -1
Current piece: 1
Current notelist: 286 299
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)

Reward: -1
Current piece: 1
Current notelist: 328 342
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0

(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
Action taken: 0
Reward: 1
Current piece: 1
Current notelist: 384 401
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.

Reward: -1
Current piece: 1
Current notelist: 421 435
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0

(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
Action taken: 0
Reward: 1
Current piece: 1
Current notelist: 469 478
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0,

(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)


Reward: -0.6
Current piece: 1
Current notelist: 555 568
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45

(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
Action taken: 0
Reward: -1
Current piece: 1
Current notelist: 602 613
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0,

Action taken: 0
Reward: -0.23968253968253955
Current piece: 1
Current notelist: 640 655
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 

(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)


(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
Action taken: 1
Reward: 1
Current piece: 1
Current notelist: 739 747
(0, 3.0)
(0, 8.0)
(0, 

(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(

(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
(1, 204.0)
(1, 208.0)
(1, 209.0)
(1, 213.0)
(1, 214.0)
(1, 220.0)
(1, 221.0)
Action taken: 1
Reward: -1
Current piece: 1
Current notelist: 810 817
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(

(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(

Current notelist: 867 882
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51

Current notelist: 911 919
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51

(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)


(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(

(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)


(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 

Reward: -0.6457692307692305
Current piece: 1
Current notelist: 1078 1101
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)

(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1

(1, 312.0)
(1, 313.0)
(1, 317.0)
Action taken: 1
Reward: 1
Current piece: 1
Current notelist: 1153 1159
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0

Reward: -0.7035714285714285
Current piece: 1
Current notelist: 1172 1186
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)

(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
(1, 204.0)
(1, 208.0)
(1, 209.0)
(1, 213.0)
(1, 214.0)
(1, 220.0)
(1, 221.0)
(1, 223.0)
(1, 224.0)
(1, 225.0)
(1, 229.0)
(1, 237.0)
(1, 239.0)
(1, 243.0)
(1, 246.0)
(1, 247.0)
(1, 248.0)
(1, 252.0)
(1, 253.0)
(1, 255.0)
(1, 257.0)
(1, 261.0)
(1, 262.0)
(1, 264.0)
(1, 265.0)
(1, 268.0)
(1, 275.0)
(1, 278.0)
(1, 279.0)
(1, 280.0)
(1, 282.0)
(1, 284.0)
(1, 287.0)
(1, 289.0)
(1, 290.0)
(1, 292.0)
(1, 293.0)
(1, 295.0)
(1, 298.0)
(1, 301.0)
(1, 308.0)
(1, 309.0)
(1, 310.0)
(1, 311.0)
(1, 312.0)
(1, 313.0)
(1, 317.0)
(1, 320.0)
(1, 323.0)
(1, 326.0)
(1, 329.0)
(1, 330.0)
(1, 331.0)
(1, 333.0)
(1, 334.0)
(1, 335.0)
(1, 336.0)
(1, 337.0)
Action taken: 1
Reward: 1
Current piece: 1
Current notelist: 1212 1218
(0, 3.0)
(0, 8.0)
(0, 11.0)

(1, 247.0)
(1, 248.0)
(1, 252.0)
(1, 253.0)
(1, 255.0)
(1, 257.0)
(1, 261.0)
(1, 262.0)
(1, 264.0)
(1, 265.0)
(1, 268.0)
(1, 275.0)
(1, 278.0)
(1, 279.0)
(1, 280.0)
(1, 282.0)
(1, 284.0)
(1, 287.0)
(1, 289.0)
(1, 290.0)
(1, 292.0)
(1, 293.0)
(1, 295.0)
(1, 298.0)
(1, 301.0)
(1, 308.0)
(1, 309.0)
(1, 310.0)
(1, 311.0)
(1, 312.0)
(1, 313.0)
(1, 317.0)
(1, 320.0)
(1, 323.0)
(1, 326.0)
(1, 329.0)
(1, 330.0)
(1, 331.0)
(1, 333.0)
(1, 334.0)
(1, 335.0)
(1, 336.0)
(1, 337.0)
(1, 338.0)
(1, 341.0)
(1, 344.0)
Action taken: 1
Reward: 1
Current piece: 1
Current notelist: 1238 1245
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 8

(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
(1, 204.0)
(1, 208.0)
(1, 209.0)
(1, 213.0)
(1, 214.0)
(1, 220.0)
(1, 221.0)
(1, 223.0)
(1, 224.0)
(1, 225.0)
(1, 229.0)
(1, 237.0)
(1, 239.0)
(1, 243.0)
(1, 246.0)
(1, 247.0)
(1, 248.0)
(1, 252.0)
(1, 253.0)
(1, 255.0)
(1, 257.0)
(1, 261.0)
(1, 262.0)
(1, 264.0)
(1, 265.0)
(1, 268.0)
(1, 275.0)
(1, 278.0)
(1, 279.0)
(1, 280.0)
(1, 282.0)
(1, 284.0)
(1, 287.0)
(1, 289.0)
(1, 290.0)
(1, 292.0)
(1, 293.0)
(1, 295.0)
(1, 298.0)
(1, 301.0)
(1, 308.0)
(1, 309.0)
(1, 310.0)
(1, 311.0)
(1, 312.0)
(1, 313.0)
(1, 317.0)
(1, 320.0)
(1, 323.0)
(1, 326.0)
(1, 329.0)
(1, 330.0)
(1, 331.0)
(1, 333.0)
(1, 334.0)
(1, 335.0)
(1, 336.0)
(1, 337.0)
(1, 338.0)
(1, 341.0)
(1, 344.0)
(1, 346.0)
(1, 348.0)
(1, 350.0)
(1, 351.0)
(1, 352.0)
Action taken: 1
Reward: -1
Current piece: 1
Current notelist: 1264 1276
(0, 3.0)
(0, 8.

(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)


(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(

(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 

Reward: 1
Current piece: 1
Current notelist: 1406 1413
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.

(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
(1, 204.0)
(1, 208.0)
(1, 209.0)
(1, 213.0)
(1, 214.0)
(1, 220.0)
(1, 221.0)
(1, 223.0)
(1, 224.0)
(1, 225.0)
(1, 229.0)
(1, 237.0)
(1, 239.0)
(1, 243.0)
(1, 246.0)
(1, 247.0)
(1, 248.0)
(1, 252.0)
(1, 253.0)
(1, 255.0)
(1, 257.0)
(1, 261.0)
(1, 262.0)
(1, 264.0)
(1, 265.0)
(1, 268.0)
(1, 275.0)
(1, 278.0)
(1, 279.0)
(1, 280.0)
(1, 282.0)
(1, 284.0)
(1, 287.0)
(1, 289.0)
(1, 290.0)
(1, 292.0)
(1, 293.0)
(1, 295.0)
(1, 298.0)
(1, 301.0)
(1, 308.0)
(1, 309.0)
(1, 310.0)
(1, 311.0)
(1, 312.0)
(1, 313.0)
(1, 317.0)
(1, 320.0)
(1, 323.0)
(1, 326.0)
(1, 329.0)
(1, 330.0)
(1, 331.0)
(1, 333.0)

(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
(1, 204.0)
(1, 208.0)
(1, 209.0)
(1, 213.0)
(1, 214.0)
(1, 220.0)
(1, 221.0)
(1, 223.0)
(1, 224.0)
(1, 225.0)
(1, 229.0)
(1, 237.0)
(1, 239.0)
(1, 243.0)
(1, 246.0)
(1, 247.0)
(1, 248.0)
(1, 252.0)
(1, 253.0)
(1, 255.0)
(1, 257.0)
(1, 261.0)
(1, 262.0)
(1, 264.0)
(1, 265.0)
(1, 268.0)
(1, 275.0)
(1, 278.0)
(1, 279.0)
(1, 280.0)
(1, 282.0)
(1, 284.0)
(1, 287.0)
(1, 289.0)
(1, 290.0)
(1, 292.0)
(1, 293.0)
(1, 295.0)
(1, 298.0)
(1, 301.0)
(1, 308.0)
(1, 309.0)
(1, 310.0)
(1, 311.0)
(1, 312.0)
(1, 313.0)
(1, 317.0)
(1, 320.0)
(1, 323.0)
(1, 326.0)
(1, 329.0)
(1, 330.0)
(1, 331.0)
(1, 333.0)
(1, 334.0)
(1, 335.0)
(1, 336.0)
(1, 337.0)
(1, 338.0)
(1, 341.0)
(1, 344.0)
(1, 346.0)
(1, 348.0)
(1, 350.0)
(1, 351.0)
(1, 352.0)
(1, 353.0)
(1, 358.0)
(1, 360.0)
(1, 364.0)
(1, 365.0)
(1, 369.0)
(1, 372.0)
(1, 373.0)
(1, 374.0)
(1, 378.0)
(1, 380.0)
(1, 381.0)
(1, 382.0)
(1, 383.0)
(1, 384.0)
(1, 385.0)

(1, 264.0)
(1, 265.0)
(1, 268.0)
(1, 275.0)
(1, 278.0)
(1, 279.0)
(1, 280.0)
(1, 282.0)
(1, 284.0)
(1, 287.0)
(1, 289.0)
(1, 290.0)
(1, 292.0)
(1, 293.0)
(1, 295.0)
(1, 298.0)
(1, 301.0)
(1, 308.0)
(1, 309.0)
(1, 310.0)
(1, 311.0)
(1, 312.0)
(1, 313.0)
(1, 317.0)
(1, 320.0)
(1, 323.0)
(1, 326.0)
(1, 329.0)
(1, 330.0)
(1, 331.0)
(1, 333.0)
(1, 334.0)
(1, 335.0)
(1, 336.0)
(1, 337.0)
(1, 338.0)
(1, 341.0)
(1, 344.0)
(1, 346.0)
(1, 348.0)
(1, 350.0)
(1, 351.0)
(1, 352.0)
(1, 353.0)
(1, 358.0)
(1, 360.0)
(1, 364.0)
(1, 365.0)
(1, 369.0)
(1, 372.0)
(1, 373.0)
(1, 374.0)
(1, 378.0)
(1, 380.0)
(1, 381.0)
(1, 382.0)
(1, 383.0)
(1, 384.0)
(1, 385.0)
(1, 387.0)
(1, 388.0)
(1, 390.0)
(1, 391.0)
(1, 399.0)
Action taken: 1
Reward: -1
Current piece: 1
Current notelist: 1476 1486
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42

(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(1, 196.0)
(1, 199.0)
(1, 200.0)
(1, 201.0)
(1, 203.0)
(1, 204.0)
(1, 208.0)
(1, 209.0)
(1, 213.0)
(1, 214.0)
(1, 220.0)
(1, 221.0)
(1, 223.0)
(1, 224.0)
(1, 225.0)
(1, 229.0)
(1, 237.0)
(1, 239.0)
(1, 243.0)
(1, 246.0)
(1, 247.0)
(1, 248.0)
(1, 252.0)
(1, 253.0)
(1, 255.0)
(1, 257.0)
(1, 261.0)
(1, 262.0)
(1, 264.

Current piece: 1
Current notelist: 1518 1524
(0, 3.0)
(0, 8.0)
(0, 11.0)
(0, 12.0)
(0, 13.0)
(0, 16.0)
(0, 17.0)
(0, 18.0)
(0, 19.0)
(0, 21.0)
(0, 23.0)
(0, 24.0)
(0, 25.0)
(0, 26.0)
(0, 31.0)
(0, 32.0)
(0, 34.0)
(0, 35.0)
(0, 36.0)
(0, 37.0)
(0, 39.0)
(0, 40.0)
(0, 42.0)
(0, 43.0)
(0, 45.0)
(0, 46.0)
(0, 49.0)
(0, 52.0)
(0, 55.0)
(0, 57.0)
(0, 58.0)
(0, 59.0)
(0, 65.0)
(0, 66.0)
(0, 67.0)
(0, 70.0)
(0, 71.0)
(0, 73.0)
(0, 74.0)
(0, 77.0)
(0, 81.0)
(0, 82.0)
(0, 83.0)
(0, 84.0)
(0, 85.0)
(0, 86.0)
(0, 87.0)
(0, 88.0)
(0, 89.0)
(0, 90.0)
(0, 93.0)
(0, 94.0)
(0, 98.0)
(0, 101.0)
(0, 102.0)
(0, 105.0)
(0, 108.0)
(0, 111.0)
(0, 113.0)
(0, 117.0)
(0, 121.0)
(0, 122.0)
(0, 123.0)
(0, 124.0)
(0, 127.0)
(0, 128.0)
(0, 130.0)
(0, 131.0)
(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.

(1, 1.0)
(1, 2.0)
(1, 4.0)
(1, 6.0)
(1, 7.0)
(1, 12.0)
(1, 13.0)
(1, 14.0)
(1, 16.0)
(1, 21.0)
(1, 22.0)
(1, 24.0)
(1, 25.0)
(1, 27.0)
(1, 28.0)
(1, 30.0)
(1, 31.0)
(1, 33.0)
(1, 35.0)
(1, 36.0)
(1, 37.0)
(1, 38.0)
(1, 39.0)
(1, 40.0)
(1, 42.0)
(1, 45.0)
(1, 47.0)
(1, 50.0)
(1, 51.0)
(1, 52.0)
(1, 53.0)
(1, 55.0)
(1, 57.0)
(1, 58.0)
(1, 60.0)
(1, 61.0)
(1, 63.0)
(1, 65.0)
(1, 69.0)
(1, 77.0)
(1, 81.0)
(1, 82.0)
(1, 86.0)
(1, 87.0)
(1, 89.0)
(1, 91.0)
(1, 92.0)
(1, 93.0)
(1, 94.0)
(1, 97.0)
(1, 98.0)
(1, 99.0)
(1, 100.0)
(1, 105.0)
(1, 107.0)
(1, 108.0)
(1, 109.0)
(1, 110.0)
(1, 112.0)
(1, 113.0)
(1, 117.0)
(1, 118.0)
(1, 122.0)
(1, 128.0)
(1, 129.0)
(1, 132.0)
(1, 133.0)
(1, 135.0)
(1, 136.0)
(1, 139.0)
(1, 140.0)
(1, 141.0)
(1, 143.0)
(1, 144.0)
(1, 147.0)
(1, 150.0)
(1, 153.0)
(1, 159.0)
(1, 160.0)
(1, 163.0)
(1, 167.0)
(1, 169.0)
(1, 171.0)
(1, 172.0)
(1, 173.0)
(1, 175.0)
(1, 177.0)
(1, 181.0)
(1, 185.0)
(1, 186.0)
(1, 187.0)
(1, 188.0)
(1, 189.0)
(1, 190.0)
(1, 191.0)
(1, 192.0)
(

In [89]:
import glob
training_pieces = []
for piece in glob.glob('../musicxml(notated)/*.mxl'):
    training_pieces.append(piece)
testing_pieces = []
for piece in glob.glob('../review/*.musicxml'):
    testing_pieces.append(piece)

In [91]:
print(training_pieces,testing_pieces)

['../musicxml(notated)\\Bach_Fugue_in_G_Minor_BWV_578_Piano_solo.mxl', '../musicxml(notated)\\Bach_Musette_in_D_BWV_Anh._126.mxl', '../musicxml(notated)\\C.P.E._Bach_Solfeggietto_in_C_minor.mxl', '../musicxml(notated)\\Chopin_-_Nocturne_Op_9_No_1_B_Flat_Minor.mxl', '../musicxml(notated)\\Etude_Opus_10_No._11__in_E_Major.mxl', '../musicxml(notated)\\E╠ütude_in_C_Minor.mxl', '../musicxml(notated)\\E╠ütude_in_F_Major.mxl', '../musicxml(notated)\\E╠ütude_in_F_Minor.mxl', '../musicxml(notated)\\E╠ütude_in_Gb_Major.mxl', '../musicxml(notated)\\E╠ütude_in_Gb_Major_Opus_25.mxl', '../musicxml(notated)\\G_Minor_Bach.mxl', '../musicxml(notated)\\Il_Vecchio_Castello.mxl', '../musicxml(notated)\\Menuet_in_G_Minor.mxl', '../musicxml(notated)\\Minuet_in_F.mxl', '../musicxml(notated)\\Minuet_in_G_Major_2nd.mxl', '../musicxml(notated)\\Moonlight_Sonata_1st_Movement.mxl', '../musicxml(notated)\\Nocturne_in_B_Major.mxl', '../musicxml(notated)\\Nocturne_in_C#_Minor.mxl', '../musicxml(notated)\\Nocturne_in

In [92]:
from stable_baselines3 import DQN

env = SegmentationEnv(training_pieces)

model = DQN("MlpPolicy", env, verbose=1)
model.learn(total_timesteps=100000, log_interval=4)
model.save("segmenatation_1")

env = SegmentationEnv(testing_pieces)
obs = env.reset()
while True:
    action, _states = model.predict(obs, deterministic=True)
    obs, reward, done, info = env.step(action)
    env.render()
    if done:
        break

KeyboardInterrupt: 