# 1. Simulation

In [30]:
from string import ascii_uppercase
from draw_utils import *
from pyglet.gl import *
import numpy as np
import pandas as pd
import os



# reward
move_reward = -0.1
obs_reward = -0.2
goal_reward = 15
print('reward:' , move_reward, obs_reward, goal_reward)

local_path = '/home/zlxlekta924/YC' #os.path.abspath(os.path.join(os.path.dirname(__file__)))


class Simulator:
    def __init__(self):
        '''
        height : 그리드 높이
        width : 그리드 너비 
        inds : A ~ Q alphabet list
        '''

        
        # Load train data
        self.files = pd.read_csv(os.path.join(local_path, "./data/factory_order_train.csv"))
        self.height = 10
        self.width = 9
        self.inds = list(ascii_uppercase)[:17]
        self.clear_item = False

    def set_box(self):
        '''
        아이템들이 있을 위치를 미리 정해놓고 그 위치 좌표들에 아이템이 들어올 수 있으므로 그리드에 100으로 표시한다.
        데이터 파일에서 이번 에피소드 아이템 정보를 받아 가져와야 할 아이템이 있는 좌표만 -100으로 표시한다.
        self.local_target에 에이전트가 이번에 방문해야할 좌표들을 저장한다.
        따라서 가져와야하는 아이템 좌표와 end point 좌표(처음 시작했던 좌표로 돌아와야하므로)가 들어가게 된다.
        '''
        box_data = pd.read_csv(os.path.join(local_path, "./data/box.csv"))

        # 물건이 들어있을 수 있는 경우
        for box in box_data.itertuples(index = True, name ='Pandas'):
            self.grid[getattr(box, "row")][getattr(box, "col")] = 0    #####################수정 100 -> 0

        # 물건이 실제 들어있는 경우
        order_item = list(set(self.inds) & set(self.items))
        order_csv = box_data[box_data['item'].isin(order_item)]
    
        #print(order_csv) ######################################## 수정
        
        for order_box in order_csv.itertuples(index = True, name ='Pandas'):
            self.grid[getattr(order_box, "row")][getattr(order_box, "col")] = 2   ###################### 수정 -100 -> 0
            # local target에 가야 할 위치 좌표 넣기
            self.local_target.append(
                [getattr(order_box, "row"),
                 getattr(order_box, "col")]
                )
        self.local_target.append([9,4]) 
        #self.grid[self.local_target[0][0]][self.local_target[0][1]] = -100 #############################수정
        # 알파벳을 Grid에 넣어서 -> grid에 2Dconv 적용 가능

    def set_obstacle(self):
        '''
        장애물이 있어야하는 위치는 미리 obstacles.csv에 정의되어 있다. 이 좌표들을 0으로 표시한다.
        '''
        obstacles_data = pd.read_csv(os.path.join(local_path, "./data/obstacles.csv"))
        for obstacle in obstacles_data.itertuples(index = True, name ='Pandas'):
            self.grid[getattr(obstacle, "row")][getattr(obstacle, "col")] = 0

    def reset(self, epi):
        '''
        reset()은 첫 스텝에서 사용되며 그리드에서 에이전트 위치가 start point에 있게 한다.

        :param epi: episode, 에피소드 마다 가져와야 할 아이템 리스트를 불러올 때 사용
        :return: 초기셋팅 된 그리드
        :rtype: numpy.ndarray
        _____________________________________________________________________________________
        items : 이번 에피소드에서 가져와야하는 아이템들
        terminal_location : 현재 에이전트가 찾아가야하는 목적지
        local_target : 한 에피소드에서 찾아가야하는 아이템 좌표, 마지막 엔드 포인트 등의 위치좌표들
        actions: visualization을 위해 에이전트 action을 저장하는 리스트
        curloc : 현재 위치
        '''

        # initial episode parameter setting
        self.epi = epi
        self.items = list(self.files.iloc[self.epi])[0]
        self.cumulative_reward = 0
        self.terminal_location = None
        self.local_target = []
        self.actions = []

        # initial grid setting
        self.grid = np.ones((self.height, self.width), dtype="float16")

        # set information about the gridworld
        self.set_box()
        self.set_obstacle()

        # start point를 grid에 표시
        self.curloc = [9, 4]
        self.grid[int(self.curloc[0])][int(self.curloc[1])] = 3
        self.item_now = False

        self.done = False
        
        #print('###########################')  ###################################수정한 부분
        #print(f'items loc : {self.local_target}')
        
        
        return self.grid

    def apply_action(self, action, cur_x, cur_y):
        '''
        에이전트가 행한 action대로 현 에이전트의 위치좌표를 바꾼다.
        action은 discrete하며 4가지 up,down,left,right으로 정의된다.
        
        :param x: 에이전트의 현재 x 좌표
        :param y: 에이전트의 현재 y 좌표
        :return: action에 따라 변한 에이전트의 x 좌표, y 좌표
        :rtype: int, int
        '''
        new_x = cur_x
        new_y = cur_y
        # up
        if action == 0:
            new_x = cur_x - 1
        # down
        elif action == 1:
            new_x = cur_x + 1
        # left
        elif action == 2:
            new_y = cur_y - 1
        # right
        else:
            new_y = cur_y + 1

        return int(new_x), int(new_y)


    def get_reward(self, new_x, new_y, out_of_boundary):
        '''
        get_reward함수는 리워드를 계산하는 함수이며, 상황에 따라 에이전트가 action을 옳게 했는지 판단하는 지표가 된다.

        :param new_x: action에 따른 에이전트 새로운 위치좌표 x
        :param new_y: action에 따른 에이전트 새로운 위치좌표 y
        :param out_of_boundary: 에이전트 위치가 그리드 밖이 되지 않도록 제한
        :return: action에 따른 리워드
        :rtype: float
        '''

        # 바깥으로 나가는 경우
        if any(out_of_boundary):
            reward = obs_reward
                       
        else:
            # 장애물에 부딪히는 경우 
            if self.grid[new_x][new_y] == 0:
                reward = obs_reward  

            # 현재 목표에 도달한 경우
            elif self.grid[new_x][new_y] == 3:
                reward = goal_reward

            # 그냥 움직이는 경우 
            else:
                reward = move_reward

        return reward

    def step(self, action):
        ''' 
        에이전트의 action에 따라 step을 진행한다.
        action에 따라 에이전트 위치를 변환하고, action에 대해 리워드를 받고, 어느 상황에 에피소드가 종료되어야 하는지 등을 판단한다.
        에이전트가 endpoint에 도착하면 gif로 에피소드에서 에이전트의 행동이 저장된다.

        :param action: 에이전트 행동
        :return:
            grid, 그리드
            reward, 리워드
            cumulative_reward, 누적 리워드
            done, 종료 여부
            goal_ob_reward, goal까지 아이템을 모두 가지고 돌아오는 finish율 계산을 위한 파라미터

        :rtype: numpy.ndarray, float, float, bool, bool/str

        (Hint : 시작 위치 (9,4)에서 up말고 다른 action은 전부 장애물이므로 action을 고정하는 것이 좋음)
        '''
        if self.local_target:
            self.terminal_location = self.local_target[0]
            
        cur_x,cur_y = self.curloc
        self.actions.append((cur_x, cur_y))

        goal_ob_reward = False
        
        new_x, new_y = self.apply_action(action, cur_x, cur_y)

        out_of_boundary = [new_x < 0, new_x >= self.height, new_y < 0, new_y >= self.width]
        
        # 바깥으로 나가는 경우 종료
        if any(out_of_boundary):
            reward = self.get_reward(new_x, new_y, out_of_boundary) ######################수정
            # self.done = True
            # goal_ob_reward = True
            
        else:
            # 장애물에 부딪히는 경우 종료
            if self.grid[new_x][new_y] == 0:
                # self.done = True
                # goal_ob_reward = True
                reward = self.get_reward(new_x, new_y, out_of_boundary) ###############################수정

                
                
                # 1. 어떤 아이템이든 들어가면 0으로 바꾸고, 로컬타겟의 해당 좌표만 삭제
                #2. 모든 아이템을 다 먹으면 터미널로케이션으로 9,4 설정
                
            # 현재 목표에 도달한 경우, 다음 목표설정
            elif self.grid[new_x][new_y] == 2:
                
                # 타깃 삭제
                self.local_target.remove([new_x, new_y])
                
                #전 state 에 item 이 있었으면
                if self.item_now:
                    self.grid[cur_x][cur_y] = 0
                    self.grid[new_x][new_y] = 3
                else:
                    self.grid[cur_x][cur_y] = 1
                    self.grid[new_x][new_y] = 3

                self.item_now = True
#                 self.local_target.remove(self.local_target[0]) 삭제
                
                goal_ob_reward = True
                self.curloc = [new_x, new_y]
                
                reward = self.get_reward(new_x, new_y, out_of_boundary)
                
            elif [new_x, new_y] == [9,4] and len(self.local_target) == 1:
                self.done = True
                reward = 20
                
            else:
                # 그냥 움직이는 경우 
                
                if self.item_now:
                    self.grid[cur_x][cur_y] = 0
                    self.grid[new_x][new_y] = 3
                    self.item_now = False
                    
                else:
                    self.grid[cur_x][cur_y] = 1
                    self.grid[new_x][new_y] = 3
                    
                
                self.curloc = [new_x,new_y]
                
                reward = self.get_reward(new_x, new_y, out_of_boundary)
                
        #reward = self.get_reward(new_x, new_y, out_of_boundary)  ################################# 수정
        #print('reward : ' ,reward) ####################################수정한 부분
        
        self.cumulative_reward += reward

        if self.done == True:
            if [new_x, new_y] == [9, 4]:
                if self.terminal_location == [9, 4]:
                    print(f'완료! {len(self.actions)}번 활동')
                    # 완료되면 GIFS 저장
                    goal_ob_reward = 'finish'
                    height = 10
                    width = 9 
                    display = Display(visible=False, size=(width, height))
                    display.start()

                    start_point = (9, 4)
                    unit = 50
                    screen_height = height * unit
                    screen_width = width * unit
                    log_path = "./logs"
                    data_path = "./data"
                    render_cls = Render(screen_width, screen_height, unit, start_point, data_path, log_path)
                    for idx, new_pos in enumerate(self.actions):
                        render_cls.update_movement(new_pos, idx+1)
                    
                    render_cls.save_gif(self.epi)
                    render_cls.viewer.close()
                    display.stop()
        
        
        return self.grid, reward, self.cumulative_reward, self.done, goal_ob_reward


reward: -0.1 -0.2 15


## 1. Agent 구성


In [31]:
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim
from torch.distributions import Categorical
import numpy as np
import time
from tqdm import tqdm
#Hyperparameters
learning_rate = 0.0005
gamma         = 0.98
n_rollout     = 10


In [32]:
class ActorCritic(nn.Module):
    def __init__(self):
        super(ActorCritic, self).__init__()
        self.data = []
        
#         self.layer1 = nn.Sequential(
#             nn.Conv2d(in_channels=1, out_channels=16, kernel_size=3, stride=2, padding=1),
#             nn.ReLU())
        
#         self.layer2 = nn.Sequential(
#             nn.Conv2d(16, 32, kernel_size=3, stride=2, padding=1),
#             nn.ReLU())
        
        self.flatten = nn.Flatten()
        self.fc1 = nn.Linear(90,128)
        self.fc2 = nn.Linear(128,32)
        self.fc_pi = nn.Linear(32,4)
        self.fc_v = nn.Linear(32,1)
        self.optimizer = optim.Adam(self.parameters(), lr=learning_rate)
        
    def pi(self, x, softmax_dim = 0):
        x = torch.reshape(x, (-1, 1, 10, 9)).to('cuda')
#         x = self.layer1(x)
#         x = self.layer2(x)
        x = self.flatten(x)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc_pi(x)
        prob = F.softmax(x, dim=softmax_dim) #, dim=softmax_dim
        
        return prob
    
    def v(self, x):
        x = torch.reshape(x, (-1, 1, 10, 9)).to('cuda')
#         x = self.layer1(x)
#         x = self.layer2(x)
        x = self.flatten(x)
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        v = self.fc_v(x)
        return v
    
    def put_data(self, transition):
        self.data.append(transition)
        
    def make_batch(self):
        s_lst, a_lst, r_lst, s_prime_lst, done_lst = [], [], [], [], []
        for transition in self.data:
            s,a,r,s_prime,done = transition
            s_lst.append(s)
            a_lst.append([a])
            r_lst.append([r])
            s_prime_lst.append(s_prime)
            done_mask = 0.0 if done else 1.0
            done_lst.append([done_mask])
        
        s_batch, a_batch, r_batch, s_prime_batch, done_batch = torch.tensor(s_lst, dtype=torch.float), torch.tensor(a_lst), \
                                                               torch.tensor(r_lst, dtype=torch.float), torch.tensor(s_prime_lst, dtype=torch.float), \
                                                               torch.tensor(done_lst, dtype=torch.float)
        self.data = []
        return s_batch, a_batch, r_batch, s_prime_batch, done_batch
  
    def train_net(self):
        s, a, r, s_prime, done = self.make_batch()
        td_target = torch.tensor(r,device='cuda') + torch.tensor(gamma, device='cuda') * self.v(s_prime) * torch.tensor(done, device='cuda')
        delta = td_target - self.v(s)
        pi = self.pi(s, softmax_dim=1)
        pi_a = pi.gather(1,a.to('cuda'))
        loss = -(torch.log(pi_a)+1e9) * (delta.detach()+1e9) + F.smooth_l1_loss(self.v(s), td_target.detach())
        
        self.optimizer.zero_grad()
        loss.mean().backward()
        self.optimizer.step() 
        torch.autograd.set_detect_anomaly(True)

#### 전체적인 구성

In [33]:
def main():  
    env = Simulator()
    
    model = ActorCritic()
#     model.load_state_dict(torch.load('model_weights.pth'))
#     model.eval()
    
    model = model.to('cuda')
    files = pd.read_csv("./data/factory_order_train.csv")
    print_interval = 50
#     ac = [1, 1, 4, 1, 1, 1, 1, 1, 1, 3, 3, 1, 2, 4, 4, 4, 4, 1,3,3,2,1,4,1,2, 3, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 2, 1, 1]
#     k = 0
    for epi in tqdm(range(1)):
        time.sleep(0.1)
        done = False
        s = env.reset(epi)
        items = list(files.iloc[epi%40000])[0]
        score = 0.0
        s = np.asarray(s, dtype=np.float32)
        a_step= 0
        first = True
        end = False
        if epi % 100 == 0:
            torch.save(model.state_dict(), '/content/drive/MyDrive/Study/RL/weights/model_weights.pth')

        #for i in range(50):
        for i in tqdm(range(2000)):
            done = False
            s = env.reset(epi)
            
            score = 0.0
            s = np.asarray(s, dtype=np.float32)
            a_step= 0
            first = True
            end = False
            
            
            while not done:
                for t in range(n_rollout): # n_rollout을 통해 for loop 진행 후 학습 진행
                    # 어디로 갈지 확률 예측 부분
                    prob = model.pi(torch.from_numpy(s).float())
                    m = Categorical(prob)
                    a = m.sample().item()
#                     a = ac[k]
#                     k += 1
                    if first:
                        a = 0
                        first = False
                        

                    s_prime, r, cumul, done, goal_reward = env.step(a)
#                     print(s_prime,'\n', r, done, goal_reward)
                    
                    # 스텝 종료 패널티
                    if r < 0 and r !=-5:
                        r = r + r*(a_step)*0.1
                    a_step +=1
                    
                    if a_step == 200:
                        end = True
                        break
                    
                    # 스텝이 늘어날 수록 강해지는 패널티
                    
                    view = s_prime
                    
                    s_prime = np.asarray(s_prime, dtype=np.float32)
                    
                    model.put_data((s,a,r,s_prime,done))
                    
                    s = s_prime
                    score += r

                    if done==True or end==True:
                        break

                if done == True or end ==True:
                    break
                model.train_net() # 학습 진행 코드

            if i%print_interval==0 :
                print("# of episode :{}, avg score : {:.3f}".format(i, score/print_interval))
                print(view)
                score = 0.0
                
        if epi%print_interval==0 and epi!=0:
            print("# of episode :{}, avg score : {:.3f}".format(epi, score/print_interval))
            print(view)
            score = 0.0


if __name__ == '__main__':
    main()

  0%|                                                                                    | 0/1 [00:00<?, ?it/s]

  0%|                                                                       | 1/2000 [00:01<1:00:38,  1.82s/it][A

# of episode :0, avg score : 38.308
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [3. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



  0%|                                                                       | 2/2000 [00:03<1:01:22,  1.84s/it][A
  0%|                                                                       | 3/2000 [00:05<1:02:01,  1.86s/it][A
  0%|▏                                                                      | 4/2000 [00:07<1:02:05,  1.87s/it][A
  0%|▏                                                                      | 5/2000 [00:09<1:02:21,  1.88s/it][A
  0%|▏                                                                      | 6/2000 [00:11<1:02:05,  1.87s/it][A
  0%|▏                                                                      | 7/2000 [00:13<1:02:13,  1.87s/it][A
  0%|▎                                                                      | 8/2000 [00:14<1:02:10,  1.87s/it][A
  0%|▎                                                                      | 9/2000 [00:16<1:02:20,  1.88s/it][A
  0%|▎                                                                     | 10

# of episode :50, avg score : 32.208
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 3.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



  3%|█▊                                                                    | 52/2000 [01:28<1:00:22,  1.86s/it][A
  3%|█▊                                                                    | 53/2000 [01:30<1:00:37,  1.87s/it][A
  3%|█▉                                                                    | 54/2000 [01:32<1:00:29,  1.86s/it][A
  3%|█▉                                                                    | 55/2000 [01:34<1:00:14,  1.86s/it][A
  3%|█▉                                                                    | 56/2000 [01:36<1:00:26,  1.87s/it][A
  3%|█▉                                                                    | 57/2000 [01:38<1:00:03,  1.85s/it][A
  3%|██                                                                      | 58/2000 [01:39<59:43,  1.85s/it][A
  3%|██                                                                      | 59/2000 [01:41<59:52,  1.85s/it][A
  3%|██▏                                                                     | 

# of episode :100, avg score : 37.656
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 3. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



  5%|███▌                                                                   | 102/2000 [03:02<58:56,  1.86s/it][A
  5%|███▋                                                                   | 103/2000 [03:04<58:44,  1.86s/it][A
  5%|███▋                                                                   | 104/2000 [03:06<58:40,  1.86s/it][A
  5%|███▋                                                                   | 105/2000 [03:08<58:56,  1.87s/it][A
  5%|███▊                                                                   | 106/2000 [03:10<59:02,  1.87s/it][A
  5%|███▊                                                                   | 107/2000 [03:11<59:04,  1.87s/it][A
  5%|███▊                                                                   | 108/2000 [03:13<55:37,  1.76s/it][A
  5%|███▊                                                                   | 109/2000 [03:14<50:26,  1.60s/it][A
  6%|███▉                                                                   | 1

# of episode :150, avg score : 39.867
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 3. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



  8%|█████▍                                                                 | 152/2000 [04:11<59:42,  1.94s/it][A
  8%|█████▎                                                               | 153/2000 [04:13<1:00:18,  1.96s/it][A
  8%|█████▎                                                               | 154/2000 [04:15<1:00:27,  1.97s/it][A
  8%|█████▎                                                               | 155/2000 [04:17<1:01:03,  1.99s/it][A
  8%|█████▍                                                               | 156/2000 [04:19<1:01:02,  1.99s/it][A
  8%|█████▍                                                               | 157/2000 [04:21<1:01:03,  1.99s/it][A
  8%|█████▍                                                               | 158/2000 [04:23<1:01:04,  1.99s/it][A
  8%|█████▍                                                               | 159/2000 [04:25<1:01:03,  1.99s/it][A
  8%|█████▌                                                               | 160

# of episode :200, avg score : 35.023
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 3. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 10%|███████▏                                                               | 202/2000 [05:46<58:41,  1.96s/it][A
 10%|███████▏                                                               | 203/2000 [05:48<59:47,  2.00s/it][A
 10%|███████                                                              | 204/2000 [05:50<1:00:12,  2.01s/it][A
 10%|███████▎                                                               | 205/2000 [05:52<56:31,  1.89s/it][A
 10%|███████▎                                                               | 206/2000 [05:53<50:14,  1.68s/it][A
 10%|███████▎                                                               | 207/2000 [05:54<45:47,  1.53s/it][A
 10%|███████▍                                                               | 208/2000 [05:55<42:30,  1.42s/it][A
 10%|███████▍                                                               | 209/2000 [05:57<40:21,  1.35s/it][A
 10%|███████▍                                                               | 2

# of episode :250, avg score : 35.298
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 3. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 13%|████████▉                                                              | 252/2000 [06:47<33:53,  1.16s/it][A
 13%|████████▉                                                              | 253/2000 [06:49<34:07,  1.17s/it][A
 13%|█████████                                                              | 254/2000 [06:50<34:05,  1.17s/it][A
 13%|█████████                                                              | 255/2000 [06:51<34:05,  1.17s/it][A
 13%|█████████                                                              | 256/2000 [06:52<34:11,  1.18s/it][A
 13%|█████████                                                              | 257/2000 [06:53<34:07,  1.17s/it][A
 13%|█████████▏                                                             | 258/2000 [06:54<34:01,  1.17s/it][A
 13%|█████████▏                                                             | 259/2000 [06:56<33:57,  1.17s/it][A
 13%|█████████▏                                                             | 2

완료! 155번 활동




 13%|█████████                                                            | 262/2000 [07:04<1:03:10,  2.18s/it][A
 13%|█████████▎                                                             | 263/2000 [07:05<54:45,  1.89s/it][A
 13%|█████████▎                                                             | 264/2000 [07:06<49:00,  1.69s/it][A
 13%|█████████▍                                                             | 265/2000 [07:08<44:58,  1.56s/it][A
 13%|█████████▍                                                             | 266/2000 [07:09<42:13,  1.46s/it][A
 13%|█████████▍                                                             | 267/2000 [07:10<40:24,  1.40s/it][A
 13%|█████████▌                                                             | 268/2000 [07:11<38:39,  1.34s/it][A
 13%|█████████▌                                                             | 269/2000 [07:13<37:48,  1.31s/it][A
 14%|█████████▌                                                             | 

# of episode :300, avg score : 36.942
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 3. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 15%|██████████▋                                                            | 302/2000 [08:06<41:05,  1.45s/it][A
 15%|██████████▊                                                            | 303/2000 [08:07<38:59,  1.38s/it][A
 15%|██████████▊                                                            | 304/2000 [08:08<37:20,  1.32s/it][A
 15%|██████████▊                                                            | 305/2000 [08:09<36:01,  1.28s/it][A
 15%|██████████▊                                                            | 306/2000 [08:11<35:11,  1.25s/it][A
 15%|██████████▉                                                            | 307/2000 [08:12<34:51,  1.24s/it][A
 15%|██████████▉                                                            | 308/2000 [08:13<35:11,  1.25s/it][A
 15%|██████████▉                                                            | 309/2000 [08:14<35:13,  1.25s/it][A
 16%|███████████                                                            | 3

# of episode :350, avg score : 34.222
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 3. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 18%|████████████▍                                                          | 352/2000 [09:05<32:32,  1.18s/it][A
 18%|████████████▌                                                          | 353/2000 [09:06<32:30,  1.18s/it][A
 18%|████████████▌                                                          | 354/2000 [09:07<32:27,  1.18s/it][A
 18%|████████████▌                                                          | 355/2000 [09:08<32:24,  1.18s/it][A
 18%|████████████▋                                                          | 356/2000 [09:10<32:18,  1.18s/it][A
 18%|████████████▋                                                          | 357/2000 [09:11<32:12,  1.18s/it][A
 18%|████████████▋                                                          | 358/2000 [09:12<32:10,  1.18s/it][A
 18%|████████████▋                                                          | 359/2000 [09:13<32:07,  1.17s/it][A
 18%|████████████▊                                                          | 3

완료! 198번 활동




 20%|█████████████▊                                                       | 399/2000 [10:08<1:13:56,  2.77s/it][A
 20%|█████████████▊                                                       | 400/2000 [10:09<1:01:28,  2.31s/it][A
 20%|██████████████▏                                                        | 401/2000 [10:10<52:45,  1.98s/it][A

# of episode :400, avg score : 33.972
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 3. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 20%|██████████████▎                                                        | 402/2000 [10:12<46:29,  1.75s/it][A
 20%|██████████████▎                                                        | 403/2000 [10:13<42:05,  1.58s/it][A
 20%|██████████████▎                                                        | 404/2000 [10:14<39:03,  1.47s/it][A
 20%|██████████████▍                                                        | 405/2000 [10:15<36:58,  1.39s/it][A
 20%|██████████████▍                                                        | 406/2000 [10:16<35:26,  1.33s/it][A
 20%|██████████████▍                                                        | 407/2000 [10:18<34:38,  1.30s/it][A
 20%|██████████████▍                                                        | 408/2000 [10:19<34:19,  1.29s/it][A
 20%|██████████████▌                                                        | 409/2000 [10:20<34:04,  1.29s/it][A
 20%|██████████████▌                                                        | 4

# of episode :450, avg score : 40.007
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 3. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 23%|████████████████                                                       | 452/2000 [11:12<31:02,  1.20s/it][A
 23%|████████████████                                                       | 453/2000 [11:14<30:52,  1.20s/it][A
 23%|████████████████                                                       | 454/2000 [11:15<30:39,  1.19s/it][A
 23%|████████████████▏                                                      | 455/2000 [11:16<30:39,  1.19s/it][A
 23%|████████████████▏                                                      | 456/2000 [11:17<30:43,  1.19s/it][A
 23%|████████████████▏                                                      | 457/2000 [11:18<30:48,  1.20s/it][A
 23%|████████████████▎                                                      | 458/2000 [11:20<31:27,  1.22s/it][A
 23%|████████████████▎                                                      | 459/2000 [11:21<31:25,  1.22s/it][A
 23%|████████████████▎                                                      | 4

완료! 164번 활동




 23%|████████████████▏                                                    | 469/2000 [11:38<1:00:39,  2.38s/it][A
 24%|████████████████▋                                                      | 470/2000 [11:40<51:49,  2.03s/it][A
 24%|████████████████▋                                                      | 471/2000 [11:41<45:37,  1.79s/it][A
 24%|████████████████▊                                                      | 472/2000 [11:42<41:25,  1.63s/it][A
 24%|████████████████▊                                                      | 473/2000 [11:43<38:49,  1.53s/it][A
 24%|████████████████▊                                                      | 474/2000 [11:45<36:54,  1.45s/it][A
 24%|████████████████▊                                                      | 475/2000 [11:46<35:33,  1.40s/it][A
 24%|████████████████▉                                                      | 476/2000 [11:47<34:45,  1.37s/it][A
 24%|████████████████▉                                                      | 

# of episode :500, avg score : 40.537
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [3. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 25%|█████████████████▊                                                     | 502/2000 [12:20<30:18,  1.21s/it][A
 25%|█████████████████▊                                                     | 503/2000 [12:21<30:06,  1.21s/it][A
 25%|█████████████████▉                                                     | 504/2000 [12:22<30:06,  1.21s/it][A
 25%|█████████████████▉                                                     | 505/2000 [12:23<30:06,  1.21s/it][A
 25%|█████████████████▉                                                     | 506/2000 [12:24<30:04,  1.21s/it][A
 25%|█████████████████▉                                                     | 507/2000 [12:26<29:59,  1.20s/it][A
 25%|██████████████████                                                     | 508/2000 [12:27<29:53,  1.20s/it][A
 25%|██████████████████                                                     | 509/2000 [12:28<29:50,  1.20s/it][A
 26%|██████████████████                                                     | 5

# of episode :550, avg score : 34.993
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 3. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 28%|███████████████████▌                                                   | 552/2000 [13:20<29:34,  1.23s/it][A
 28%|███████████████████▋                                                   | 553/2000 [13:21<29:21,  1.22s/it][A
 28%|███████████████████▋                                                   | 554/2000 [13:23<29:17,  1.22s/it][A
 28%|███████████████████▋                                                   | 555/2000 [13:24<29:17,  1.22s/it][A
 28%|███████████████████▋                                                   | 556/2000 [13:25<29:10,  1.21s/it][A
 28%|███████████████████▊                                                   | 557/2000 [13:26<29:06,  1.21s/it][A
 28%|███████████████████▊                                                   | 558/2000 [13:27<29:08,  1.21s/it][A
 28%|███████████████████▊                                                   | 559/2000 [13:29<29:13,  1.22s/it][A
 28%|███████████████████▉                                                   | 5

# of episode :600, avg score : 36.686
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 3. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 30%|█████████████████████▎                                                 | 602/2000 [14:21<28:18,  1.21s/it][A
 30%|█████████████████████▍                                                 | 603/2000 [14:22<28:11,  1.21s/it][A
 30%|█████████████████████▍                                                 | 604/2000 [14:23<28:15,  1.21s/it][A
 30%|█████████████████████▍                                                 | 605/2000 [14:24<28:13,  1.21s/it][A
 30%|█████████████████████▌                                                 | 606/2000 [14:26<28:13,  1.21s/it][A
 30%|█████████████████████▌                                                 | 607/2000 [14:27<28:09,  1.21s/it][A
 30%|█████████████████████▌                                                 | 608/2000 [14:28<28:12,  1.22s/it][A
 30%|█████████████████████▌                                                 | 609/2000 [14:29<28:10,  1.22s/it][A
 30%|█████████████████████▋                                                 | 6

# of episode :650, avg score : 38.758
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [3. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 33%|███████████████████████▏                                               | 652/2000 [15:21<26:48,  1.19s/it][A
 33%|███████████████████████▏                                               | 653/2000 [15:22<26:55,  1.20s/it][A
 33%|███████████████████████▏                                               | 654/2000 [15:24<26:51,  1.20s/it][A
 33%|███████████████████████▎                                               | 655/2000 [15:25<26:48,  1.20s/it][A
 33%|███████████████████████▎                                               | 656/2000 [15:26<26:54,  1.20s/it][A
 33%|███████████████████████▎                                               | 657/2000 [15:27<26:57,  1.20s/it][A
 33%|███████████████████████▎                                               | 658/2000 [15:28<26:58,  1.21s/it][A
 33%|███████████████████████▍                                               | 659/2000 [15:30<26:47,  1.20s/it][A
 33%|███████████████████████▍                                               | 6

# of episode :700, avg score : 36.822
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 3. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 35%|████████████████████████▉                                              | 702/2000 [16:22<26:03,  1.20s/it][A
 35%|████████████████████████▉                                              | 703/2000 [16:23<26:00,  1.20s/it][A
 35%|████████████████████████▉                                              | 704/2000 [16:24<25:56,  1.20s/it][A
 35%|█████████████████████████                                              | 705/2000 [16:25<25:50,  1.20s/it][A
 35%|█████████████████████████                                              | 706/2000 [16:26<25:45,  1.19s/it][A
 35%|█████████████████████████                                              | 707/2000 [16:28<25:40,  1.19s/it][A
 35%|█████████████████████████▏                                             | 708/2000 [16:29<25:44,  1.20s/it][A
 35%|█████████████████████████▏                                             | 709/2000 [16:30<25:45,  1.20s/it][A
 36%|█████████████████████████▏                                             | 7

# of episode :750, avg score : 38.397
[[0. 0. 0. 0. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 3. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 38%|██████████████████████████▋                                            | 752/2000 [17:22<25:18,  1.22s/it][A
 38%|██████████████████████████▋                                            | 753/2000 [17:23<25:16,  1.22s/it][A
 38%|██████████████████████████▊                                            | 754/2000 [17:25<25:05,  1.21s/it][A
 38%|██████████████████████████▊                                            | 755/2000 [17:26<24:54,  1.20s/it][A
 38%|██████████████████████████▊                                            | 756/2000 [17:27<24:46,  1.20s/it][A
 38%|██████████████████████████▊                                            | 757/2000 [17:28<24:45,  1.19s/it][A
 38%|██████████████████████████▉                                            | 758/2000 [17:29<24:40,  1.19s/it][A
 38%|██████████████████████████▉                                            | 759/2000 [17:31<24:40,  1.19s/it][A
 38%|██████████████████████████▉                                            | 7

# of episode :800, avg score : 40.090
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 3.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 40%|████████████████████████████▍                                          | 802/2000 [18:22<23:44,  1.19s/it][A
 40%|████████████████████████████▌                                          | 803/2000 [18:23<23:34,  1.18s/it][A
 40%|████████████████████████████▌                                          | 804/2000 [18:24<23:17,  1.17s/it][A
 40%|████████████████████████████▌                                          | 805/2000 [18:26<23:16,  1.17s/it][A
 40%|████████████████████████████▌                                          | 806/2000 [18:27<23:20,  1.17s/it][A
 40%|████████████████████████████▋                                          | 807/2000 [18:28<23:20,  1.17s/it][A
 40%|████████████████████████████▋                                          | 808/2000 [18:29<23:16,  1.17s/it][A
 40%|████████████████████████████▋                                          | 809/2000 [18:30<23:12,  1.17s/it][A
 40%|████████████████████████████▊                                          | 8

# of episode :850, avg score : 36.276
[[0. 0. 0. 0. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 3. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 43%|██████████████████████████████▏                                        | 852/2000 [19:21<21:40,  1.13s/it][A
 43%|██████████████████████████████▎                                        | 853/2000 [19:23<21:35,  1.13s/it][A
 43%|██████████████████████████████▎                                        | 854/2000 [19:24<21:34,  1.13s/it][A
 43%|██████████████████████████████▎                                        | 855/2000 [19:25<21:36,  1.13s/it][A
 43%|██████████████████████████████▍                                        | 856/2000 [19:26<21:35,  1.13s/it][A
 43%|██████████████████████████████▍                                        | 857/2000 [19:27<21:35,  1.13s/it][A
 43%|██████████████████████████████▍                                        | 858/2000 [19:28<21:33,  1.13s/it][A
 43%|██████████████████████████████▍                                        | 859/2000 [19:29<21:33,  1.13s/it][A
 43%|██████████████████████████████▌                                        | 8

# of episode :900, avg score : 29.388
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 3. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 45%|████████████████████████████████                                       | 902/2000 [20:20<21:25,  1.17s/it][A
 45%|████████████████████████████████                                       | 903/2000 [20:22<21:25,  1.17s/it][A
 45%|████████████████████████████████                                       | 904/2000 [20:23<21:27,  1.17s/it][A
 45%|████████████████████████████████▏                                      | 905/2000 [20:24<21:24,  1.17s/it][A
 45%|████████████████████████████████▏                                      | 906/2000 [20:25<21:16,  1.17s/it][A
 45%|████████████████████████████████▏                                      | 907/2000 [20:26<21:17,  1.17s/it][A
 45%|████████████████████████████████▏                                      | 908/2000 [20:27<21:14,  1.17s/it][A
 45%|████████████████████████████████▎                                      | 909/2000 [20:29<21:22,  1.18s/it][A
 46%|████████████████████████████████▎                                      | 9

완료! 198번 활동




 47%|█████████████████████████████████▎                                     | 938/2000 [21:10<47:24,  2.68s/it][A
 47%|█████████████████████████████████▎                                     | 939/2000 [21:11<39:41,  2.24s/it][A
 47%|█████████████████████████████████▎                                     | 940/2000 [21:12<34:14,  1.94s/it][A
 47%|█████████████████████████████████▍                                     | 941/2000 [21:13<30:25,  1.72s/it][A
 47%|█████████████████████████████████▍                                     | 942/2000 [21:15<27:40,  1.57s/it][A
 47%|█████████████████████████████████▍                                     | 943/2000 [21:16<25:44,  1.46s/it][A
 47%|█████████████████████████████████▌                                     | 944/2000 [21:17<24:25,  1.39s/it][A
 47%|█████████████████████████████████▌                                     | 945/2000 [21:18<23:25,  1.33s/it][A
 47%|█████████████████████████████████▌                                     | 

# of episode :950, avg score : 41.690
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 3. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 48%|█████████████████████████████████▊                                     | 952/2000 [21:27<20:51,  1.19s/it][A
 48%|█████████████████████████████████▊                                     | 953/2000 [21:28<20:58,  1.20s/it][A
 48%|█████████████████████████████████▊                                     | 954/2000 [21:29<20:59,  1.20s/it][A
 48%|█████████████████████████████████▉                                     | 955/2000 [21:30<20:52,  1.20s/it][A
 48%|█████████████████████████████████▉                                     | 956/2000 [21:31<20:43,  1.19s/it][A
 48%|█████████████████████████████████▉                                     | 957/2000 [21:33<20:37,  1.19s/it][A
 48%|██████████████████████████████████                                     | 958/2000 [21:34<20:28,  1.18s/it][A
 48%|██████████████████████████████████                                     | 959/2000 [21:35<20:30,  1.18s/it][A
 48%|██████████████████████████████████                                     | 9

# of episode :1000, avg score : 40.292
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 3. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 50%|███████████████████████████████████                                   | 1002/2000 [22:26<20:28,  1.23s/it][A
 50%|███████████████████████████████████                                   | 1003/2000 [22:28<20:39,  1.24s/it][A
 50%|███████████████████████████████████▏                                  | 1004/2000 [22:29<20:45,  1.25s/it][A
 50%|███████████████████████████████████▏                                  | 1005/2000 [22:30<20:45,  1.25s/it][A
 50%|███████████████████████████████████▏                                  | 1006/2000 [22:32<20:42,  1.25s/it][A
 50%|███████████████████████████████████▏                                  | 1007/2000 [22:33<20:59,  1.27s/it][A
 50%|███████████████████████████████████▎                                  | 1008/2000 [22:34<21:05,  1.28s/it][A
 50%|███████████████████████████████████▎                                  | 1009/2000 [22:35<21:17,  1.29s/it][A

완료! 164번 활동




 51%|███████████████████████████████████▍                                  | 1011/2000 [22:43<39:32,  2.40s/it][A
 51%|███████████████████████████████████▍                                  | 1012/2000 [22:45<33:47,  2.05s/it][A
 51%|███████████████████████████████████▍                                  | 1013/2000 [22:46<29:42,  1.81s/it][A
 51%|███████████████████████████████████▍                                  | 1014/2000 [22:47<26:49,  1.63s/it][A
 51%|███████████████████████████████████▌                                  | 1015/2000 [22:48<25:06,  1.53s/it][A
 51%|███████████████████████████████████▌                                  | 1016/2000 [22:50<23:47,  1.45s/it][A
 51%|███████████████████████████████████▌                                  | 1017/2000 [22:51<23:01,  1.41s/it][A
 51%|███████████████████████████████████▋                                  | 1018/2000 [22:52<22:24,  1.37s/it][A
 51%|███████████████████████████████████▋                                  | 1

# of episode :1050, avg score : 45.686
[[0. 0. 0. 0. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 3.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 53%|████████████████████████████████████▊                                 | 1052/2000 [23:33<18:28,  1.17s/it][A
 53%|████████████████████████████████████▊                                 | 1053/2000 [23:34<18:23,  1.17s/it][A
 53%|████████████████████████████████████▉                                 | 1054/2000 [23:35<18:13,  1.16s/it][A
 53%|████████████████████████████████████▉                                 | 1055/2000 [23:36<18:15,  1.16s/it][A
 53%|████████████████████████████████████▉                                 | 1056/2000 [23:37<18:15,  1.16s/it][A
 53%|████████████████████████████████████▉                                 | 1057/2000 [23:39<18:15,  1.16s/it][A
 53%|█████████████████████████████████████                                 | 1058/2000 [23:40<18:10,  1.16s/it][A
 53%|█████████████████████████████████████                                 | 1059/2000 [23:41<18:05,  1.15s/it][A
 53%|█████████████████████████████████████                                 | 10

# of episode :1100, avg score : 38.067
[[0. 0. 0. 0. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 3. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 55%|██████████████████████████████████████▌                               | 1102/2000 [24:31<17:32,  1.17s/it][A
 55%|██████████████████████████████████████▌                               | 1103/2000 [24:32<17:28,  1.17s/it][A
 55%|██████████████████████████████████████▋                               | 1104/2000 [24:33<17:30,  1.17s/it][A
 55%|██████████████████████████████████████▋                               | 1105/2000 [24:35<17:29,  1.17s/it][A
 55%|██████████████████████████████████████▋                               | 1106/2000 [24:36<17:30,  1.17s/it][A
 55%|██████████████████████████████████████▋                               | 1107/2000 [24:37<17:26,  1.17s/it][A
 55%|██████████████████████████████████████▊                               | 1108/2000 [24:38<17:20,  1.17s/it][A
 55%|██████████████████████████████████████▊                               | 1109/2000 [24:39<17:22,  1.17s/it][A
 56%|██████████████████████████████████████▊                               | 11

# of episode :1150, avg score : 33.980
[[0. 0. 0. 0. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 3. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 58%|████████████████████████████████████████▎                             | 1152/2000 [25:31<16:29,  1.17s/it][A
 58%|████████████████████████████████████████▎                             | 1153/2000 [25:32<16:25,  1.16s/it][A
 58%|████████████████████████████████████████▍                             | 1154/2000 [25:33<16:23,  1.16s/it][A
 58%|████████████████████████████████████████▍                             | 1155/2000 [25:34<16:17,  1.16s/it][A
 58%|████████████████████████████████████████▍                             | 1156/2000 [25:35<16:25,  1.17s/it][A
 58%|████████████████████████████████████████▍                             | 1157/2000 [25:36<16:24,  1.17s/it][A
 58%|████████████████████████████████████████▌                             | 1158/2000 [25:38<16:23,  1.17s/it][A
 58%|████████████████████████████████████████▌                             | 1159/2000 [25:39<16:22,  1.17s/it][A
 58%|████████████████████████████████████████▌                             | 11

# of episode :1200, avg score : 38.730
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 3. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 60%|██████████████████████████████████████████                            | 1202/2000 [26:29<15:34,  1.17s/it][A
 60%|██████████████████████████████████████████                            | 1203/2000 [26:30<15:24,  1.16s/it][A
 60%|██████████████████████████████████████████▏                           | 1204/2000 [26:31<15:26,  1.16s/it][A
 60%|██████████████████████████████████████████▏                           | 1205/2000 [26:33<15:26,  1.17s/it][A
 60%|██████████████████████████████████████████▏                           | 1206/2000 [26:34<15:27,  1.17s/it][A
 60%|██████████████████████████████████████████▏                           | 1207/2000 [26:35<15:24,  1.17s/it][A
 60%|██████████████████████████████████████████▎                           | 1208/2000 [26:36<15:22,  1.16s/it][A
 60%|██████████████████████████████████████████▎                           | 1209/2000 [26:37<15:17,  1.16s/it][A
 60%|██████████████████████████████████████████▎                           | 12

# of episode :1250, avg score : 42.799
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 3. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 63%|███████████████████████████████████████████▊                          | 1252/2000 [27:28<14:35,  1.17s/it][A
 63%|███████████████████████████████████████████▊                          | 1253/2000 [27:29<14:38,  1.18s/it][A
 63%|███████████████████████████████████████████▉                          | 1254/2000 [27:30<14:37,  1.18s/it][A
 63%|███████████████████████████████████████████▉                          | 1255/2000 [27:31<14:36,  1.18s/it][A
 63%|███████████████████████████████████████████▉                          | 1256/2000 [27:33<14:35,  1.18s/it][A
 63%|███████████████████████████████████████████▉                          | 1257/2000 [27:34<14:31,  1.17s/it][A
 63%|████████████████████████████████████████████                          | 1258/2000 [27:35<14:39,  1.19s/it][A
 63%|████████████████████████████████████████████                          | 1259/2000 [27:36<14:47,  1.20s/it][A
 63%|████████████████████████████████████████████                          | 12

# of episode :1300, avg score : 43.904
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 3. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 65%|█████████████████████████████████████████████▌                        | 1302/2000 [28:26<13:41,  1.18s/it][A
 65%|█████████████████████████████████████████████▌                        | 1303/2000 [28:28<13:41,  1.18s/it][A
 65%|█████████████████████████████████████████████▋                        | 1304/2000 [28:29<13:37,  1.18s/it][A
 65%|█████████████████████████████████████████████▋                        | 1305/2000 [28:30<13:36,  1.17s/it][A
 65%|█████████████████████████████████████████████▋                        | 1306/2000 [28:31<13:32,  1.17s/it][A
 65%|█████████████████████████████████████████████▋                        | 1307/2000 [28:32<13:31,  1.17s/it][A
 65%|█████████████████████████████████████████████▊                        | 1308/2000 [28:33<13:29,  1.17s/it][A
 65%|█████████████████████████████████████████████▊                        | 1309/2000 [28:35<13:28,  1.17s/it][A
 66%|█████████████████████████████████████████████▊                        | 13

# of episode :1350, avg score : 37.977
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 3. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 68%|███████████████████████████████████████████████▎                      | 1352/2000 [29:27<12:40,  1.17s/it][A
 68%|███████████████████████████████████████████████▎                      | 1353/2000 [29:28<12:38,  1.17s/it][A
 68%|███████████████████████████████████████████████▍                      | 1354/2000 [29:29<12:36,  1.17s/it][A
 68%|███████████████████████████████████████████████▍                      | 1355/2000 [29:30<12:35,  1.17s/it][A
 68%|███████████████████████████████████████████████▍                      | 1356/2000 [29:31<12:31,  1.17s/it][A
 68%|███████████████████████████████████████████████▍                      | 1357/2000 [29:33<12:26,  1.16s/it][A
 68%|███████████████████████████████████████████████▌                      | 1358/2000 [29:34<12:24,  1.16s/it][A
 68%|███████████████████████████████████████████████▌                      | 1359/2000 [29:35<12:25,  1.16s/it][A
 68%|███████████████████████████████████████████████▌                      | 13

# of episode :1400, avg score : 32.182
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [3. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 70%|█████████████████████████████████████████████████                     | 1402/2000 [30:25<11:37,  1.17s/it][A
 70%|█████████████████████████████████████████████████                     | 1403/2000 [30:26<11:36,  1.17s/it][A
 70%|█████████████████████████████████████████████████▏                    | 1404/2000 [30:27<11:32,  1.16s/it][A
 70%|█████████████████████████████████████████████████▏                    | 1405/2000 [30:29<11:30,  1.16s/it][A
 70%|█████████████████████████████████████████████████▏                    | 1406/2000 [30:30<11:29,  1.16s/it][A
 70%|█████████████████████████████████████████████████▏                    | 1407/2000 [30:31<11:27,  1.16s/it][A
 70%|█████████████████████████████████████████████████▎                    | 1408/2000 [30:32<11:33,  1.17s/it][A
 70%|█████████████████████████████████████████████████▎                    | 1409/2000 [30:33<11:29,  1.17s/it][A
 70%|█████████████████████████████████████████████████▎                    | 14

완료! 198번 활동




 72%|██████████████████████████████████████████████████▍                   | 1440/2000 [31:17<24:36,  2.64s/it][A
 72%|██████████████████████████████████████████████████▍                   | 1441/2000 [31:18<20:25,  2.19s/it][A
 72%|██████████████████████████████████████████████████▍                   | 1442/2000 [31:19<17:32,  1.89s/it][A
 72%|██████████████████████████████████████████████████▌                   | 1443/2000 [31:20<15:30,  1.67s/it][A
 72%|██████████████████████████████████████████████████▌                   | 1444/2000 [31:21<14:02,  1.52s/it][A
 72%|██████████████████████████████████████████████████▌                   | 1445/2000 [31:23<13:03,  1.41s/it][A
 72%|██████████████████████████████████████████████████▌                   | 1446/2000 [31:24<12:19,  1.34s/it][A
 72%|██████████████████████████████████████████████████▋                   | 1447/2000 [31:25<11:49,  1.28s/it][A
 72%|██████████████████████████████████████████████████▋                   | 1

# of episode :1450, avg score : 38.731
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 3. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 73%|██████████████████████████████████████████████████▊                   | 1452/2000 [31:31<10:50,  1.19s/it][A
 73%|██████████████████████████████████████████████████▊                   | 1453/2000 [31:32<10:46,  1.18s/it][A
 73%|██████████████████████████████████████████████████▉                   | 1454/2000 [31:33<10:43,  1.18s/it][A
 73%|██████████████████████████████████████████████████▉                   | 1455/2000 [31:34<10:40,  1.18s/it][A
 73%|██████████████████████████████████████████████████▉                   | 1456/2000 [31:35<10:41,  1.18s/it][A
 73%|██████████████████████████████████████████████████▉                   | 1457/2000 [31:37<10:34,  1.17s/it][A
 73%|███████████████████████████████████████████████████                   | 1458/2000 [31:38<10:35,  1.17s/it][A
 73%|███████████████████████████████████████████████████                   | 1459/2000 [31:39<10:39,  1.18s/it][A
 73%|███████████████████████████████████████████████████                   | 14

# of episode :1500, avg score : 28.346
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 3. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 75%|████████████████████████████████████████████████████▌                 | 1502/2000 [32:29<09:41,  1.17s/it][A
 75%|████████████████████████████████████████████████████▌                 | 1503/2000 [32:31<09:40,  1.17s/it][A
 75%|████████████████████████████████████████████████████▋                 | 1504/2000 [32:32<09:37,  1.16s/it][A
 75%|████████████████████████████████████████████████████▋                 | 1505/2000 [32:33<09:33,  1.16s/it][A
 75%|████████████████████████████████████████████████████▋                 | 1506/2000 [32:34<09:32,  1.16s/it][A
 75%|████████████████████████████████████████████████████▋                 | 1507/2000 [32:35<09:40,  1.18s/it][A
 75%|████████████████████████████████████████████████████▊                 | 1508/2000 [32:36<09:41,  1.18s/it][A
 75%|████████████████████████████████████████████████████▊                 | 1509/2000 [32:38<09:35,  1.17s/it][A
 76%|████████████████████████████████████████████████████▊                 | 15

# of episode :1550, avg score : 39.081
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 3. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 78%|██████████████████████████████████████████████████████▎               | 1552/2000 [33:28<08:39,  1.16s/it][A
 78%|██████████████████████████████████████████████████████▎               | 1553/2000 [33:29<08:43,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▍               | 1554/2000 [33:30<08:42,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▍               | 1555/2000 [33:31<08:42,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▍               | 1556/2000 [33:33<08:38,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▍               | 1557/2000 [33:34<08:36,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▌               | 1558/2000 [33:35<08:36,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▌               | 1559/2000 [33:36<08:36,  1.17s/it][A
 78%|██████████████████████████████████████████████████████▌               | 15

완료! 194번 활동




 78%|██████████████████████████████████████████████████████▉               | 1570/2000 [33:56<18:41,  2.61s/it][A
 79%|██████████████████████████████████████████████████████▉               | 1571/2000 [33:57<15:34,  2.18s/it][A
 79%|███████████████████████████████████████████████████████               | 1572/2000 [33:58<13:25,  1.88s/it][A
 79%|███████████████████████████████████████████████████████               | 1573/2000 [33:59<11:50,  1.66s/it][A
 79%|███████████████████████████████████████████████████████               | 1574/2000 [34:01<10:44,  1.51s/it][A
 79%|███████████████████████████████████████████████████████▏              | 1575/2000 [34:02<09:59,  1.41s/it][A
 79%|███████████████████████████████████████████████████████▏              | 1576/2000 [34:03<09:25,  1.33s/it][A
 79%|███████████████████████████████████████████████████████▏              | 1577/2000 [34:04<09:00,  1.28s/it][A
 79%|███████████████████████████████████████████████████████▏              | 1

# of episode :1600, avg score : 39.182
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 3. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 80%|████████████████████████████████████████████████████████              | 1602/2000 [34:33<07:47,  1.17s/it][A
 80%|████████████████████████████████████████████████████████              | 1603/2000 [34:34<07:45,  1.17s/it][A
 80%|████████████████████████████████████████████████████████▏             | 1604/2000 [34:36<07:43,  1.17s/it][A
 80%|████████████████████████████████████████████████████████▏             | 1605/2000 [34:37<07:39,  1.16s/it][A
 80%|████████████████████████████████████████████████████████▏             | 1606/2000 [34:38<07:39,  1.17s/it][A
 80%|████████████████████████████████████████████████████████▏             | 1607/2000 [34:39<07:38,  1.17s/it][A
 80%|████████████████████████████████████████████████████████▎             | 1608/2000 [34:40<07:37,  1.17s/it][A
 80%|████████████████████████████████████████████████████████▎             | 1609/2000 [34:41<07:35,  1.17s/it][A
 80%|████████████████████████████████████████████████████████▎             | 16

# of episode :1650, avg score : 35.508
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 3. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 83%|█████████████████████████████████████████████████████████▊            | 1652/2000 [35:32<06:46,  1.17s/it][A
 83%|█████████████████████████████████████████████████████████▊            | 1653/2000 [35:33<06:42,  1.16s/it][A
 83%|█████████████████████████████████████████████████████████▉            | 1654/2000 [35:34<06:37,  1.15s/it][A
 83%|█████████████████████████████████████████████████████████▉            | 1655/2000 [35:35<06:36,  1.15s/it][A
 83%|█████████████████████████████████████████████████████████▉            | 1656/2000 [35:36<06:34,  1.15s/it][A
 83%|█████████████████████████████████████████████████████████▉            | 1657/2000 [35:37<06:34,  1.15s/it][A
 83%|██████████████████████████████████████████████████████████            | 1658/2000 [35:38<06:34,  1.15s/it][A
 83%|██████████████████████████████████████████████████████████            | 1659/2000 [35:40<06:33,  1.15s/it][A
 83%|██████████████████████████████████████████████████████████            | 16

# of episode :1700, avg score : 36.447
[[0. 0. 0. 0. 0. 0. 0. 2. 2.]
 [1. 1. 3. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 85%|███████████████████████████████████████████████████████████▌          | 1702/2000 [36:32<06:00,  1.21s/it][A
 85%|███████████████████████████████████████████████████████████▌          | 1703/2000 [36:33<06:00,  1.22s/it][A
 85%|███████████████████████████████████████████████████████████▋          | 1704/2000 [36:34<05:58,  1.21s/it][A
 85%|███████████████████████████████████████████████████████████▋          | 1705/2000 [36:36<05:57,  1.21s/it][A
 85%|███████████████████████████████████████████████████████████▋          | 1706/2000 [36:37<05:56,  1.21s/it][A
 85%|███████████████████████████████████████████████████████████▋          | 1707/2000 [36:38<05:55,  1.21s/it][A
 85%|███████████████████████████████████████████████████████████▊          | 1708/2000 [36:39<05:55,  1.22s/it][A

완료! 135번 활동




 86%|███████████████████████████████████████████████████████████▊          | 1710/2000 [36:46<09:56,  2.06s/it][A
 86%|███████████████████████████████████████████████████████████▉          | 1711/2000 [36:47<09:04,  1.88s/it][A
 86%|███████████████████████████████████████████████████████████▉          | 1712/2000 [36:48<08:06,  1.69s/it][A
 86%|███████████████████████████████████████████████████████████▉          | 1713/2000 [36:50<07:23,  1.54s/it][A
 86%|███████████████████████████████████████████████████████████▉          | 1714/2000 [36:51<06:55,  1.45s/it][A
 86%|████████████████████████████████████████████████████████████          | 1715/2000 [36:52<06:50,  1.44s/it][A
 86%|████████████████████████████████████████████████████████████          | 1716/2000 [36:54<07:05,  1.50s/it][A
 86%|████████████████████████████████████████████████████████████          | 1717/2000 [36:55<06:52,  1.46s/it][A
 86%|████████████████████████████████████████████████████████████▏         | 1

# of episode :1750, avg score : 43.390
[[0. 0. 0. 0. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 3. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 88%|█████████████████████████████████████████████████████████████▎        | 1752/2000 [37:38<05:03,  1.22s/it][A
 88%|█████████████████████████████████████████████████████████████▎        | 1753/2000 [37:40<05:01,  1.22s/it][A
 88%|█████████████████████████████████████████████████████████████▍        | 1754/2000 [37:41<05:04,  1.24s/it][A
 88%|█████████████████████████████████████████████████████████████▍        | 1755/2000 [37:42<05:06,  1.25s/it][A
 88%|█████████████████████████████████████████████████████████████▍        | 1756/2000 [37:43<05:08,  1.26s/it][A
 88%|█████████████████████████████████████████████████████████████▍        | 1757/2000 [37:45<05:08,  1.27s/it][A
 88%|█████████████████████████████████████████████████████████████▌        | 1758/2000 [37:46<05:07,  1.27s/it][A
 88%|█████████████████████████████████████████████████████████████▌        | 1759/2000 [37:47<05:07,  1.28s/it][A
 88%|█████████████████████████████████████████████████████████████▌        | 17

# of episode :1800, avg score : 35.519
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 3.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 90%|███████████████████████████████████████████████████████████████       | 1802/2000 [38:39<03:54,  1.18s/it][A
 90%|███████████████████████████████████████████████████████████████       | 1803/2000 [38:40<03:52,  1.18s/it][A
 90%|███████████████████████████████████████████████████████████████▏      | 1804/2000 [38:41<03:52,  1.19s/it][A
 90%|███████████████████████████████████████████████████████████████▏      | 1805/2000 [38:42<03:51,  1.19s/it][A
 90%|███████████████████████████████████████████████████████████████▏      | 1806/2000 [38:44<03:52,  1.20s/it][A
 90%|███████████████████████████████████████████████████████████████▏      | 1807/2000 [38:45<03:52,  1.21s/it][A
 90%|███████████████████████████████████████████████████████████████▎      | 1808/2000 [38:46<03:53,  1.22s/it][A
 90%|███████████████████████████████████████████████████████████████▎      | 1809/2000 [38:47<03:53,  1.22s/it][A
 90%|███████████████████████████████████████████████████████████████▎      | 18

# of episode :1850, avg score : 41.785
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 3. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 93%|████████████████████████████████████████████████████████████████▊     | 1852/2000 [39:39<02:57,  1.20s/it][A
 93%|████████████████████████████████████████████████████████████████▊     | 1853/2000 [39:40<02:57,  1.21s/it][A
 93%|████████████████████████████████████████████████████████████████▉     | 1854/2000 [39:41<02:56,  1.21s/it][A
 93%|████████████████████████████████████████████████████████████████▉     | 1855/2000 [39:43<02:54,  1.20s/it][A
 93%|████████████████████████████████████████████████████████████████▉     | 1856/2000 [39:44<02:53,  1.20s/it][A
 93%|████████████████████████████████████████████████████████████████▉     | 1857/2000 [39:45<02:52,  1.21s/it][A
 93%|█████████████████████████████████████████████████████████████████     | 1858/2000 [39:46<02:51,  1.21s/it][A
 93%|█████████████████████████████████████████████████████████████████     | 1859/2000 [39:47<02:51,  1.21s/it][A
 93%|█████████████████████████████████████████████████████████████████     | 18

# of episode :1900, avg score : 41.972
[[0. 0. 0. 2. 0. 0. 0. 2. 2.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 3.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 95%|██████████████████████████████████████████████████████████████████▌   | 1902/2000 [40:45<02:50,  1.74s/it][A
 95%|██████████████████████████████████████████████████████████████████▌   | 1903/2000 [40:47<02:59,  1.85s/it][A
 95%|██████████████████████████████████████████████████████████████████▋   | 1904/2000 [40:49<03:03,  1.91s/it][A
 95%|██████████████████████████████████████████████████████████████████▋   | 1905/2000 [40:51<03:00,  1.90s/it][A
 95%|██████████████████████████████████████████████████████████████████▋   | 1906/2000 [40:53<02:57,  1.89s/it][A
 95%|██████████████████████████████████████████████████████████████████▋   | 1907/2000 [40:55<02:57,  1.90s/it][A
 95%|██████████████████████████████████████████████████████████████████▊   | 1908/2000 [40:57<02:55,  1.91s/it][A
 95%|██████████████████████████████████████████████████████████████████▊   | 1909/2000 [40:59<02:53,  1.91s/it][A
 96%|██████████████████████████████████████████████████████████████████▊   | 19

# of episode :1950, avg score : 39.566
[[0. 0. 0. 2. 0. 0. 0. 0. 0.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 1. 1. 1. 1. 1. 1. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [0. 1. 0. 1. 0. 1. 0. 1. 0.]
 [1. 1. 0. 1. 0. 1. 0. 1. 1.]
 [1. 1. 3. 1. 1. 1. 1. 1. 1.]
 [1. 1. 1. 1. 1. 1. 1. 1. 1.]
 [0. 0. 0. 0. 1. 0. 0. 0. 0.]]



 98%|████████████████████████████████████████████████████████████████████▎ | 1952/2000 [42:06<01:11,  1.49s/it][A
 98%|████████████████████████████████████████████████████████████████████▎ | 1953/2000 [42:08<01:09,  1.49s/it][A
 98%|████████████████████████████████████████████████████████████████████▍ | 1954/2000 [42:09<01:07,  1.48s/it][A
 98%|████████████████████████████████████████████████████████████████████▍ | 1955/2000 [42:11<01:06,  1.47s/it][A
 98%|████████████████████████████████████████████████████████████████████▍ | 1956/2000 [42:12<01:04,  1.47s/it][A
 98%|████████████████████████████████████████████████████████████████████▍ | 1957/2000 [42:14<01:03,  1.48s/it][A
 98%|████████████████████████████████████████████████████████████████████▌ | 1958/2000 [42:15<01:01,  1.46s/it][A
 98%|████████████████████████████████████████████████████████████████████▌ | 1959/2000 [42:17<00:59,  1.46s/it][A
 98%|████████████████████████████████████████████████████████████████████▌ | 19

In [34]:
torch.save(model.state_dict(), '/content/drive/MyDrive/Study/RL/weights/model_weights.pth')

NameError: name 'model' is not defined