<a href="https://colab.research.google.com/github/tmsk0711/path-finding-rl/blob/main/Sim.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# env

In [11]:
from string import ascii_uppercase
# from draw_utils import *
# from pyglet.gl import *
import numpy as np
import pandas as pd
import os
import random



# reward!
move_reward = - 1.0
obs_reward = - 2.0
goal_reward = 10
print('reward:' , move_reward, obs_reward,goal_reward)

__file__ = '/content/drive/MyDrive/Colab Notebooks/RL/path-finding-rl/data'
local_path = os.path.abspath(os.path.join(os.path.dirname(__file__)))


class Simulator:
    def __init__(self):
        '''
        height : 그리드 높이
        width : 그리드 너비 
        inds : A ~ Q alphabet list
        '''
        # Load train data
        self.files = pd.read_csv(os.path.join(local_path, "./data/factory_order_train.csv"))
        self.height = 10
        self.width = 9
        self.inds = list(ascii_uppercase)[:17]
#        print(self.inds)
#         ['A', 'B', 'C', 'D', 'E', 'F', 'G', 'H', 'I', 'J', 'K', 'L', 'M', 'N', 'O', 'P', 'Q']
     

    def set_box(self):
        '''
        아이템들이 있을 위치를 미리 정해놓고 그 위치 좌표들에 아이템이 들어올 수 있으므로 그리드에 100으로 표시한다.
        데이터 파일에서 이번 에피소드 아이템 정보를 받아 가져와야 할 아이템이 있는 좌표만 -100으로 표시한다.
        self.local_target에 에이전트가 이번에 방문해야할 좌표들을 저장한다.
        따라서 가져와야하는 아이템 좌표와 end point 좌표(처음 시작했던 좌표로 돌아와야하므로)가 들어가게 된다.
        '''
        box_data = pd.read_csv(os.path.join(local_path, "./data/box.csv"))
        # 아이템 위치 ex) 5,0,A | 4,0 B
        
        # 물건이 들어있을 수 있는 경우
        for box in box_data.itertuples(index = True, name ='Pandas'):
            # print(box)
            # Pandas(Index=0, row=5, col=0, item='A')
            self.grid[getattr(box, "row")][getattr(box, "col")] = 100

        # 물건이 실제 들어있는 경우
        order_item = list(set(self.inds) & set(self.items))
#         print("order_item : ",order_item)
        # [M,L,H]
        order_csv = box_data[box_data['item'].isin(order_item)]
#         print("order_csv : ",order_csv)
        # row, col, item
        
        for order_box in order_csv.itertuples(index = True, name ='Pandas'):
            self.grid[getattr(order_box, "row")][getattr(order_box, "col")] = -100
#             print("order_box : ",order_box)
#             order_box :  Pandas(Index=7, row=0, col=3, item='H')
#             order_box :  Pandas(Index=11, row=0, col=7, item='L')
#             order_box :  Pandas(Index=12, row=0, col=8, item='M')
            # local target에 가야 할 위치 좌표 넣기
            self.local_target.append(
                [getattr(order_box, "row"),
                 getattr(order_box, "col")]
                )

        self.local_target.sort()
        self.local_target.append([9,4]) 
#         print(self.local_target)
        # 알파벳을 Grid에 넣어서 -> grid에 2Dconv 적용 가능

    def set_obstacle(self):
        '''
        장애물이 있어야하는 위치는 미리 obstacles.csv에 정의되어 있다. 이 좌표들을 0으로 표시한다.
        '''
        obstacles_data = pd.read_csv(os.path.join(local_path, "./data/obstacles.csv"))
        
        for obstacle in obstacles_data.itertuples(index = True, name ='Pandas'):
            self.grid[getattr(obstacle, "row")][getattr(obstacle, "col")] = 0
#             print("self.grid:\n ",self.grid)

    def reset(self, epi):
        '''
        reset()은 첫 스텝에서 사용되며 그리드에서 에이전트 위치가 start point에 있게 한다.

        :param epi: episode, 에피소드 마다 가져와야 할 아이템 리스트를 불러올 때 사용
        :return: 초기셋팅 된 그리드
        :rtype: numpy.ndarray
        _____________________________________________________________________________________
        items : 이번 에피소드에서 가져와야하는 아이템들
        terminal_location : 현재 에이전트가 찾아가야하는 목적지
        local_target : 한 에피소드에서 찾아가야하는 아이템 좌표, 마지막 엔드 포인트 등의 위치좌표들
        actions: visualization을 위해 에이전트 action을 저장하는 리스트
        curloc : 현재 위치
        '''

        # initial episode parameter setting
        self.epi = epi
        self.items = list(self.files.iloc[self.epi])[0]
        self.cumulative_reward = 0
        self.terminal_location = None
        self.local_target = []
        self.actions = []

        # initial grid setting
        self.grid = np.ones((self.height, self.width), dtype="float16")

        # set information about the gridworld
        self.set_box()
        self.set_obstacle()

        # start point를 grid에 표시
        self.curloc = [9, 4]
        self.grid[int(self.curloc[0])][int(self.curloc[1])] = -5
        
        self.done = False
        
        return self.grid

    def apply_action(self, action, cur_x, cur_y):
        '''
        에이전트가 행한 action대로 현 에이전트의 위치좌표를 바꾼다.
        action은 discrete하며 4가지 up,down,left,right으로 정의된다.
        
        :param x: 에이전트의 현재 x 좌표
        :param y: 에이전트의 현재 y 좌표
        :return: action에 따라 변한 에이전트의 x 좌표, y 좌표
        :rtype: int, int
        '''
        new_x = cur_x
        new_y = cur_y
        # up
        if action == 0:
            new_x = cur_x - 1
        # down
        elif action == 1:
            new_x = cur_x + 1
        # left
        elif action == 2:
            new_y = cur_y - 1
        # right
        else:
            new_y = cur_y + 1

        return int(new_x), int(new_y)


    def get_reward(self, new_x, new_y, out_of_boundary):
        '''
        get_reward함수는 리워드를 계산하는 함수이며, 상황에 따라 에이전트가 action을 옳게 했는지 판단하는 지표가 된다.

        :param new_x: action에 따른 에이전트 새로운 위치좌표 x
        :param new_y: action에 따른 에이전트 새로운 위치좌표 y
        :param out_of_boundary: 에이전트 위치가 그리드 밖이 되지 않도록 제한
        :return: action에 따른 리워드
        :rtype: float
        '''

        # 바깥으로 나가는 경우
        if any(out_of_boundary):
            reward = obs_reward
            print( '나감')
                       
        else:
            # 장애물에 부딪히는 경우 
            if self.grid[new_x][new_y] == 0:
                reward = obs_reward  
                print('부딪힘')

            # 현재 목표에 도달한 경우
            elif new_x == self.terminal_location[0] and new_y == self.terminal_location[1]:
                reward = goal_reward
                print('목표 도달')

            # 그냥 움직이는 경우 
            else:
                reward = move_reward
                print('이동')

        return reward

    def step(self, action):
        ''' 
        에이전트의 action에 따라 step을 진행한다.
        action에 따라 에이전트 위치를 변환하고, action에 대해 리워드를 받고, 어느 상황에 에피소드가 종료되어야 하는지 등을 판단한다.
        에이전트가 endpoint에 도착하면 gif로 에피소드에서 에이전트의 행동이 저장된다.

        :param action: 에이전트 행동
        :return:
            grid, 그리드
            reward, 리워드
            cumulative_reward, 누적 리워드
            done, 종료 여부
            goal_ob_reward, goal까지 아이템을 모두 가지고 돌아오는 finish율 계산을 위한 파라미터

        :rtype: numpy.ndarray, float, float, bool, bool/str

        (Hint : 시작 위치 (9,4)에서 up말고 다른 action은 전부 장애물이므로 action을 고정하는 것이 좋음)
        '''

        #==============================수정
#         print("local_target",self.local_target)
        
#         local_target_len = len(self.local_target)
        
#         for i in range(local_target_len):
            
#             self.terminal_location = self.local_target[i]
        
        
            #==============================수정
        self.terminal_location = self.local_target[0]
        
        cur_x,cur_y = self.curloc
        self.actions.append((cur_x, cur_y))

        goal_ob_reward = False
        
        new_x, new_y = self.apply_action(action, cur_x, cur_y)

        out_of_boundary = [new_x < 0, new_x >= self.height, new_y < 0, new_y >= self.width]

        # 바깥으로 나가는 경우 종료
        if any(out_of_boundary):
            self.done = True
            goal_ob_reward = True
        else:
            # 장애물에 부딪히는 경우 종료
            if self.grid[new_x][new_y] == 0:
                self.done = True
                goal_ob_reward = True

            # 현재 목표에 도달한 경우, 다음 목표설정
            elif new_x == self.terminal_location[0] and new_y == self.terminal_location[1]:

                # end point 일 때
                if [new_x, new_y] == [9,4]:
                    self.done = True

                self.local_target.remove(self.local_target[0])
                self.grid[cur_x][cur_y] = 1
                self.grid[new_x][new_y] = -5
                goal_ob_reward = True
                self.curloc = [new_x, new_y]
            else:
                # 그냥 움직이는 경우 
                self.grid[cur_x][cur_y] = 1
                self.grid[new_x][new_y] = -5
                self.curloc = [new_x,new_y]
                
        reward = self.get_reward(new_x, new_y, out_of_boundary)
        self.cumulative_reward += reward

        # if self.done == True:
        #     if [new_x, new_y] == [9, 4]:
        #         if self.terminal_location == [9, 4]:
        #             # 완료되면 GIFS 저장
        #             goal_ob_reward = 'finish'
        #             height = 10
        #             width = 9 
        #             display = Display(visible=False, size=(width, height))
        #             display.start()

        #             start_point = (9, 4)
        #             unit = 50
        #             screen_height = height * unit
        #             screen_width = width * unit
        #             log_path = "./logs"
        #             data_path = "./data"
        #             render_cls = Render(screen_width, screen_height, unit, start_point, data_path, log_path)
        #             for idx, new_pos in enumerate(self.actions):
        #                 render_cls.update_movement(new_pos, idx+1)
                    
        #             render_cls.save_gif(self.epi)
        #             render_cls.viewer.close()
        #             display.stop()
        # else:
        #     if [new_x, new_y] == [9, 4]:
        #         if self.terminal_location == [9, 4]:
        #             # 완료되면 GIFS 저장
        #             goal_ob_reward = 'finish'
        #             height = 10
        #             width = 9 
        #             display = Display(visible=False, size=(width, height))
        #             display.start()

        #             start_point = (9, 4)
        #             unit = 50
        #             screen_height = height * unit
        #             screen_width = width * unit
        #             log_path = "./logs"
        #             data_path = "./data"
        #             render_cls = Render(screen_width, screen_height, unit, start_point, data_path, log_path)
        #             for idx, new_pos in enumerate(self.actions):
        #                 render_cls.update_movement(new_pos, idx+1)
                    
        #             render_cls.save_gif(self.epi)
        #             render_cls.viewer.close()
        #             display.stop()           
        
        # return int(new_x), int(new_y), self.grid, reward, self.cumulative_reward, self.done, goal_ob_reward        


    


reward: -1.0 -2.0 10


# Policy

In [56]:
import collections
import torch
import torch.nn as nn
import torch.nn.functional as F
import torch.optim as optim

class Policy():
    def __init__(self):
        pass
    
class RandomPolicy(Policy):
    def __init__(self):
        pass
    
    def select_action(self):
        action = random.randint(0,3)
        return action

class MC_Policy(Policy):
    def __init__(self):
        self.q_table = np.zeros((5,7,4))
        self.eps = 0.9
        self.alpha = 0.01
    def select_action(self,s):
        coin = random.randint(0,3)



# DQN
gamma = 0.98
buffer_limit = 50000
batch_size = 32
learning_rate = 0.0005

    # 리플레이 버퍼 추가
class ReplayBuffer():

    def __init__(self):   
        self.buffer = collections.deque(maxlen=buffer_limit)
    
    def put(self, transition):
        self.buffer.append(transition)
    
    def sample(self, n):
        mini_batch = random.sample(self.buffer, n)
        s_lst, a_lst, r_lst, s_prime_lst, done_mask_lst = [], [], [], [], []
        
        for transition in mini_batch:
            s, a, r, s_prime, done_mask = transition
            s_lst.append(s)
            a_lst.append([a])
            r_lst.append([r])
            s_prime_lst.append(s_prime)
            done_mask_lst.append([done_mask])

        return torch.tensor(s_lst, dtype=torch.float), torch.tensor(a_lst), \
               torch.tensor(r_lst), torch.tensor(s_prime_lst, dtype=torch.float), \
               torch.tensor(done_mask_lst)
    
    def size(self):
        return len(self.buffer)

      
class Qnet(nn.Module):
    def __init__(self):
        super(Qnet, self).__init__()
        self.fc1 = nn.Linear(4, 128)
        self.fc2 = nn.Linear(128, 128)
        self.fc3 = nn.Linear(128, 2)

    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = F.relu(self.fc2(x))
        x = self.fc3(x)
        return x
      
    def sample_action(self, obs, epsilon):
        out = self.forward(obs)
        coin = random.random()
        if coin < epsilon:
            return random.randint(0,1)
        else : 
            return out.argmax().item()
            
    def train(q, q_target, memory, optimizer):
        for i in range(10):
            s,a,r,s_prime,done_mask = memory.sample(batch_size)

            q_out = q(s)
            q_a = q_out.gather(1,a)
            max_q_prime = q_target(s_prime).max(1)[0].unsqueeze(1)
            target = r + gamma * max_q_prime * done_mask
            loss = F.smooth_l1_loss(q_a, target)
            
            optimizer.zero_grad()
            loss.backward()
            optimizer.step()       

In [58]:
def main():
    sim = Simulator() 
    q = Qnet()
    files = pd.read_csv("/content/drive/MyDrive/Colab Notebooks/RL/path-finding-rl/data/factory_order_train.csv")
    q_target = Qnet()
    q_target.load_state_dict(q.state_dict())
    memory = ReplayBuffer()

    print_interval = 20
    score = 0.0  
    optimizer = optim.Adam(q.parameters(), lr=learning_rate)

    for n_epi in range(10):
        epsilon = max(0.01, 0.08 - 0.01*(n_epi/200)) #Linear annealing from 8% to 1%
        s = sim.reset()
        done = False

        while not done:
            a = q.sample_action(torch.from_numpy(s).float(), epsilon)      
            s_prime, r, done, info = sim.step(a)
            done_mask = 0.0 if done else 1.0
            memory.put((s,a,r/100.0,s_prime, done_mask))
            s = s_prime

            score += r
            if done:
                break
            
        if memory.size()>2000:
            train(q, q_target, memory, optimizer)

        if n_epi%print_interval==0 and n_epi!=0:
            q_target.load_state_dict(q.state_dict())
            print("n_episode :{}, score : {:.1f}, n_buffer : {}, eps : {:.1f}%".format(
                                                            n_epi, score/print_interval, memory.size(), epsilon*100))
            score = 0.0
    sim.close()

if __name__ == '__main__':
    main()

TypeError: ignored

# Agent

In [50]:
"========================================================agent"
class Agent():
    def __init__(self):
        self.target_list = None
        self.policy = None
        
    def set_target_list(self, local_target):
        self.target_list = local_target
        print("Agent's local target = {}".format(local_target))
    
    def select_action(self):
        action = self.policy.select_action()
        return action
    
    def set_policy(self, mode):
        if mode=='random':
            self.policy = RandomPolicy()
            print(r"Agent's Policy = random")
            
        if mode == 'MC' :
            self.policy = MC_Policy()
            print(r"Agent's Policy = MC")
            
        if mode == 'DQN' :
            self.policy = DQN()
            print(r"Agent's Policy = DQN")

#  RandomTD_Main

In [None]:
if __name__ == "__main__":
    
    sim = Simulator()
    files = pd.read_csv("./data/factory_order_train.csv")
    agent = Agent()
    agent.set_policy('random')
    data = np.zeros((10,9))
    gamma = 1.0
    alpha = 0.0001
    
    for epi in range(10000): # len(files)):
        # env 초기화
        obs = sim.reset(epi)
        print('\n\nenv 초기화 완료, {}번째 에피소드 시작'.format(epi))
        
        history = []
        
#         print("data:",data)
        items = list(files.iloc[epi])[0]
        print("itmes",items)
        agent.set_target_list(items)
        done = False

#         actions = [0, 0, 2, 2, 2, 0, 0, 0, 0, 0, 0, 0, 3, 3, 3, 3, 3, 3, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 1]
        
        while done == False:
            actions = agent.select_action()
            print("action :",actions)
    
            
            x, y, next_obs, reward, cumul ,done, goal_reward = sim.step(actions)
            obs = next_obs
            
            # =============== history 추가 
            history.append((x,y,reward))
            print(history)
            
        cum_reward = 0
        for transition in history[::-1]:
            x,y,reward = transition

            print("data: ",data[x][y])
            data[x][y] = data[x][y] + alpha*(cum_reward - data[x][y])                
            cum_reward = cum_reward + gamma * reward
            
    for row in data:
        print("row\n",row)
            
            
            
#             print((x,y))
#             print("next_obs: \n ",next_obs)
#             print("reward: ",reward)
#             print("cumul: ",cumul)
#             print("done: ",done)
#             print("goal_reward: ",goal_reward)
            
#             print(i)
#             if (done == True) or (i == (len(actions)-1)):
#                 i =0
                



       
#         while done == False:
# #             actions = agent.select_action()
# #             print('actions:',actions)
#             i += 1
#             next_obs, reward, cumul ,done, goal_reward = sim.step(actions[i])
# #             print(actions[i])    
#             print("next_obs: ",next_obs)
#             print("reward: ",reward)
#             print("cumul: ",cumul)
#             print("done: ",done)
#             print("goal_reward: ",goal_reward)
#             obs = next_obs

#             if (done == True) or (i == (len(actions)-1)):
#                 i =0


            


Agent's Policy = random


env 초기화 완료, 0번째 에피소드 시작
itmes ['H', 'L', 'M']
Agent's local target = ['H', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1번째 에피소드 시작
itmes ['F', 'M', 'O', 'P', 'Q']
Agent's local target = ['F', 'M', 'O', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 



env 초기화 완료, 34번째 에피소드 시작
itmes ['A', 'D', 'K', 'L', 'M', 'P']
Agent's local target = ['A', 'D', 'K', 'L', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 35번째 에피소드 시작
itmes ['B', 'D', 'J', 'L', 'N', 'O', 'P']
Agent's local target = ['B', 'D', 'J', 'L', 'N', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 36번째 에피소드 시작
itmes ['D', 'G', 'J']
Agent's local target = ['D', 'G', 'J']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 37번째 에피소드 시작
itmes ['C', 'E', 'G', 'M', 'P', 'Q']
Agent's local target = ['C', 'E', 'G', 'M', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.00021994400699957003
data:  0.0008094622294346232


env 초기화 완료, 38번째 에피소드 시작
itmes ['D', 'E', 'F', 'L', 'M', 'P', 'Q']
Agent's local target = ['D', 'E', 'F', 'L', 'M', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 39번째 에피소드 시작
itmes ['F', 'G', 'H', 'L', 'O']
Agent's



env 초기화 완료, 71번째 에피소드 시작
itmes ['E', 'G', 'H', 'I', 'L', 'M']
Agent's local target = ['E', 'G', 'H', 'I', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 72번째 에피소드 시작
itmes ['C']
Agent's local target = ['C']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1), (8, 0, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1), (8, 0, 0.1), (7, 0, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1), (8, 0, 0.1), (7, 0, 0.1), (8, 0, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1),



env 초기화 완료, 104번째 에피소드 시작
itmes ['K', 'L', 'M', 'N']
Agent's local target = ['K', 'L', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 105번째 에피소드 시작
itmes ['E', 'I']
Agent's local target = ['E', 'I']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 106번째 에피소드 시작
itmes ['C', 'D', 'G', 'J', 'P']
Agent's local target = ['C', 'D', 'G', 'J', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 107번째 에피소드 시작
itmes ['I', 'M']
Agent's local target = ['I', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 108번째 에피소드 시작
itmes ['C', 'E', 'H', 'K', 'M', 'Q']
Agent's local target = ['C', 'E', 'H', 'K', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 109번째 에피소드 시작
itmes ['E', 'F', 'G', 'J']
Agent's local target = ['E', 'F', 'G', 'J']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 110번째 에피소드 시작
itmes ['A', 'B', 'F', 'I', 'J', 'L', 'M']
Agent's local target = ['A', 'B', 'F', 'I', 'J', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초

data:  0.00021997800119997004
data:  0.0003299320132981702
data:  0.0005697620801810633
data:  0.0008093453806355937
data:  0.0029913408430798497


env 초기화 완료, 177번째 에피소드 시작
itmes ['D', 'G', 'H', 'J', 'K', 'N', 'Q']
Agent's local target = ['D', 'G', 'H', 'J', 'K', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 178번째 에피소드 시작
itmes ['C', 'E', 'I', 'J', 'K', 'P', 'Q']
Agent's local target = ['C', 'E', 'I', 'J', 'K', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 179번째 에피소드 시작
itmes ['C', 'L']
Agent's local target = ['C', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 180번째 에피소드 시작
itmes ['I', 'O', 'Q']
Agent's local target = ['I', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 181번째 에피소드 시작
itmes ['J']
Agent's local target = ['J']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 

action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.00014998300119995004
data:  0.0009989796084507367
data:  0.00015996800289983006
data:  0.0010188797104898916
data:  0.003933770487480908


env 초기화 완료, 250번째 에피소드 시작
itmes ['B', 'C', 'E', 'L', 'N', 'P']
Agent's local target = ['B', 'C', 'E', 'L', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 251번째 에피소드 시작
itmes ['D', 'I', 'L']
Agent's local target = ['D', 'I', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 252번째 에피소드 시작
itmes ['A', 'D', 'G', 'H', 'K', 'M']
Agent's local target = ['A', 'D', 'G', 'H', 'K', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 253번째 에피소드 시작
itmes ['G', 'H', 'Q']
Agent's local target = ['G', 'H', 'Q']
action : 1
나



env 초기화 완료, 278번째 에피소드 시작
itmes ['B', 'I', 'J', 'N', 'O']
Agent's local target = ['B', 'I', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 279번째 에피소드 시작
itmes ['G', 'J', 'P', 'Q']
Agent's local target = ['G', 'J', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.0005893755493480983
data:  0.0060101078989914765


env 초기화 완료, 280번째 에피소드 시작
itmes ['D', 'F', 'G', 'J', 'M', 'N']
Agent's local target = ['D', 'F', 'G', 'J', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 281번째 에피소드 시작
itmes ['H', 'L']
Agent's local target = ['H', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 282번째 에피소드 시작
itmes ['D', 'H', 'L', 'N']
Agent's local target = ['D', 'H', 'L', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 283번째 에피소드 시작
itmes ['C', 'P']
Agent's local target = ['C', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 284번째 에피소

Agent's local target = ['F', 'G', 'J', 'L', 'M', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 313번째 에피소드 시작
itmes ['E', 'J', 'N']
Agent's local target = ['E', 'J', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 314번째 에피소드 시작
itmes ['A', 'C', 'F', 'H', 'N']
Agent's local target = ['A', 'C', 'F', 'H', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0015972181508587995
data:  0.006583927539012955
data:  0.001887008140662458
data:  0.006603269146259054


env 초기화 완료, 315번째 에피소드 시작
itmes ['G', 'I', 'Q']
Agent's local target = ['G', 'I', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8



env 초기화 완료, 350번째 에피소드 시작
itmes ['A', 'C', 'F', 'G', 'N', 'P', 'Q']
Agent's local target = ['A', 'C', 'F', 'G', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.001726732033428489
data:  0.00709574725629278


env 초기화 완료, 351번째 에피소드 시작
itmes ['E', 'F', 'M', 'N']
Agent's local target = ['E', 'F', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 352번째 에피소드 시작
itmes ['B', 'G', 'N']
Agent's local target = ['B', 'G', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0017365593602251463
data:  0.0006195452068364041
data:  0.0017463857042891238
data:  0.00711503768156715


env 초기화 완료, 353번째 에피소드 시작
itmes ['G', 'J']
Agent's loca



env 초기화 완료, 387번째 에피소드 시작
itmes ['F', 'P', 'Q']
Agent's local target = ['F', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 388번째 에피소드 시작
itmes ['C', 'G', 'H', 'L']
Agent's local target = ['C', 'G', 'H', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.00010999100010000002
data:  0.001488229412963527
data:  0.0018456672561835352
data:  0.007466258423886547


env 초기화 완료, 389번째 에피소드 시작
itmes ['A', 'D', 'J', 'O']
Agent's local target = ['A', 'D', 'J', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 390번째 에피소드 시작
itmes ['H', 'O']
Agent's local target = ['H', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 391번째 에피소드 시작
itmes ['B', 'H', 'J', 'N']
Agent's local target = ['B', 'H', 'J', 'N']
action : 3
부딪힘
[(9



env 초기화 완료, 420번째 에피소드 시작
itmes ['E', 'O']
Agent's local target = ['E', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 421번째 에피소드 시작
itmes ['F', 'O']
Agent's local target = ['F', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.0006794452629116728
data:  0.00295108191099425
data:  0.008105391621626228


env 초기화 완료, 422번째 에피소드 시작
itmes ['B', 'C', 'H', 'L', 'O', 'P']
Agent's local target = ['B', 'C', 'H', 'L', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5,

이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1), (6, 0, 0.1), (6, 1, 0.1), (7, 1, 0.1), (6, 1, 0.1), (7, 1, 0.1), (7, 0, 0.1), (6, 0, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1), (6, 0, 0.1), (6, 1, 0.1), (7, 1, 0.1), (6, 1, 0.1), (7, 1, 0.1), (7, 0, 0.1), (6, 0, 0.1), (6, 1, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1), (6, 0, 0.1), (6, 1, 0.1), (7, 1, 0.1), (6, 1, 0.1), (7, 1, 0.1), (7, 0, 0.1), (6, 0, 0.1), (6, 1, 0.1), (6, 2, 0.1)]
data:  0.0
data:  3.9998000000000006e-05
data:  0.0003599760005999901
data:  0.0006299040113988202
data:  0.0008596790784856019
data:  4.9994000200000006e-05
data:  0.0008995931105777534
data:  9.998900079998002e-05
data:  0.0003799400029999301
data:  0.000169979



env 초기화 완료, 486번째 에피소드 시작
itmes ['D', 'J', 'L', 'M']
Agent's local target = ['D', 'J', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 487번째 에피소드 시작
itmes ['D']
Agent's local target = ['D']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 488번째 에피소드 시작
itmes ['E', 'K', 'P']
Agent's local target = ['E', 'K', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 489번째 에피소드 시작
itmes ['B', 'E', 'H', 'L', 'O', 'P']
Agent's local target = ['B', 'E', 'H', 'L', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 490번째 에피소드 시작
itmes ['C', 'D', 'G', 'N', 'O', 'P', 'Q']
Agent's local target = ['C', 'D', 'G', 'N', 'O', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 491번째 에피소드 시작
itmes ['F', 'G', 'I', 'J', 'M', 'Q']
Agent's local target = ['F', 'G', 'I', 'J', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.0036482090398104908
data:  0.009

data:  9.999e-06
data:  0.0006598410209976803
data:  0.001059407200951569
data:  0.000869573147761438
data:  0.000809308380653543
data:  0.0037271086866411704
data:  0.010335958845651413


env 초기화 완료, 517번째 에피소드 시작
itmes ['A', 'G', 'J', 'K', 'O', 'P', 'Q']
Agent's local target = ['A', 'G', 'J', 'K', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 518번째 에피소드 시작
itmes ['C', 'F', 'H', 'I', 'K', 'N']
Agent's local target = ['C', 'F', 'H', 'I', 'K', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.0037767359757725064
data:  0.010394925249766847


env 초기화 완료, 519번째 에피소드 시작
itmes ['C', 'F', 'J', 'K', 'L', 'N', 'Q']
Agent's local target = ['C', 'F', 'J', 'K', 'L', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 520번째 에피소드 시작
itmes ['H', 'M', 'O', 'P', 'Q']
Agent's local target = ['H', 'M', 'O', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5



env 초기화 완료, 584번째 에피소드 시작
itmes ['A', 'C', 'M']
Agent's local target = ['A', 'C', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 585번째 에피소드 시작
itmes ['A', 'H', 'I']
Agent's local target = ['A', 'H', 'I']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 586번째 에피소드 시작
itmes ['D', 'F', 'K', 'L', 'Q']
Agent's local target = ['D', 'F', 'K', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 587번째 에피소드 시작
itmes ['I', 'N', 'O']
Agent's local target = ['I', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 588번째 에피소드 시작
itmes ['G', 'J', 'M']
Agent's local target = ['G', 'J', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.004063238291899764
data:  0.011239122701426114


env 초기화 완료, 589번째 에피소드 시작
itmes ['G', 'K', 'O']
Agent's local target = ['G', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 590번째 에피소드 시작
itmes ['C', 'D', 'I', 'K', 



env 초기화 완료, 615번째 에피소드 시작
itmes ['B', 'F', 'I', 'J', 'O', 'P']
Agent's local target = ['B', 'F', 'I', 'J', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.004261178080636963
data:  0.002215443857746816
data:  0.0042707519628289
data:  0.011992947306019568


env 초기화 완료, 616번째 에피소드 시작
itmes ['B', 'D', 'E', 'H', 'I', 'L', 'Q']
Agent's local target = ['B', 'D', 'E', 'H', 'I', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 617번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'Q']
Agent's local target = ['A', 'B', 'E', 'H', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 618번째 에피소드 시작
itmes ['A', 'E', 'H', 'L']
Agent's local target = ['A', 'E', 'H', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 619번째 에피소드 시작
itme



env 초기화 완료, 680번째 에피소드 시작
itmes ['A', 'C', 'G', 'H', 'I']
Agent's local target = ['A', 'C', 'G', 'H', 'I']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 681번째 에피소드 시작
itmes ['C', 'G', 'M', 'O']
Agent's local target = ['C', 'G', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 682번째 에피소드 시작
itmes ['H', 'I', 'O', 'Q']
Agent's local target = ['H', 'I', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 683번째 에피소드 시작
itmes ['D', 'F', 'J']
Agent's local target = ['D', 'F', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 684번째 에피소드 시작
itmes ['F', 'G', 'H', 'I', 'L', 'M', 'P']
Agent's local target = ['F', 'G', 'H', 'I', 'L', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 685번째 에피소드 시작
itmes ['F', 'N', 'P']
Agent's local target = ['F', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 686번째 에피소드 시작
itmes ['E', 'M', 'Q']
Agent's local target = ['E', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (



env 초기화 완료, 716번째 에피소드 시작
itmes ['E', 'H', 'K', 'L']
Agent's local target = ['E', 'H', 'K', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.004171798367644758
data:  0.013773089442617865


env 초기화 완료, 717번째 에피소드 시작
itmes ['B', 'D', 'F', 'G', 'H', 'L', 'Q']
Agent's local target = ['B', 'D', 'F', 'G', 'H', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 718번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'J', 'M', 'O']
Agent's local target = ['A', 'B', 'E', 'H', 'J', 'M', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 719번째 에피소드 시작
itmes ['B', 'F', 'K', 'L', 'N']
Agent's local target = ['B', 'F', 'K', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3

action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.004159800049998351
data:  0.014312138388096913


env 초기화 완료, 752번째 에피소드 시작
itmes ['D', 'O', 'P']
Agent's local target = ['D', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.004169384069993351
data:  0.001756366033475644
data:  0.004178967131586352
data:  0.0029620796741088016
data:  0.005034245001960157
data:  0.014330707174258103


env 초기화 완료, 753번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'J', 'M', 'Q']
Agent's local target = ['A',

action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.005271158219794263
data:  0.015751341726855144


env 초기화 완료, 783번째 에피소드 시작
itmes ['A', 'C', 'D', 'K', 'M', 'N', 'O']
Agent's local target = ['A', 'C', 'D', 'K', 'M', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 784번째 에피소드 시작
itmes ['A', 'E', 'F', 'M']
Agent's local target = ['A', 'E', 'F', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 785번째 에피소드 시작
itmes ['C', 'I', 'K', 'P', 'Q']
Agent's local target = ['C', 'I', 'K', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.00144462330429215
data:  0.01576976659268246


env 초기화 완료, 786번째 에피소드 시작
itmes ['B', 'C', 'D', 'F', 'G', 'O']
Agent's local target = ['B', 'C', 'D', 'F', 'G', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘


이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.006058853866404277
data:  0.0020167079328076384
data:  0.006068247981017637
data:  0.0032329516349242768
data:  0.006097641156219535
data:  0.0020365062620143577
data:  0.0061470313921039126
data:  0.016497387364377072


env 초기화 완료, 817번째 에피소드 시작
itmes ['C', 'H', 'L', 'Q']
Agent's local target = ['C', 'H', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 818번째 에피소드 시작
itmes ['A', 'B', 'C', 'E', 'F', 'N', 'P']
Agent's local target = ['A', 'B', 'C', 'E', 'F', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 819번째 에피소드 시작
itmes ['E', 'H', 'I']
Agent's local target = ['E', 'H', 'I']
action : 0
이동
[(8



env 초기화 완료, 893번째 에피소드 시작
itmes ['D', 'E', 'H']
Agent's local target = ['D', 'E', 'H']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.0009594582622058958
data:  0.0020963026113881562
data:  0.006273924495649242
data:  0.017180387711683443


env 초기화 완료, 894번째 에피소드 시작
itmes ['A', 'D', 'E', 'L', 'M']
Agent's local target = ['A', 'D', 'E', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (



env 초기화 완료, 926번째 에피소드 시작
itmes ['B', 'H', 'K', 'M', 'N', 'P']
Agent's local target = ['B', 'H', 'K', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1), (9, 8, 0.1)]
data:  0.0
data:  0.00011997800189993001
data:  0.0004897760661861721
data:  0.0021160929811270173
data:  0.006499455078705658
data:  0.018078569790495613


env 초기화 완료, 927번째 에피소드 시작
itmes ['B', 'C', 'P']
Agent's local target = ['B', 'C', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 928번째 에피소드 시작
itmes ['A', 'L', 'N']
Agent's local target = ['A', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 929번째 에피소드 시작
itmes ['F', 'G', 'H', 'J', 'L']
Agent's local target = ['F', 'G', 'H', 'J', 

action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.0010191644536100225
data:  0.0036588702938841595
data:  0.005633380307912835
data:  0.018632883396964322


env 초기화 완료, 961번째 에피소드 시작
itmes ['I', 'J', 'K', 'L', 'M']
Agent's local target = ['I', 'J', 'K', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 962번째 에피소드 시작
itmes ['B', 'G', 'H']
Agent's local target = ['B', 'G', 'H']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 963번째 에피소드 시작
itmes ['C', 'E', 'F', 'K', 'M', 'O', 'Q']
Agent's local target = ['C', 'E', 'F', 'K', 'M', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 964번째 에피소드 시작
itmes ['D', 'E', 'H', 'I', 'K']
Agent's local target = ['D', 'E', 'H', 'I', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action 

Agent's local target = ['E', 'F', 'H', 'I', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 996번째 에피소드 시작
itmes ['F', 'I', 'K', 'O', 'P']
Agent's local target = ['F', 'I', 'K', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.00042956827547681125
data:  0.003497306800593103
data:  0.005910509185840389
data:  0.019160218330871753


env 초기화 완료, 997번째 에피소드 시작
itmes ['A', 'B', 'F', 'H', 'I', 'O', 'Q']
Agent's local target = ['A', 'B', 'F', 'H', 'I', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 998번째 에피소드 시작
itmes ['D', 'G', 'P']
Agent's local target = ['D', 'G', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 999번째 에피소드 시작
itmes ['A', 'D', 'L', 'N']
Agent's local target = ['A', 'D', 'L', 'N']
acti



env 초기화 완료, 1030번째 에피소드 시작
itmes ['C', 'K', 'N', 'Q']
Agent's local target = ['C', 'K', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1031번째 에피소드 시작
itmes ['B', 'D', 'F', 'G', 'H', 'I', 'K']
Agent's local target = ['B', 'D', 'F', 'G', 'H', 'I', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1032번째 에피소드 시작
itmes ['G', 'H', 'K']
Agent's local target = ['G', 'H', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1033번째 에피소드 시작
itmes ['C', 'F', 'I', 'J', 'L']
Agent's local target = ['C', 'F', 'I', 'J', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1034번째 에피소드 시작
itmes ['A', 'K', 'N', 'O', 'P']
Agent's local target = ['A', 'K', 'N', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1035번째 에피소드 시작
itmes ['B', 'C', 'D', 'I', 'J', 'K']
Agent's local target = ['B', 'C', 'D', 'I', 'J', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 3
이동
[(8



env 초기화 완료, 1104번째 에피소드 시작
itmes ['D', 'O', 'Q']
Agent's local target = ['D', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1105번째 에피소드 시작
itmes ['B', 'F', 'G', 'K', 'N', 'P', 'Q']
Agent's local target = ['B', 'F', 'G', 'K', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1106번째 에피소드 시작
itmes ['E', 'I', 'J', 'K', 'M', 'N', 'P']
Agent's local target = ['E', 'I', 'J', 'K', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.006588653694379093
data:  0.02034692275799772


env 초기화 완료, 1107번째 에피소드 시작
itmes ['D', 'G', 'L', 'M']
Agent's local target = ['D', 'G', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1108번째 에피소드 시작
itmes ['A', 'M', 'O', 'P', 'Q']
Agent's local target = ['A', 'M', 'O', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1109번째 에피소드 시작
itmes ['A', 'C', 'I']
Agent's local target = ['A', 'C', 'I']




env 초기화 완료, 1139번째 에피소드 시작
itmes ['B', 'D', 'F', 'O', 'P']
Agent's local target = ['B', 'D', 'F', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1140번째 에피소드 시작
itmes ['A', 'B', 'J', 'K', 'M', 'N']
Agent's local target = ['A', 'B', 'J', 'K', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1141번째 에피소드 시작
itmes ['B', 'H', 'J', 'L', 'M', 'P']
Agent's local target = ['B', 'H', 'J', 'L', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1142번째 에피소드 시작
itmes ['B', 'F', 'G', 'K', 'N', 'Q']
Agent's local target = ['B', 'F', 'G', 'K', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1143번째 에피소드 시작
itmes ['C', 'J', 'N', 'P']
Agent's local target = ['C', 'J', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1)]




env 초기화 완료, 1174번째 에피소드 시작
itmes ['C', 'I', 'J', 'M', 'O', 'Q']
Agent's local target = ['C', 'I', 'J', 'M', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1175번째 에피소드 시작
itmes ['F', 'J', 'K', 'N']
Agent's local target = ['F', 'J', 'K', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1176번째 에피소드 시작
itmes ['E', 'G', 'K', 'P']
Agent's local target = ['E', 'G', 'K', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1177번째 에피소드 시작
itmes ['A', 'D', 'E', 'I', 'L', 'M', 'P']
Agent's local target = ['A', 'D', 'E', 'I', 'L', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1178번째 에피소드 시작
itmes ['A', 'F', 'J', 'O']
Agent's local target = ['A', 'F', 'J', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1179번째 에피소드 시작
itmes ['D', 'E', 'F', 'H', 'J', 'K', 'O']
Agent's local target = ['D', 'E', 'F', 'H', 'J', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1180번째 에피소드 시작
itmes ['A', 'H', 'J', 'K', 'N']
Agent's local targe

부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1207번째 에피소드 시작
itmes ['A', 'D', 'E', 'O', 'P']
Agent's local target = ['A', 'D', 'E', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1208번째 에피소드 시작
itmes ['C', 'D', 'I', 'K', 'Q']
Agent's local target = ['C', 'D', 'I', 'K', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1209번째 에피소드 시작
itmes ['A', 'E', 'G', 'J', 'M', 'O', 'P']
Agent's local target = ['A', 'E', 'G', 'J', 'M', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.007049130685456208
data:  0.02252489500629982
data:  0.007856150000297843
data:  0.022542642516799192


env 초기화 완료, 1210번째 에피소드 시작
itmes ['B', 'C', 'D', 'I', 'M', 'O', 'Q']
Agent's local target = ['B', 'C', 'D', 'I', 'M', 'O', 'Q']
action : 0
이동
[(8,



env 초기화 완료, 1240번째 에피소드 시작
itmes ['F', 'H']
Agent's local target = ['F', 'H']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1241번째 에피소드 시작
itmes ['A', 'G', 'L', 'N', 'O', 'P']
Agent's local target = ['A', 'G', 'L', 'N', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1242번째 에피소드 시작
itmes ['A', 'B', 'C', 'K', 'M', 'Q']
Agent's local target = ['A', 'B', 'C', 'K', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1243번째 에피소드 시작
itmes ['I', 'J']
Agent's local target = ['I', 'J']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1)]
action : 2




env 초기화 완료, 1277번째 에피소드 시작
itmes ['E', 'F', 'I', 'K', 'N', 'O', 'P']
Agent's local target = ['E', 'F', 'I', 'K', 'N', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1278번째 에피소드 시작
itmes ['B', 'F', 'H', 'M']
Agent's local target = ['B', 'F', 'H', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 3, 0.1), (7, 2, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.0016468556418497613
data:  0.004050530255383104
data:  0.0016566909562855763
data:  0.0018653633990552028
data:  0.0071112825399410615
data:  0.02374875549113211


env 초기화 완료, 1279번째 에피소드 시작
itmes ['C', 'K', 'M', 'N']
Agent's local target =



env 초기화 완료, 1314번째 에피소드 시작
itmes ['A', 'F', 'H', 'J', 'K', 'N', 'O']
Agent's local target = ['A', 'F', 'H', 'J', 'K', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1315번째 에피소드 시작
itmes ['B', 'D', 'K']
Agent's local target = ['B', 'D', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0



env 초기화 완료, 1344번째 에피소드 시작
itmes ['A', 'C', 'D', 'F', 'L', 'M']
Agent's local target = ['A', 'C', 'D', 'F', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1345번째 에피소드 시작
itmes ['B', 'D', 'G', 'H', 'L', 'N', 'P']
Agent's local target = ['B', 'D', 'G', 'H', 'L', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.0026214773661328693
data:  0.025458217056569442


env 초기화 완료, 1346번째 에피소드 시작
itmes ['B', 'D', 'F', 'G', 'P']
Agent's local target = ['B', 'D', 'F', 'G', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1347번째 에피소드 시작
itmes ['F', 'I', 'J', 'L', 'O', 'Q']
Agent's local target = ['F', 'I', 'J', 'L', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1348번째 에피소드 시작
itmes ['A', 'B', 'E', 'K', 'Q']
Agent's local target = ['A', 'B', 'E', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1349번째 에피소드 시작
itmes ['A', 'C', 'D', 'I', 'M

Agent's local target = ['E', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1376번째 에피소드 시작
itmes ['B', 'E', 'I', 'M', 'Q']
Agent's local target = ['B', 'E', 'I', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1377번째 에피소드 시작
itmes ['A', 'E', 'I', 'K', 'L', 'M', 'P']
Agent's local target = ['A', 'E', 'I', 'K', 'L', 'M', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.0020044039068731925
data:  0.007881695529579206
data:  0.026651738490073896


env 초기화 완료, 1378번째 에피소드 시작
itmes ['A', 'E', 'H', 'K', 'M', 'P', 'Q']
Agent's local target = ['A', 'E', 'H', 'K', 'M', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1379번째 에피소드 시작
itmes ['B', 'G', 'I', 'K', 'L', 'O']
Agent's local target = ['B', 'G', 'I', 'K', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1380번째 에피소



env 초기화 완료, 1446번째 에피소드 시작
itmes ['B', 'F', 'H', 'J', 'M', 'O', 'P']
Agent's local target = ['B', 'F', 'H', 'J', 'M', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.0032496518606144474
data:  0.009712989537180498
data:  0.005394765279041185
data:  0.00973201823822678
data:  0.02774669258431229
data:  0.008082141906242603
data:  0.027793917915053857


env 초기화 완료, 1447번째 에피소드 시작
itmes ['D', 'G', 'K', 'M', 'O']
Agent's local 

action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1478번째 에피소드 시작
itmes ['C', 'N', 'P']
Agent's local target = ['C', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
actio



env 초기화 완료, 1509번째 에피소드 시작
itmes ['D', 'E', 'F', 'G', 'L', 'M', 'O']
Agent's local target = ['D', 'E', 'F', 'G', 'L', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.009248279604202837
data:  0.030470323065341216
data:  0.003375749615738838
data:  0.03048727603303468


env 초기화 완료, 1510번째 에피소드 시작
itmes ['B', 'G', 'O', 'Q']
Agent's local target = ['B', 'G', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1)]
action : 0
이동


itmes ['F', 'G', 'I', 'Q']
Agent's local target = ['F', 'G', 'I', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1539번째 에피소드 시작
itmes ['D', 'F', 'H', 'O']
Agent's local target = ['D', 'F', 'H', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1540번째 에피소드 시작
itmes ['A', 'B', 'D', 'K', 'N']
Agent's local target = ['A', 'B', 'D', 'K', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1541번째 에피소드 시작
itmes ['E', 'H', 'K', 'L', 'M', 'O', 'Q']
Agent's local target = ['E', 'H', 'K', 'L', 'M', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1542번째 에피소드 시작
itmes ['A', 'B', 'G', 'J', 'K']
Agent's local target = ['A', 'B', 'G', 'J', 'K']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1543번째 에피소드 시작
itmes ['B', 'E', 'F', 'K', 'L', 'M', 'O']
Agent's local target = ['B', 'E', 'F', 'K', 'L', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1544번째 에피소드 시작
itmes ['A', 'E', 'I', 'P', 'Q']
Agent's local target = ['A', 'E', 'I', 'P', 'Q']



env 초기화 완료, 1575번째 에피소드 시작
itmes ['F', 'J', 'P', 'Q']
Agent's local target = ['F', 'J', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1576번째 에피소드 시작
itmes ['C', 'F', 'G', 'H', 'J', 'Q']
Agent's local target = ['C', 'F', 'G', 'H', 'J', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1577번째 에피소드 시작
itmes ['C', 'D', 'I', 'N', 'P']
Agent's local target = ['C', 'D', 'I', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1578번째 에피소드 시작
itmes ['A', 'D', 'J', 'K', 'M', 'P', 'Q']
Agent's local target = ['A', 'D', 'J', 'K', 'M', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1579번째 에피소드 시작
itmes ['A', 'D', 'H', 'J', 'N', 'P']
Agent's local target = ['A', 'D', 'H', 'J', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1580번째 에피소드 시작
itmes ['B', 'E', 'F', 'I', 'L', 'Q']
Agent's local target = ['B', 'E', 'F', 'I', 'L', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1581번째 에피소드 시작
itmes ['E', 'F', 'G']
Agent's l

[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1647번째 에피소드 시작
itmes ['B', 'D', 'J', 'K', 'L']
Agent's local target = ['B', 'D', 'J', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1648번째 에피소드 시작
itmes ['B', 'E', 'F', 'G', 'I', 'P', 'Q']
Agent's local target = ['B', 'E', 'F', 'G', 'I', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.0006589002075507221
data:  0.006438372547477224
data:  0.011202640990539863
data:  0.033673049212783725


env 초기화 완료, 1649번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'I', 'J']
Agent's local target = ['B', 'C', 'E', 'G', 'I', 'J']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1650번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'I', 'M', 'Q']
Agent's local target = ['A', 'B', 'C', 'D', 'I', 'M', 'Q']
action : 

action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1719번째 에피소드 시작
itmes ['B', 'C', 'D', 'E', 'F', 'I']
Agent's local target = ['B', 'C', 'D', 'E', 'F', 'I']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1720번째 에피소드 시작
itmes ['B', 'E', 'F', 'L', 'O']
Agent's local target = ['B', 'E', 'F', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1721번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'H']
Agent's local target = ['B', 'C', 'E', 'F', 'H']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1722번째 에피소드 시작
itmes ['G', 'N', 'P', 'Q']
Agent's local target = ['G', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1723번째 에피소드 시작
itmes ['B', 'C', 'E', 'J', 'M', 'N']
Agent's local target = ['B', 'C', 'E', 'J', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.003996511080357333
data:  0.03449852729704525


env 초기화 완료, 1724번째 에피소드 시작
itmes ['A', 'D', 'F',



env 초기화 완료, 1754번째 에피소드 시작
itmes ['E', 'K', 'L', 'N']
Agent's local target = ['E', 'K', 'L', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1755번째 에피소드 시작
itmes ['A', 'B', 'C', 'G', 'J', 'M', 'Q']
Agent's local target = ['A', 'B', 'C', 'G', 'J', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.010985597285129767
data:  0.008152577857349873
data:  0.010994498725401253
data:  0.03506419759591911
data:  0.012389611210862803
data:  0.03510069117615952


env 초기화 완료, 1756번째 에피소드 시작
itmes ['C', 'D', 'F', 'Q']
Agent's local target = ['C'



env 초기화 완료, 1788번째 에피소드 시작
itmes ['A', 'C', 'G', 'I', 'L', 'O']
Agent's local target = ['A', 'C', 'G', 'I', 'L', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1789번째 에피소드 시작
itmes ['B', 'F', 'I', 'N']
Agent's local target = ['B', 'F', 'I', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1790번째 에피소드 시작
itmes ['B', 'C', 'I', 'K', 'L', 'M']
Agent's local target = ['B', 'C', 'I', 'K', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1791번째 에피소드 시작
itmes ['C', 'E', 'F', 'J', 'N']
Agent's local target = ['C', 'E', 'F', 'J', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.004025309247024562
data:  0.03568827161216003


env 초기화 완료, 1792번째 에피소드 시작
itmes ['K', 'L', 'O']
Agent's local target = ['K', 'L', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1),



env 초기화 완료, 1858번째 에피소드 시작
itmes ['C', 'F', 'G', 'I', 'K']
Agent's local target = ['C', 'F', 'G', 'I', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1859번째 에피소드 시작
itmes ['F', 'G', 'H']
Agent's local target = ['F', 'G', 'H']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1860번째 에피소드 시작
itmes ['A', 'C', 'D', 'G', 'N', 'Q']
Agent's local target = ['A', 'C', 'D', 'G', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.01150102668205808
data:  0.03664625329662609


env 초기화 완료, 1861번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'K', 'M']
Agent's local target = ['A', 'B', 'C', 'H', 'K', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.012859378915146708
data:  0.036662588671296424


env 초기화 완료, 1862번째 에피소드 시작
itmes ['L', 'M', 'P', 'Q']
Agent's local target = ['L', 'M', 'P', 'Q']




env 초기화 완료, 1894번째 에피소드 시작
itmes ['L', 'M', 'O', 'P', 'Q']
Agent's local target = ['L', 'M', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 1895번째 에피소드 시작
itmes ['A', 'D', 'E', 'G', 'J', 'O', 'Q']
Agent's local target = ['A', 'D', 'E', 'G', 'J', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1896번째 에피소드 시작
itmes ['A', 'B', 'K']
Agent's local target = ['A', 'B', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1897번째 에피소드 시작
itmes ['A', 'B', 'M']
Agent's local target = ['A', 'B', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1898번째 에피소드 시작
itmes ['A', 'D', 'G', 'N']
Agent's local target = ['A', 'D', 'G', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.004629086567781942
data:  0.03758556466397765


env 초기화 완료, 1899번째 에피소드 시작
itmes ['D', 'E', 'M', 'N', 'O', 'P', 'Q']
Agent's local target = ['D', 'E', 'M', 'N', 'O', 'P', 'Q']


action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1931번째 에피소드 시작
itmes ['A', 'D', 'G', 'H', 'J', 'N']
Agent's local target = ['A', 'D', 'G', 'H', 'J', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.012516905785345912
data:  0.038531207518291505


env 초기화 완료, 1932번째 에피소드 시작
itmes ['B', 'C', 'D', 'F', 'G', 'I', 'K']
Agent's local target = ['B', 'C', 'D', 'F', 'G', 'I', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 1933번째 에피소드 시작
itmes ['B', 'L', 'M', 'N', 'Q']
Agent's local target = ['B', 'L', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1934번째 에피소드 시작
itmes ['E', 'G', 'M', 'N', 'Q']
Agent's local target = ['E', 'G', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.0047862948121115325
data:  0.038547354397539674


env 초기화 완료, 1935번째 에피소드 시

action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.013139004029918348
data:  0.039179109022570185


env 초기화 완료, 1965번째 에피소드 시작
itmes ['D', 'F', 'H', 'J', 'P', 'Q']
Agent's local target = ['D', 'F', 'H', 'J', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 1966번째 에피소드 시작
itmes ['B', 'C', 'D', 'F', 'I', 'Q']
Agent's local target = ['B', 'C', 'D', 'F', 'I', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0015977711663358036
data:  0.0088598637



env 초기화 완료, 1997번째 에피소드 시작
itmes ['A', 'D', 'N', 'O']
Agent's local target = ['A', 'D', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 



env 초기화 완료, 2033번째 에피소드 시작
itmes ['E', 'I', 'Q']
Agent's local target = ['E', 'I', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2034번째 에피소드 시작
itmes ['C', 'F', 'L', 'M']
Agent's local target = ['C', 'F', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2035번째 에피소드 시작
itmes ['E', 'M', 'N', 'P']
Agent's local target = ['E', 'M', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2036번째 에피소드 시작
itmes ['B', 'D', 'H', 'L', 'P']
Agent's local target = ['B', 'D', 'H', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2037번째 에피소드 시작
itmes ['C', 'D', 'E', 'H', 'I', 'J']
Agent's local target = ['C', 'D', 'E', 'H', 'I', 'J']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2038번째 에피소드 시작
itmes ['A', 'E', 'G', 'H', 'J']
Agent's local target = ['A', 'E', 'G', 'H', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2039번째 에피소드 시작
itmes ['A', 'F', 'H', 'J', 'K', 'L', 'P']
Agent's local target = ['A', 'F', 'H', 'J', 'K', 'L', 'P']




env 초기화 완료, 2068번째 에피소드 시작
itmes ['A', 'G', 'I', 'J', 'K', 'P', 'Q']
Agent's local target = ['A', 'G', 'I', 'J', 'K', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.013211551853690178
data:  0.04168908576917505
data:  0.013737541584758118
data:  0.041704916860598136
data:  0.013283009995746824
data:  0.04174074636891208


env 초기화 완료, 2069번째 에피소드 시작
itmes ['D', 'E', 'F', 'K', 'M', 'N', 'Q']
Agent's local target = ['D', 'E', 'F', 'K', 'M', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2070번째 에피소드 시작
itmes ['C', 'G', 'O']
Ag

data:  0.01037022921951311
data:  0.013934945191534561
data:  0.04213562419056719
data:  0.005246762261716624
data:  0.04226141062814814
data:  0.014210614190782398
data:  0.01047919219659116
data:  0.014053551697015408
data:  0.042407184487085324


env 초기화 완료, 2102번째 에피소드 시작
itmes ['B', 'H', 'K', 'N', 'Q']
Agent's local target = ['B', 'H', 'K', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2103번째 에피소드 시작
itmes ['C', 'G', 'K', 'N', 'O', 'P']
Agent's local target = ['C', 'G', 'K', 'N', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.013220230698504809
data:  0.007409572820924011
data:  0.013228908675434959
data:  0.042592943768636614


env 초기화 완료, 2104번째 에피소드 시작
itmes ['B', 'C', 'D', 'E', 'I', 'O']
Agent's local target =



env 초기화 완료, 2136번째 에피소드 시작
itmes ['C', 'F', 'H', 'O']
Agent's local target = ['C', 'F', 'H', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2137번째 에피소드 시작
itmes ['A', 'C', 'E', 'H', 'I', 'J', 'M']
Agent's local target = ['A', 'C', 'E', 'H', 'I', 'J', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2138번째 에피소드 시작
itmes ['I', 'P']
Agent's local target = ['I', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2139번째 에피소드 시작
itmes ['A', 'B', 'D', 'H', 'O']
Agent's local target = ['A', 'B', 'D', 'H', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2140번째 에피소드 시작
itmes ['B', 'G']
Agent's local target = ['B', 'G']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2141번째 에피소드 시작
itmes ['B', 'F', 'L', 'M', 'N', 'P']
Agent's local target = ['B', 'F', 'L', 'M', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2142번째 에피소드 시작
itmes ['D', 'J', 'N']
Agent's local target = ['D', 'J', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 



env 초기화 완료, 2206번째 에피소드 시작
itmes ['A', 'B', 'E', 'L', 'N', 'P']
Agent's local target = ['A', 'B', 'E', 'L', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2207번째 에피소드 시작
itmes ['E', 'J', 'L', 'N']
Agent's local target = ['E', 'J', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (6, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (6, 3, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0007984809683478958
data:  0.00011995001079861011
data:  0.000808401120251061
data:  0.00801809338283288
data:  0.014784817226008528
data:  0.04396600088419549


env 초기화 완료, 2208번째 에피소드 시작
itmes ['A', 'B', 'E', 'I', 'J', 'L']
Agent's local target = [



env 초기화 완료, 2242번째 에피소드 시작
itmes ['E', 'J', 'O']
Agent's local target = ['E', 'J', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2243번째 에피소드 시작
itmes ['A', 'C', 'K']
Agent's local target = ['A', 'C', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2244번째 에피소드 시작
itmes ['G', 'H', 'I', 'J', 'L']
Agent's local target = ['G', 'H', 'I', 'J', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2245번째 에피소드 시작
itmes ['A', 'B', 'E', 'J', 'M', 'Q']
Agent's local target = ['A', 'B', 'E', 'J', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2246번째 에피소드 시작
itmes ['C', 'D', 'H', 'O', 'P']
Agent's local target = ['C', 'D', 'H', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2247번째 에피소드 시작
itmes ['A', 'B', 'D', 'F', 'H', 'M', 'Q']
Agent's local target = ['A', 'B', 'D', 'F', 'H', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2248번째 에피소드 시작
itmes ['C', 'D', 'G', 'M', 'O', 'P', 'Q']
Agent's local target = ['C', 'D', 'G', 

action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.014417820709136301
data:  0.004610067517380215
data:  0.014426378927065388
data:  0.008562327419782514
data:  0.015838134145057317
data:  0.045313583114016696


env 초기화 완료, 2276번째 에피소드 시작
itmes ['B', 'F', 'G', 'H', 'N', 'O']
Agent's local target = ['B', 'F', 'G', 'H', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2277번째 에피소드 시작
itmes ['A', 'K', 'P']
Agent's local target = ['A', 'K', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2278번째 에피소드 시작
itmes ['A', 'F', 'G', 'L', 'N']
Agent's local target = ['A', 'F', 'G', 'L', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2279번째 에피소드 시작
itmes ['B', 'K', 'L', 'O']
Agent's local target = ['B', 'K', 'L', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2280번째 에피소드 시작
itmes ['A', 'E', 'F', 'H', 'K', 'N', 'Q']
Agent's local target = ['A', 'E', 'F', 'H', 'K', 'N', 'Q']
acti

action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.004887733946582088
data:  0.015118798860875826
data:  0.008937135313908023
data:  0.015137286980989739
data:  0.04582351816007147


env 초기화 완료, 2311번째 에피소드 시작
itmes ['A', 'E', 'F', 'I', 'K', 'O', 'Q']
Agent's local target = ['A', 'E', 'F', 'I', 'K', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2312번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'K', 'Q']
Agent's local target = ['A', 'B', 'E', 'G', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2313번째 에피소드 시작
itmes ['A', 'B', 'F', 'L', 'M', 'N']
Agent's local target = ['A', 'B', 'F', 'L', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2314번째 에피소드 시작
itmes ['H', 'I', 'K', 'P']
Agent's local target = ['H', 'I', 'K', 'P']
action : 0
이동
[(8, 

itmes ['D', 'H', 'I', 'J', 'N', 'O']
Agent's local target = ['D', 'H', 'I', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2348번째 에피소드 시작
itmes ['B', 'C', 'D', 'F', 'H', 'L', 'Q']
Agent's local target = ['B', 'C', 'D', 'F', 'H', 'L', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.016213757552420577
data:  0.046191335337992634


env 초기화 완료, 2349번째 에피소드 시작
itmes ['B', 'C', 'D', 'H', 'I', 'O', 'P']
Agent's local target = ['B', 'C', 'D', 'H', 'I', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2350번째 에피소드 시작
itmes ['A', 'E', 'L', 'N', 'P', 'Q']
Agent's local target = ['A', 'E', 'L', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2351번째 에피소드 시작
itmes ['C', 'P', 'Q']
Agent's local target = ['C', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2352번째 에피소드 시작
itmes ['B', 'E', 'H', 'I', 'K', 'L', 'N']
Agent's local tar



env 초기화 완료, 2420번째 에피소드 시작
itmes ['C', 'H', 'L']
Agent's local target = ['C', 'H', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2421번째 에피소드 시작
itmes ['C', 'F', 'M', 'P', 'Q']
Agent's local target = ['C', 'F', 'M', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.015004298278187313
data:  0.046862996085864396


env 초기화 완료, 2422번째 에피소드 시작
itmes ['G', 'J', 'L', 'M']
Agent's local target = ['G', 'J', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2423번째 에피소드 시작
itmes ['D', 'G', 'H', 'L']
Agent's local target = ['D', 'G', 'H', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2424번째 에피소드 시작
itmes ['D', 'G', 'J', 'M']
Agent's local target = ['D', 'G', 'J', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]



env 초기화 완료, 2490번째 에피소드 시작
itmes ['E', 'I', 'M', 'P']
Agent's local target = ['E', 'I', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2491번째 에피소드 시작
itmes ['A', 'E', 'F', 'K', 'O']
Agent's local target = ['A', 'E', 'F', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2492번째 에피소드 시작
itmes ['C', 'F', 'J', 'Q']
Agent's local target = ['C', 'F', 'J', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 5, 0.1), (6, 5, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0020859801518698737
data:  0.011840161461701438
data:  0.004044741438161218
data:  0.005380369652263828
data:  0.0153152

data:  0.017253681049797853
data:  0.011858977445555268
data:  0.015380663831322054
data:  0.04860524895273895
data:  0.017261955681692875
data:  0.010164527636671453
data:  0.017310229486124706
data:  0.04864038842784367
data:  0.0059056491056699205
data:  0.04871552438900088


env 초기화 완료, 2524번째 에피소드 시작
itmes ['I', 'M', 'N']
Agent's local target = ['I', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2525번째 에피소드 시작
itmes ['B', 'F', 'K', 'O', 'Q']
Agent's local target = ['B', 'F', 'K', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2526번째 에피소드 시작
itmes ['D', 'E', 'I', 'N']
Agent's local target = ['D', 'E', 'I', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2527번째 에피소드 시작
itmes ['E', 'F', 'G', 'H', 'I', 'J', 'O']
Agent's local target = ['E', 'F', 'G', 'H', 'I', 'J', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2528번째 에피소드 시작
itmes ['A', 'C', 'L', 'M', 'Q']
Agent's local target = ['A', 'C', 'L', 'M', 'Q']
action : 1
나감
[(10, 4,



env 초기화 완료, 2558번째 에피소드 시작
itmes ['A', 'H', 'M']
Agent's local target = ['A', 'H', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2559번째 에피소드 시작
itmes ['C', 'M', 'O']
Agent's local target = ['C', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2560번째 에피소드 시작
itmes ['A', 'B', 'D', 'E', 'J', 'K', 'L']
Agent's local target = ['A', 'B', 'D', 'E', 'J', 'K', 'L']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2561번째 에피소드 시작
itmes ['D', 'G', 'H', 'N', 'O']
Agent's local target = ['D', 'G', 'H', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2562번째 에피소드 시작
itmes ['D', 'E', 'G', 'N']
Agent's local target = ['D', 'E', 'G', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2563번째 에피소드 시작
itmes ['A', 'I', 'J', 'M', 'N']
Agent's local target = ['A', 'I', 'J', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2564번째 에피소드 시작
itmes ['B', 'C', 'H', 'M']
Agent's local target = ['B', 'C', 'H', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
d

action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (8, 7, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.005498740703173859
data:  0.0017867417346526034
data:  0.0021259280676684035
data:  0.004263094785754231
data:  0.0121905816663122
data:  0.017699727960620106
data:  0.049746964679312174


env 초기화 완료, 2593번째 에피소드 시작
itmes ['B', 'G', 'K', 'L']
Agent's local target = ['B', 'G', 'K', 'L']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2594번째 에피소드 시작
itmes ['E', 'G', 'I', 'K']
Agent's local target = ['E', 'G', 'I



env 초기화 완료, 2627번째 에피소드 시작
itmes ['B', 'E', 'I', 'M']
Agent's local target = ['B', 'E', 'I', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2628번째 에피소드 시작
itmes ['A', 'C', 'F', 'M', 'O', 'P']
Agent's local target = ['A', 'C', 'F', 'M', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2629번째 에피소드 시작
itmes ['A', 'B', 'F', 'J', 'Q']
Agent's local target = ['A', 'B', 'F', 'J', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2630번째 에피소드 시작
itmes ['M', 'N', 'O', 'P']
Agent's local target = ['M', 'N', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2631번째 에피소드 시작
itmes ['A', 'F', 'H', 'M', 'O', 'P']
Agent's local target = ['A', 'F', 'H', 'M', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2632번째 에피소드 시작
itmes ['A', 'D', 'E', 'J', 'K', 'M', 'N']
Agent's local target = ['A', 'D', 'E', 'J', 'K', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2633번째 에피소드 시작
itmes ['E', 'N', 'Q']
Agent's local target = ['E', 



env 초기화 완료, 2659번째 에피소드 시작
itmes ['E', 'G', 'J', 'N', 'P']
Agent's local target = ['E', 'G', 'J', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2660번째 에피소드 시작
itmes ['A', 'C', 'H', 'J', 'K', 'O', 'P']
Agent's local target = ['A', 'C', 'H', 'J', 'K', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2661번째 에피소드 시작
itmes ['E', 'J', 'O', 'P']
Agent's local target = ['E', 'J', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2662번째 에피소드 시작
itmes ['D', 'F', 'I', 'L', 'N', 'O', 'Q']
Agent's local target = ['D', 'F', 'I', 'L', 'N', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2663번째 에피소드 시작
itmes ['A', 'K', 'P', 'Q']
Agent's local target = ['A', 'K', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2664번째 에피소드 시작
itmes ['B', 'C', 'I', 'N']
Agent's local target = ['B', 'C', 'I', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2665번째 에피소드 시작
itmes ['A', 'D', 'E', 'J', 'K', 'N', 'O']
Agent's local targe



env 초기화 완료, 2728번째 에피소드 시작
itmes ['G', 'I', 'J', 'L', 'M', 'P', 'Q']
Agent's local target = ['G', 'I', 'J', 'L', 'M', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2729번째 에피소드 시작
itmes ['A', 'F', 'K', 'N']
Agent's local target = ['A', 'F', 'K', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0014265961235672702
data:  0.010887739850001464
data:  0.01876785316587548
data:  0.052287473202513424


env 초기화 완료, 2730번째 에피소드 시작
itmes ['A', 'B', 'E', 'F', 'H', 'L', 'P']
Agent's local target = ['A', 'B', 'E', 'F', 'H', 'L', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(



env 초기화 완료, 2760번째 에피소드 시작
itmes ['A', 'B', 'D', 'E', 'K', 'M', 'N']
Agent's local target = ['A', 'B', 'D', 'E', 'K', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (4, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (4, 5, 0.1), (3, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (4, 5, 0.1), (3, 5, 0.1), (4, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (4, 5, 0.1), (3, 5, 0.1), (4, 5, 0.1), (5, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (4, 5, 0.1), (3, 5, 0.1), (4, 5, 0.1), (5, 5, 0.1), (4, 5, 0.1)]
actio

data:  0.0


env 초기화 완료, 2794번째 에피소드 시작
itmes ['B', 'C', 'F', 'G', 'K', 'O']
Agent's local target = ['B', 'C', 'F', 'G', 'K', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2795번째 에피소드 시작
itmes ['A', 'C', 'D', 'F', 'K', 'O']
Agent's local target = ['A', 'C', 'D', 'F', 'K', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2796번째 에피소드 시작
itmes ['D', 'G', 'L', 'M', 'Q']
Agent's local target = ['D', 'G', 'L', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1

action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 3, 0.1), (7, 2, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.00482834607621655
data:  0.011516611057521376
data:  0.004837863241608929
data:  0.011535459396415624
data:  0.019665498979199617
data:  0.05434680863278047
data:  0.006921258455568663
data:  0.054401373951917194
data:  0.016520938235555043
data:  0.054475933814522


env 초기화 완료, 2829번째 에피소드 시작
itmes ['C', 'H', 'N', 'P', 'Q']
Agent's local target = ['C', 'H', 'N', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2830번째 에피소드 시작
itmes ['B', 'J', 'L', 'N', 'O', 'P']
Agent's local target = ['B', 'J', 'L', 'N', 'O', 'P']
action :



env 초기화 완료, 2865번째 에피소드 시작
itmes ['A', 'J', 'M']
Agent's local target = ['A', 'J', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2866번째 에피소드 시작
itmes ['F', 'I', 'N', 'P']
Agent's local target = ['F', 'I', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.002264695879833828
data:  0.012840584575353618
data:  0.016617625213117316
data:  0.054855778325284536


env 초기화 완료, 2867번째 에피소드 시작
itmes ['B', 'F', 'J', 'M', 'N']
Agent's local target = ['B', 'F', 'J', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.



env 초기화 완료, 2897번째 에피소드 시작
itmes ['A', 'B', 'F', 'K', 'M', 'O']
Agent's local target = ['A', 'B', 'F', 'K', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (5, 4, 0.1)]
data:  0.0
data:  0.00016989303869079155
data:  0.0016158429711507435
data:  0.011908487857465472
data:  0.018072064706228224
data:  0.05646579244647117


env 초기화 완료, 2898번째 에피소드 시작
itmes ['A', 'B', 'H', 'I', 'K', 'N', 'O']
Agent's local target = ['A', 'B', 'H', 'I', 'K', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.007067754523797206
data:  0.056510145867226524


env 초기화 완료, 2899번째 에피소드 시작
itmes ['B', '

action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.018306626629360223
data:  0.057002111049838135
data:  0.02091104101096358
data:  0.05701641083873315


env 초기화 완료, 2933번째 에피소드 시작
itmes ['C', 'I', 'K']
Agent's local target = ['C', 'I', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2934번째 에피소드 시작
itmes ['C', 'D', 'E', 'G', 'I', 'L', 'P']
Agent's local target = ['C', 'D', 'E', 'G', 'I', 'L', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 2935번째 에피소드 시작
itmes ['F', 'J', 'K', 'L', 'O']
Agent's local target = ['F', 'J', 'K', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2936번째 에피소드 시작
itmes ['E', 'H', 'J', 'K', 'O', 'Q']
Agent's local target = ['E', 'H', 'J', 'K', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.



env 초기화 완료, 2965번째 에피소드 시작
itmes ['I', 'K', 'L']
Agent's local target = ['I', 'K', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 2966번째 에피소드 시작
itmes ['B', 'D', 'E', 'I', 'L', 'Q']
Agent's local target = ['B', 'D', 'E', 'I', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 2967번째 에피소드 시작
itmes ['D', 'E', 'H', 'I', 'K', 'L', 'N']
Agent's local target = ['D', 'E', 'H', 'I', 'K', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5

data:  0.0


env 초기화 완료, 3001번째 에피소드 시작
itmes ['B', 'D', 'F', 'J', 'M', 'O', 'P']
Agent's local target = ['B', 'D', 'F', 'J', 'M', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3002번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'M', 'P']
Agent's local target = ['B', 'C', 'E', 'G', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3003번째 에피소드 시작
itmes ['A', 'C', 'F', 'I', 'J', 'L', 'O']
Agent's local target = ['A', 'C', 'F', 'I', 'J', 'L', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3004번째 에피소드 시작
itmes ['C', 'E', 'F', 'G', 'J']
Agent's local target = ['C', 'E', 'F', 'G', 'J']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.0049381248068729065
data:  0.014288940511914278
data:  0.021481978655864813
data:  0.057



env 초기화 완료, 3031번째 에피소드 시작
itmes ['A', 'F', 'M', 'N']
Agent's local target = ['A', 'F', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3032번째 에피소드 시작
itmes ['E', 'F', 'H', 'J', 'M', 'N']
Agent's local target = ['E', 'F', 'H', 'J', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3033번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'M', 'P', 'Q']
Agent's local target = ['B', 'C', 'E', 'F', 'M', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.007209900904815372
data:  0.05868639843823309
data:  0.018834604375765
data:  0.



env 초기화 완료, 3066번째 에피소드 시작
itmes ['A', 'C', 'F', 'J', 'O', 'Q']
Agent's local target = ['A', 'C', 'F', 'J', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.021669023700537776
data:  0.014424642258614631
data:  0.018967047665615595
data:  0.01444319979438877
data:  0.018995150960849035
data:  0.059128064591953626


env 초기화 완료, 3067번째 에피소드 시작
itmes ['C', 'E', 'L', 'M', 'O']
Agent's local target = ['C', 'E', 'L', 'M', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3068번째 에피소드 시작
itmes ['D', 'J', 'K', 'L', 'O', 'P']
Agent's local ta

action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 6, 0.1)]
actio

itmes ['D', 'F', 'H', 'L', 'N']
Agent's local target = ['D', 'F', 'H', 'L', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3133번째 에피소드 시작
itmes ['E', 'K', 'M']
Agent's local target = ['E', 'K', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3134번째 에피소드 시작
itmes ['A', 'B', 'F', 'L', 'O', 'Q']
Agent's local target = ['A', 'B', 'F', 'L', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.005006640517669651
data:  0.014704471049302635
data:  0.01948211239779807
data:  0.06074630751187004


env 초기화 완료, 3135번째 에피소드 시작
itmes ['F', 'N', 'Q']
Agent's local target = ['F', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3136번째 에피소드 시작
itmes ['A', 'F', 'I', 'J', 'K', 'O', 'Q']
Agent's local target = ['A', 'F', 'I



env 초기화 완료, 3169번째 에피소드 시작
itmes ['A', 'C', 'D', 'F', 'K', 'M', 'O']
Agent's local target = ['A', 'C', 'D', 'F', 'K', 'M', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3170번째 에피소드 시작
itmes ['A', 'B', 'D', 'E', 'F', 'I', 'L']
Agent's local target = ['A', 'B', 'D', 'E', 'F', 'I', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.01923215397237114
data:  0.06121879146355417


env 초기화 완료, 3171번째 에피소드 시작
itmes ['A', 'F', 'G', 'L', 'O', 'Q']
Agent's local target = ['A', 'F', 'G', 'L', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3172번째 에피소드 시작
itmes ['H', 'L', 'O', 'Q']
Agent's local target = ['H', 'L', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3173번째 에피소드 시작
itmes ['B', 'F', 'G', 'H', 'K', 'M']
Agent's local target = ['B', 'F', 'G', 'H', 'K', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3174번째 에피소드 시작
itmes ['D', 'F', 'G', 

Agent's local target = ['B', 'H', 'J', 'K', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (5, 4, 0.1)]
data:  0.0
data:  0.0007093583718409725
data:  0.002433550759440803
data:  0.015015605576949293
data:  0.002453307404364859
data:  0.015044104016391599
data:  0.019972492084607777
data:  0.06171124250657228


env 초기화 완료, 3208번째 에피소드 시작
itmes ['B', 'C', 'H', 'K', 'M', 'Q']
Agent's local target = ['B', 'C', 'H', 'K', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data: 



env 초기화 완료, 3244번째 에피소드 시작
itmes ['C', 'D', 'K', 'M', 'N']
Agent's local target = ['C', 'D', 'K', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3245번째 에피소드 시작
itmes ['F', 'I', 'K', 'L', 'M', 'P', 'Q']
Agent's local target = ['F', 'I', 'K', 'L', 'M', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3246번째 에피소드 시작
itmes ['I', 'J', 'M', 'N']
Agent's local target = ['I', 'J', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3247번째 에피소드 시작
itmes ['D', 'F', 'G', 'K', 'N', 'P', 'Q']
Agent's local target = ['D', 'F', 'G', 'K', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.007878649360238006
data:  0.06208556763837441
data:  0.02281910803806178
data:  0.06209935908161057


env 초기화 완료, 3248번



env 초기화 완료, 3276번째 에피소드 시작
itmes ['I', 'K', 'O']
Agent's local target = ['I', 'K', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3277번째 에피소드 시작
itmes ['C', 'D', 'E', 'H', 'K', 'L']
Agent's local target = ['C', 'D', 'E', 'H', 'K', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7



env 초기화 완료, 3310번째 에피소드 시작
itmes ['B', 'E', 'J', 'M', 'N', 'O']
Agent's local target = ['B', 'E', 'J', 'M', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3311번째 에피소드 시작
itmes ['C', 'G', 'I', 'L', 'N', 'O', 'Q']
Agent's local target = ['C', 'G', 'I', 'L', 'N', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.007946283001881537
data:  0.06329632183652179
data:  0.019850977771379345
data:  0.06330999220433814


env 초기화 완료, 3312번째 에피소드 시작
itmes ['D', 'E', 'G', 'H', 'J', 'K', 'M']
Agent's local target = ['D', 'E', 'G', 'H', 'J', 'K', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3313번째 에피소드 시작
itmes ['A', 'G', 'L', 'O', 'P']
Agent's local target = ['A', 'G', 'L', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.



env 초기화 완료, 3349번째 에피소드 시작
itmes ['F', 'J', 'N', 'O']
Agent's local target = ['F', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3350번째 에피소드 시작
itmes ['B', 'E', 'F', 'H', 'J', 'K', 'Q']
Agent's local target = ['B', 'E', 'F', 'H', 'J', 'K', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.006367465793483706
data:  0.019957004774334847
data:  0.06358291702622966
data:  0.023439737884863827
data:  0.06360655873452704


env 초기화 완료, 3351번째 에피소드 시작
itmes ['C', 'D', 'F', 'M']
Agent's local target = ['C', 'D', 'F', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 

action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3383번째 에피소드 시작
itmes ['A', 'B', 'C', 'F']
Agent's local target = ['A', 'B', 'C', 'F']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3384번째 에피소드 시작
itmes ['A', 'B', 'H', 'O', 'P']
Agent's local target = ['A', 'B', 'H', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3385번째 에피소드 시작
itmes ['E', 'F', 'G', 'J', 'N', 'P']
Agent's local target = ['E', 'F', 'G', 'J', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3386번째 에피소드 시작
itmes ['D', 'F', 'I', 'O', 'P', 'Q']
Agent's local target = ['D', 'F', 'I', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3387번째 에피소드 시작
itmes ['D', 'E', 'F', 'L', 'M', 'Q']
Agent's local target = ['D', 'E', 'F', 'L', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3388번째 에피소드 시작
itmes ['D', 'E', 'F', 'H']
Agent's local target = ['D', 'E', 'F', 'H']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4,



env 초기화 완료, 3416번째 에피소드 시작
itmes ['A', 'C', 'D', 'J', 'P']
Agent's local target = ['A', 'C', 'D', 'J', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3417번째 에피소드 시작
itmes ['C', 'E', 'F', 'G', 'M', 'N', 'P']
Agent's local target = ['C', 'E', 'F', 'G', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1), (6, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1), (6, 7, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1), (6, 7, 0.1), (6, 6, 0.1)]

data:  0.008156658730673082
data:  0.06578811280092159


env 초기화 완료, 3451번째 에피소드 시작
itmes ['B', 'C', 'I', 'K', 'L', 'N']
Agent's local target = ['B', 'C', 'I', 'K', 'L', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3452번째 에피소드 시작
itmes ['A', 'D', 'E', 'G', 'I', 'L']
Agent's local target = ['A', 'D', 'E', 'G', 'I', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3453번째 에피소드 시작
itmes ['A', 'E', 'K', 'L', 'Q']
Agent's local target = ['A', 'E', 'K', 'L', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.020630590411640674
data:  0.0658015339896415
data:  0.02063852735259951
data:  0.06581495383624254


env 초기화 완료, 3454번째 에피소드 시작
itmes ['B', 'C', 'D', 'I', 'M']
Agent's local target = ['B', 'C', 'D', 'I', 'M']
action : 0
이동
[



env 초기화 완료, 3485번째 에피소드 시작
itmes ['A', 'C', 'G', 'J', 'L', 'M']
Agent's local target = ['A', 'C', 'G', 'J', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0243643519453327
data:  0.06663573503185936
data:  0.008450028703394901
data:  0.06664907145835618
data:  0.0208381681565694
data:  0.06668



env 초기화 완료, 3523번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'J', 'L', 'N']
Agent's local target = ['B', 'C', 'E', 'G', 'J', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3524번째 에피소드 시작
itmes ['D', 'E', 'F', 'J', 'K', 'P']
Agent's local target = ['D', 'E', 'F', 'J', 'K', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3525번째 에피소드 시작
itmes ['A', 'C', 'H', 'J', 'K', 'O']
Agent's local target = ['A', 'C', 'H', 'J', 'K', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3526번째 에피소드 시작
itmes ['D', 'F', 'J', 'N', 'P']
Agent's local target = ['D', 'F', 'J', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.00848833578215451
data:  0.06700563188779404


env 초기화 완료, 3527번째 에피소드 시작
itmes ['B', 'C', 'K', 'L', 'O', 'P']
Agent's local target = ['B', 'C', 'K', 'L', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3528번째 에피소드 시작
itmes ['D', 'G', 'J', 

action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.008554082464012082
data:  0.0676481139633422


env 초기화 완료, 3560번째 에피소드 시작
itmes ['B', 'E', 'F', 'K', 'O']
Agent's local target = ['B', 'E', 'F', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3561번째 에피소드 시작
itmes ['B', 'F', 'H', 'K', 'P', 'Q']
Agent's local target = ['B', 'F', 'H', 'K', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3562번째 에피소드 시작
itmes ['D', 'E', 'I', 'Q']
Agent's local target = ['D', 'E', 'I', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3563번째 에피소드 시작
itmes ['C', 'D', 'E', 'F', 'G', 'I', 'J']
Agent's local target = ['C', 'D', 'E', 'F', 'G', 'I', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3564번째 에피소드 시작
itmes ['D', 'F', 'J', 'M', 'N', 'P']
Agent's local target = ['D', 'F', 'J', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
ac

itmes ['D', 'G', 'J', 'L', 'M', 'P', 'Q']
Agent's local target = ['D', 'G', 'J', 'L', 'M', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3596번째 에피소드 시작
itmes ['A', 'D', 'F', 'G', 'H', 'L', 'N']
Agent's local target = ['A', 'D', 'F', 'G', 'H', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3597번째 에피소드 시작
itmes ['G', 'P', 'Q']
Agent's local target = ['G', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.008581513495986797
data:  0.06811313127142343


env 초기화 완료, 3598번째 에피소드 시작
itmes ['A', 'C', 'E', 'F', 'I', 'J', 'L']
Agent's local target = ['A', 'C', 'E', 'F', 'I', 'J', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3599번째 에피소드 시작
itmes ['C', 'I', 'K', 'N', 'O']
Agent's local target = ['C', 'I', 'K', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:

action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3628번째 에피소드 시작
itmes ['D', 'G', 'K']
Agent's local target = ['D', 'G', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3629번째 에피소드 시작
itmes ['A', 'H', 'J', 'K', 'L', 'N', 'Q']
Agent's local target = ['A', 'H', 'J', 'K', 'L', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5,



env 초기화 완료, 3663번째 에피소드 시작
itmes ['E', 'F', 'P', 'Q']
Agent's local target = ['E', 'F', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3664번째 에피소드 시작
itmes ['D', 'H', 'J', 'L', 'P', 'Q']
Agent's local target = ['D', 'H', 'J', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3665번째 에피소드 시작
itmes ['B', 'F', 'J', 'L', 'N', 'P', 'Q']
Agent's local target = ['B', 'F', 'J', 'L', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.0068177622703314384
data:  0.0022945273679452084
data:  0.006827080494104405
data:  0.021768581612824918
data:  0.06968657201931551


env 초기화 완료, 3666번째 에피소드 시작
itmes ['A', 'D', 'G', 'H'



env 초기화 완료, 3697번째 에피소드 시작
itmes ['L', 'N', 'Q']
Agent's local target = ['L', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 



env 초기화 완료, 3724번째 에피소드 시작
itmes ['A', 'E', 'H', 'I']
Agent's local target = ['A', 'E', 'H', 'I']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3725번째 에피소드 시작
itmes ['C', 'F', 'G', 'H', 'P', 'Q']
Agent's local target = ['C', 'F', 'G', 'H', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3726번째 에피소드 시작
itmes ['B', 'E', 'I', 'J', 'L', 'M']
Agent's local target = ['B', 'E', 'I', 'J', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3727번째 에피소드 시작
itmes ['C', 'F', 'H', 'K', 'O', 'Q']
Agent's local target = ['C', 'F', 'H', 'K', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3728번째 에피소드 시작
itmes ['A', 'G', 'K', 'L', 'N', 'Q']
Agent's local target = ['A', 'G', 'K', 'L', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3729번째 에피소드 시작
itmes ['A', 'G', 'I', 'J', 'K', 'O', 'P']
Agent's local target = ['A', 'G', 'I', 'J', 'K', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3730번째 에피소드 시작
itmes ['B', 'E', 'O',

action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data

data:  0.07342223744902157


env 초기화 완료, 3791번째 에피소드 시작
itmes ['A', 'L', 'N', 'O']
Agent's local target = ['A', 'L', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 1, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 1, 0.1), (7, 1, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 1, 0.1), (7, 1, 0.1), (7, 2, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 1, 0.1), (7, 1, 0.1), (7, 2, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (8, 1, 0.1), (7, 1, 0.1), (7, 2, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  



env 초기화 완료, 3824번째 에피소드 시작
itmes ['B', 'E', 'K', 'L', 'P', 'Q']
Agent's local target = ['B', 'E', 'K', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3825번째 에피소드 시작
itmes ['H', 'J', 'M', 'P']
Agent's local target = ['H', 'J', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3826번째 에피소드 시작
itmes ['A', 'E', 'F', 'G', 'J', 'K', 'L']
Agent's local target = ['A', 'E', 'F', 'G', 'J', 'K', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0



env 초기화 완료, 3860번째 에피소드 시작
itmes ['B', 'C', 'L', 'N', 'O']
Agent's local target = ['B', 'C', 'L', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3861번째 에피소드 시작
itmes ['A', 'B', 'D', 'E', 'J']
Agent's local target = ['A', 'B', 'D', 'E', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3862번째 에피소드 시작
itmes ['B', 'C', 'F', 'G', 'K']
Agent's local target = ['B', 'C', 'F', 'G', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3863번째 에피소드 시작
itmes ['D', 'E', 'G', 'J', 'N']
Agent's local target = ['D', 'E', 'G', 'J', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3864번째 에피소드 시작
itmes ['A', 'B', 'G', 'H', 'M']
Agent's local target = ['A', 'B', 'G', 'H', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3865번째 에피소드 시작
itmes ['I', 'N', 'O', 'Q']
Agent's local target = ['I', 'N', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3866번째 에피소드 시작
itmes ['A', 'B', 'C', 'E', 'I', 'K']
Agent's local target = ['A', 'B', 'C', 'E', 

action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3898번째 에피소드 시작
itmes ['G', 'I', 'J', 'P']
Agent's local target = ['G', 'I', 'J', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3899번째 에피소드 시작
itmes ['B', 'D', 'G', 'I', 'K', 'M']
Agent's local target = ['B', 'D', 'G', 'I', 'K', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3900번째 에피소드 시작
itmes ['B', 'C', 'I', 'M', 'O']
Agent's local target = ['B', 'C', 'I', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3901번째 에피소드 시작
itmes ['C', 'F', 'H', 'L', 'M', 'N', 'Q']
Agent's local target = ['C', 'F', 'H', 'L', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 3902번째 에피소드 시작
itmes ['D', 'E', 'N']
Agent's local target = ['D', 'E', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3903번째 에피소드 시작
itmes ['A', 'C', 'D', 'J', 'M', 'N']
Agent's local target = ['A', 'C', 'D', 'J', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4,



env 초기화 완료, 3935번째 에피소드 시작
itmes ['C', 'E', 'L', 'N', 'O', 'P', 'Q']
Agent's local target = ['C', 'E', 'L', 'N', 'O', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 3936번째 에피소드 시작
itmes ['D', 'F', 'G', 'Q']
Agent's local target = ['D', 'F', 'G', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.009249351620609744
data:  0.07571433782211551
data:  0.02811343874514052
data:  0.0757267663883333


env 초기화 완료, 3937번째 에피소드 시작
itmes ['A', 'B', 'F', 'J', 'K', 'O', 'Q']
Agent's local target = ['A', 'B', 'F', 'J', 'K', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 3938번째 에피소드 시작
itmes ['A', 'F', 'I', 'L', 'M', 'N', 'P']
Agent's local target = ['A', 'F', 'I', 'L', 'M', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0




env 초기화 완료, 3971번째 에피소드 시작
itmes ['D', 'G', 'N', 'Q']
Agent's local target = ['D', 'G', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 2, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 



env 초기화 완료, 4005번째 에피소드 시작
itmes ['C', 'H', 'I', 'L', 'O', 'P']
Agent's local target = ['C', 'H', 'I', 'L', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4006번째 에피소드 시작
itmes ['C', 'G', 'J', 'L', 'M', 'Q']
Agent's local target = ['C', 'G', 'J', 'L', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4007번째 에피소드 시작
itmes ['D', 'E', 'G', 'J', 'P']
Agent's local target = ['D', 'E', 'G', 'J', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.024102390753326115
data:  0.07660491976091764
data:  0.02410998051425078
data:  0.07661725926894156


env 초기화 완료, 4008번째 에피소드 시작
itmes ['B', 'C', 'G', 'H', 'L', 'O', 'Q']
Agent's local target = ['B', 'C', 'G', 'H', 'L', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4,



env 초기화 완료, 4040번째 에피소드 시작
itmes ['D', 'G', 'I', 'N', 'Q']
Agent's local target = ['D', 'G', 'I', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4041번째 에피소드 시작
itmes ['A', 'C', 'E', 'G', 'M']
Agent's local target = ['A', 'C', 'E', 'G', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4



env 초기화 완료, 4076번째 에피소드 시작
itmes ['C', 'D', 'K', 'P']
Agent's local target = ['C', 'D', 'K', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.02467313789387752
data:  0.0776721452406569
data:  0.026064198871423343
data:  0.07768437802613283
data:  0.029213303230713205
data:  0.07771660958833022


env 초기화 완료, 4077번째 에피소드 시작
itmes ['A', 'B', 'D', 'H', 'Q']
Agent's local target = ['A', 'B', 'D', 'H', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4078번째 에피소드 시작
itmes ['D', 'E', 'F', 'L', 'M', 'N', 'P']
Agent's local target = ['D', 'E', '



env 초기화 완료, 4109번째 에피소드 시작
itmes ['A', 'C', 'D', 'G', 'I', 'J']
Agent's local target = ['A', 'C', 'D', 'G', 'I', 'J']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4110번째 에피소드 시작
itmes ['C', 'F', 'H', 'N']
Agent's local target = ['C', 'F', 'H', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.02514081097562704
data:  0.07857389235056254


env 초기화 완료, 4111번째 에피소드 시작
itmes ['B', 'H', 'J', 'L', 'O']
Agent's local target = ['B', 'H', 'J', 'L', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.009488165526397429
data:  0.07858603496132749
data:  0.00949721670984479
data:  0.07859817635783135


env 초기화 완료, 4112번째 에피소드 시작
itmes ['A', 'B', 'F',



env 초기화 완료, 4144번째 에피소드 시작
itmes ['B', 'D', 'F', 'J', 'O', 'P', 'Q']
Agent's local target = ['B', 'D', 'F', 'J', 'O', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4145번째 에피소드 시작
itmes ['A', 'C', 'F', 'H']
Agent's local target = ['A', 'C', 'F', 'H']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4146번째 에피소드 시작
itmes ['A', 'B', 'E', 'F', 'G', 'H', 'O']
Agent's local target = ['A', 'B', 'E', 'F', 'G', 'H', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4147번째 에피소드 시작
itmes ['B', 'F', 'H', 'J', 'K', 'Q']
Agent's local target = ['B', 'F', 'H', 'J', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4148번째 에피소드 시작
itmes ['A', 'B', 'D', 'F', 'J', 'K', 'Q']
Agent's local target = ['A', 'B', 'D', 'F', 'J', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4149번째 에피소드 시작
itmes ['I', 'J', 'L', 'M', 'P']
Agent's local target = ['I', 'J', 'L', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4150번째 에피소드 시작
itmes ['F',

action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.0255529839580431
data:  0.07991479680296104
data:  0.030234900419355847
data:  0.07992680532328074


env 초기화 완료, 4178번째 에피소드 시작
itmes ['B', 'C', 'D', 'F', 'I', 'O']
Agent's local target = ['B', 'C', 'D', 'F', 'I', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.006907548849960782
data:  0.018054813714299494
data:  0.03026187692931391
data:  0.07995881264274841
data:  0.0302888507416



env 초기화 완료, 4247번째 에피소드 시작
itmes ['A', 'D', 'E', 'G', 'O']
Agent's local target = ['A', 'D', 'E', 'G', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4248번째 에피소드 시작
itmes ['D', 'F', 'G', 'P']
Agent's local target = ['D', 'F', 'G', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.00779802535115037
data:  0.025735056240404366
data:  0.08047837026111412


env 초기화 완료, 4249번째 에피소드 시작
itmes ['E', 'F', 'G', 'H', 'J', 'N', 'O']
Agent's local target = ['E', 'F', 'G', 'H', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4250번째 에피소드 시작
itmes ['C', 'D', 'I', 'J', 'K', 'M', 'O']
Agent's local target = ['C', 'D', 'I', 'J', 'K', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4251번째 에피소드 시작
itmes ['A', 'C', 'D', 'H', 'J', 'O']
Agent's local target = ['A', 'C', 'D', 'H', 'J', 'O']
action



env 초기화 완료, 4283번째 에피소드 시작
itmes ['A', 'G', 'J', 'O']
Agent's local target = ['A', 'G', 'J', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4284번째 에피소드 시작
itmes ['A', 'B', 'D', 'H', 'J', 'N', 'O']
Agent's local target = ['A', 'B', 'D', 'H', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4285번째 에피소드 시작
itmes ['A', 'C', 'G', 'H', 'K']
Agent's local target = ['A', 'C', 'G', 'H', 'K']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4286번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'J', 'M']
Agent's local target = ['A', 'B', 'C', 'D', 'J', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4287번째 에피소드 시작
itmes ['D', 'F', 'G', 'N']
Agent's local target = ['D', 'F', 'G', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4288번째 에피소드 시작
itmes ['C', 'D', 'G', 'H', 'J', 'O']
Agent's local target = ['C', 'D', 'G', 'H', 'J', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4289번째 에피소드 시작
itmes ['A', 'D', 'H', 'M', 'O', 'P']
Agent's local 

itmes ['C', 'D', 'E', 'J', 'L', 'N']
Agent's local target = ['C', 'D', 'E', 'J', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (8, 7, 0.1), (9, 7, 0.1)]
data:  0.0
data:  0.002591344347722889
data:  0.007826464824060393
data:  0.0063582545880968835
data:  0.007845682177577987
data:  0.025837018109496703
data:  0.08131196694241474


env 초기화 완료, 4321번째 에피소드 시작
itmes ['I', 'L', 'M', 'N', 'O', 'P']
Agent's local target = ['I', 'L', 'M', 'N', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4322번째 에피소드 시작
itmes ['D', 'G', 'I', 'L', 'P']
Agent's local target = ['D', 'G', 'I', 



env 초기화 완료, 4354번째 에피소드 시작
itmes ['A', 'D', 'K', 'P']
Agent's local target = ['A', 'D', 'K', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4355번째 에피소드 시작
itmes ['C', 'D', 'G', 'I', 'M', 'N', 'Q']
Agent's local target = ['C', 'D', 'G', 'I', 'M', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4356번째 에피소드 시작
itmes ['C', 'F', 'I', 'J', 'O', 'P', 'Q']
Agent's local target = ['C', 'F', 'I', 'J', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4357번째 에피소드 시작
itmes ['B', 'E', 'J', 'K', 'L', 'N', 'O']
Agent's local target = ['B', 'E', 'J', 'K', 'L', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4358번째 에피소드 시작
itmes ['A', 'D', 'F', 'G', 'I', 'M', 'N']
Agent's local target = ['A', 'D', 'F', 'G', 'I', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4359번째 에피소드 시작
itmes ['B', 'D', 'F', 'I', 'O']
Agent's local target = ['B', 'D', 'F', 'I', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4360번째 에피소드 시작
i



env 초기화 완료, 4390번째 에피소드 시작
itmes ['B', 'F', 'K', 'P']
Agent's local target = ['B', 'F', 'K', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4391번째 에피소드 시작
itmes ['D', 'G', 'J', 'M', 'O']
Agent's local target = ['D', 'G', 'J', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4392번째 에피소드 시작
itmes ['A', 'C', 'D', 'I', 'J', 'K', 'M']
Agent's local target = ['A', 'C', 'D', 'I', 'J', 'K', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4393번째 에피소드 시작
itmes ['C', 'I', 'N']
Agent's local target = ['C', 'I', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4394번째 에피소드 시작
itmes ['A', 'F', 'J', 'M', 'O']
Agent's local target = ['A', 'F', 'J', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.010029934994048466
data:  0.08278866359341307


env 초기화 완료, 4395번째 에피소드 시작
itmes ['B', 'F', 'G', 'L', 'P']
Agent's local target = ['B', 'F', 'G', 'L', 'P']


action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.008411695234259432
data:  0.02791071018654704
data:  0.08341241491050606
data:  0.027927919115528384
data:  0.0834

[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1), (7, 1, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (6, 1, 0.1), (7, 1, 0.1), (7, 0, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1



env 초기화 완료, 4491번째 에피소드 시작
itmes ['E', 'G', 'J', 'M', 'O', 'Q']
Agent's local target = ['E', 'G', 'J', 'M', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (8, 2, 0.1), (7, 2, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.007378992435686242
data:  0.008560011979329532
data:  0.007388254536442674
data:  0.01988824983447467
data:  0.03254393262299162
data:  0.08498321911748277


env 초기화 완료, 4492번째 에피소드 시작
itmes ['C', 'E', 'I', 'N', 'P', 'Q']
Agent's local target = ['C', 'E', 'I', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 

data:  0.08586509436082787


env 초기화 완료, 4525번째 에피소드 시작
itmes ['C', 'L', 'Q']
Agent's local target = ['C', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4526번째 에피소드 시작
itmes ['B', 'F', 'J', 'L', 'M', 'O', 'Q']
Agent's local target = ['B', 'F', 'J', 'L', 'M', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4527번째 에피소드 시작
itmes ['B', 'C', 'F', 'H', 'L', 'O', 'P']
Agent's local target = ['B', 'C', 'F', 'H', 'L', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4528번째 에피소드 시작
itmes ['A', 'B', 'D', 'K', 'L']
Agent's local target = ['A', 'B', 'D', 'K', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.033187590916647705
data:  0.020400241729456276
data:  0.02911552372981479
data:  0.0859865078513918






env 초기화 완료, 4559번째 에피소드 시작
itmes ['K', 'M', 'N', 'P', 'Q']
Agent's local target = ['K', 'M', 'N', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4560번째 에피소드 시작
itmes ['A', 'G', 'I', 'Q']
Agent's local target = ['A', 'G', 'I', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4561번째 에피소드 시작
itmes ['F', 'H', 'I', 'N']
Agent's local target = ['F', 'H', 'I', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.010414695691407738
data:  0.08667024409624266
data:  0.010423654221838597
data:  0.08668157707183304


env 초기화 완료, 4562번째 에피소드 시작
itmes ['C', 'D', 'H', 'K', 'L', 'O']
Agent's local target = ['C', 'D', 'H', 'K', 'L', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4563번째 에피소드 시작
itmes ['L', 'N', 'O', 'P', 'Q



env 초기화 완료, 4594번째 에피소드 시작
itmes ['A', 'K', 'L', 'M', 'Q']
Agent's local target = ['A', 'K', 'L', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4595번째 에피소드 시작
itmes ['F', 'K', 'M', 'N']
Agent's local target = ['F', 'K', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4596번째 에피소드 시작
itmes ['F', 'I', 'M', 'N', 'O', 'Q']
Agent's local target = ['F', 'I', 'M', 'N', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.010461566595230773
data:  0.08697215809596101


env 초기화 완료, 4597번째 에피소드 시작
itmes ['C', 'H', 'I', 'M', 'N', 'Q']
Agent's local target = ['C', 'H', 'I', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.01047052043857125
data:  0.08698346088015141


env 초기화 완료, 4598번째 에피소드 시작
itmes ['C', 'I', 'J', 'M']
Agent's local target = ['C', 'I', '



env 초기화 완료, 4631번째 에피소드 시작
itmes ['A', 'B', 'E', 'L']
Agent's local target = ['A', 'B', 'E', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4632번째 에피소드 시작
itmes ['B', 'D', 'G']
Agent's local target = ['B', 'D', 'G']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4633번째 에피소드 시작
itmes ['B', 'D', 'G', 'M']
Agent's local target = ['B', 'D', 'G', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4634번째 에피소드 시작
itmes ['C', 'K', 'Q']
Agent's local target = ['C', 'K', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4635번째 에피소드 시작
itmes ['G', 'H', 'K', 'L', 'P', 'Q']
Agent's local target = ['G', 'H', 'K', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4636번째 에피소드 시작
itmes ['D', 'F', 'I', 'Q']
Agent's local target = ['D', 'F', 'I', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4637번째 에피소드 시작
itmes ['A', 'D', 'F', 'G', 'J', 'M', 'N']
Agent's local target = ['A', 'D', 'F', 'G', 'J', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
d

이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1)]
action : 1
이동
[(8, 4, 0.



env 초기화 완료, 4698번째 에피소드 시작
itmes ['G', 'J', 'K', 'P']
Agent's local target = ['G', 'J', 'K', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.01064210495997912
data:  0.08829074530235802
data:  0.010651040749483122
data:  0.08830191622782778


env 초기화 완료, 4699번째 에피소드 시작
itmes ['F', 'G', 'I', 'L', 'N', 'O', 'P']
Agent's local target = ['F', 'G', 'I', 'L', 'N', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4700번째 에피소드 시작
itmes ['C', 'I', 'J', 'M', 'O', 'P']
Agent's local target = ['C', 'I', 'J', 'M', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.010679975645408174
data:  0.088333086036205


env 초기화 완료, 4701번째 에피소드 시작
it



env 초기화 완료, 4734번째 에피소드 시작
itmes ['D', 'E', 'I', 'M', 'Q']
Agent's local target = ['D', 'E', 'I', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4735번째 에피소드 시작
itmes ['H', 'J', 'K', 'N', 'O', 'Q']
Agent's local target = ['H', 'J', 'K', 'N', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 3



env 초기화 완료, 4766번째 에피소드 시작
itmes ['C', 'D', 'E', 'F', 'H', 'I', 'Q']
Agent's local target = ['C', 'D', 'E', 'F', 'H', 'I', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (4, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (4, 3, 0.1), (5, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (4, 3, 0.1), (5, 3, 0.1), (6, 3, 0.1)]
actio



env 초기화 완료, 4802번째 에피소드 시작
itmes ['A', 'C', 'D', 'F', 'I', 'N', 'P']
Agent's local target = ['A', 'C', 'D', 'F', 'I', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4803번째 에피소드 시작
itmes ['A', 'M', 'O']
Agent's local target = ['A', 'M', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4804번째 에피소드 시작
itmes ['B', 'E', 'F', 'I', 'J', 'Q']
Agent's local target = ['B', 'E', 'F', 'I', 'J', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4805번째 에피소드 시작
itmes ['C', 'D', 'E', 'F', 'G', 'K', 'L']
Agent's local target = ['C', 'D', 'E', 'F', 'G', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4806번째 에피소드 시작
itmes ['B', 'C', 'D', 'E', 'I', 'K', 'M']
Agent's local target = ['B', 'C', 'D', 'E', 'I', 'K', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.

data:  0.022644179499839403
data:  0.02843433253001288
data:  0.00877082528204356
data:  0.02848148909675988
data:  0.08977922030563365
data:  0.035054821344056845
data:  0.08985024238360309


env 초기화 완료, 4838번째 에피소드 시작
itmes ['H', 'I', 'K', 'M', 'O']
Agent's local target = ['H', 'I', 'K', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4839번째 에피소드 시작
itmes ['A', 'B', 'G', 'I', 'J', 'P', 'Q']
Agent's local target = ['A', 'B', 'G', 'I', 'J', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4840번째 에피소드 시작
itmes ['B', 'C', 'E', 'J', 'O', 'P']
Agent's local target = ['B', 'C', 'E', 'J', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4841번째 에피소드 시작
itmes ['C', 'D', 'F', 'H', 'J', 'M', 'O']
Agent's local target = ['C', 'D', 'F', 'H', 'J', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4842번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'J', 'N', 'P']
Agent's local target = ['A', 'B', 'E', 'H', 'J', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]




env 초기화 완료, 4872번째 에피소드 시작
itmes ['A', 'B', 'E', 'L', 'O']
Agent's local target = ['A', 'B', 'E', 'L', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4873번째 에피소드 시작
itmes ['A', 'H', 'J', 'K', 'Q']
Agent's local target = ['A', 'H', 'J', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4874번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'N', 'O', 'Q']
Agent's local target = ['A', 'B', 'E', 'G', 'N', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4875번째 에피소드 시작
itmes ['B', 'E', 'K', 'M', 'P']
Agent's local target = ['B', 'E', 'K', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4876번째 에피소드 시작
itmes ['G', 'K', 'M']
Agent's local target = ['G', 'K', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0



env 초기화 완료, 4908번째 에피소드 시작
itmes ['A', 'C', 'M', 'P']
Agent's local target = ['A', 'C', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4909번째 에피소드 시작
itmes ['D', 'F', 'G', 'J', 'N', 'Q']
Agent's local target = ['D', 'F', 'G', 'J', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4910번째 에피소드 시작
itmes ['D', 'I', 'P']
Agent's local target = ['D', 'I', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0029469164889472893
data:  0.021661290709085682
data:  0.030640903755266426
data:  0.09106985625668859


env 초기화 완료, 4911번째 에피소드 시작
itmes ['A', 'C', 'F', 'H', 'N', 'O']
Agent's local target = ['A', 'C', 'F', 'H', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4912번째 에피소드 시작
itmes ['A', 'C', 'G', 'L', 



env 초기화 완료, 4943번째 에피소드 시작
itmes ['E', 'G', 'J', 'Q']
Agent's local target = ['E', 'G', 'J', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4944번째 에피소드 시작
itmes ['A', 'D', 'F', 'J', 'K', 'L', 'N']
Agent's local target = ['A', 'D', 'F', 'J', 'K', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4945번째 에피소드 시작
itmes ['D', 'F', 'H', 'L', 'N', 'Q']
Agent's local target = ['D', 'F', 'H', 'L', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4946번째 에피소드 시작
itmes ['D', 'H', 'I', 'P']
Agent's local target = ['D', 'H', 'I', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), 



env 초기화 완료, 4979번째 에피소드 시작
itmes ['A', 'I', 'K', 'L', 'N', 'O', 'P']
Agent's local target = ['A', 'I', 'K', 'L', 'N', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4980번째 에피소드 시작
itmes ['E', 'H', 'J', 'K', 'L', 'N', 'O']
Agent's local target = ['E', 'H', 'J', 'K', 'L', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 4981번째 에피소드 시작
itmes ['B', 'C', 'D', 'F', 'J', 'O']
Agent's local target = ['B', 'C', 'D', 'F', 'J', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4982번째 에피소드 시작
itmes ['B', 'F', 'J', 'M']
Agent's local target = ['B', 'F', 'J', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 4983번째 에피소드 시작
itmes ['B', 'D', 'H', 'I', 'K', 'M', 'O']
Agent's local target = ['B', 'D', 'H', 'I', 'K', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 4984번째 에피소드 시작
itmes ['A', 'G', 'Q']
Agent's local target = ['A', 'G', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8

부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5015번째 에피소드 시작
itmes ['B', 'I', 'J', 'M']
Agent's local target = ['B', 'I', 'J', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5016번째 에피소드 시작
itmes ['H', 'L', 'O', 'P', 'Q']
Agent's local target = ['H', 'L', 'O', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5017번째 에피소드 시작
itmes ['C', 'D', 'I']
Agent's local target = ['C', 'D', 'I']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5018번째 에피소드 시작
itmes ['D', 'H', 'I', 'K', 'L', 'N']
Agent's local target = ['D', 'H', 'I', 'K', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (



env 초기화 완료, 5047번째 에피소드 시작
itmes ['G', 'H', 'M', 'N', 'O']
Agent's local target = ['G', 'H', 'M', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.02943031286150288
data:  0.09317026990614596


env 초기화 완료, 5048번째 에피소드 시작
itmes ['D', 'H', 'L', 'M', 'O']
Agent's local target = ['D', 'H', 'L', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5049번째 에피소드 시작
itmes ['B', 'D', 'F']
Agent's local target = ['B', 'D', 'F']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5050번째 에피소드 시작
itmes ['B', 'D', 'F', 'G', 'K', 'L', 'Q']
Agent's local target = ['B', 'D', 'F', 'G', 'K', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5051번째 에피소드 시작
itmes ['F', 'G', 'H', 'I', 'K']
Agent's local target = ['F', 'G', 'H', 'I', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5052번째 에피소드 시작
itmes ['A', 'D', 'H', 'I', 'L', 'M', 'Q']
Agent's local target = ['A', '



env 초기화 완료, 5081번째 에피소드 시작
itmes ['B', 'D', 'E', 'F', 'N', 'O', 'Q']
Agent's local target = ['B', 'D', 'E', 'F', 'N', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5082번째 에피소드 시작
itmes ['F', 'G', 'J', 'L', 'M', 'Q']
Agent's local target = ['F', 'G', 'J', 'L', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5083번째 에피소드 시작
itmes ['A', 'C', 'E', 'F', 'H', 'P', 'Q']
Agent's local target = ['A', 'C', 'E', 'F', 'H', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5084번째 에피소드 시작
itmes ['C', 'D', 'N', 'Q']
Agent's local target = ['C', 'D', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5085번째 에피소드 시작
itmes ['F', 'H', 'O']
Agent's local target = ['F', 'H', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5086번째 에피소드 시작
itmes ['C', 'H', 'N', 'O', 'Q']
Agent's local target = ['C', 'H', 'N', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5087번째 에피소드 시작
itmes ['C', 'D', 'F', 'G', 'K', 'L', 'M']
Agent's l

data:  0.09380728656592625
data:  0.036840456970634115
data:  0.09381790583726966


env 초기화 완료, 5119번째 에피소드 시작
itmes ['G', 'I', 'J', 'N', 'O']
Agent's local target = ['G', 'I', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5120번째 에피소드 시작
itmes ['D', 'H', 'J']
Agent's local target = ['D', 'H', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5121번째 에피소드 시작
itmes ['B', 'E', 'L', 'Q']
Agent's local target = ['B', 'E', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5122번째 에피소드 시작
itmes ['D', 'F', 'G', 'H', 'K', 'L']
Agent's local target = ['D', 'F', 'G', 'H', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5123번째 에피소드 시작
itmes ['D', 'E', 'I', 'J', 'P']
Agent's local target = ['D', 'E', 'I', 'J', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5124번째 에피소드 시작
itmes ['B', 'F', 'H', 'K', 'L', 'N', 'Q']
Agent's local target = ['B', 'F', 'H', 'K', 'L', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5125



env 초기화 완료, 5186번째 에피소드 시작
itmes ['A', 'G', 'J', 'N', 'P']
Agent's local target = ['A', 'G', 'J', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5187번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'F', 'H', 'Q']
Agent's local target = ['A', 'B', 'C', 'D', 'F', 'H', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5188번째 에피소드 시작
itmes ['A', 'E', 'L', 'Q']
Agent's local target = ['A', 'E', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5189번째 에피소드 시작
itmes ['A', 'J', 'L', 'M', 'Q']
Agent's local target = ['A', 'J', 'L', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5190번째 에피소드 시작
itmes ['D', 'G', 'H', 'I', 'M', 'O']
Agent's local target = ['D', 'G', 'H', 'I', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5191번째 에피소드 시작
itmes ['B', 'C', 'I', 'J', 'L', 'M']
Agent's local target = ['B', 'C', 'I', 'J', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5192번째 에피소드 시작
itmes ['A', 'D', 'F', 'H', 'M', 'N', 'P']



env 초기화 완료, 5220번째 에피소드 시작
itmes ['C', 'G', 'J', 'K', 'P', 'Q']
Agent's local target = ['C', 'G', 'J', 'K', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.003767231596931191
data:  0.02425974325580139
data:  0.037687167616148
data:  0.02427731728147581
data:  0.029931672558374537
data:  0.0243



env 초기화 완료, 5255번째 에피소드 시작
itmes ['D', 'G', 'H', 'L', 'M']
Agent's local target = ['D', 'G', 'H', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5256번째 에피소드 시작
itmes ['E', 'F', 'H', 'I', 'K', 'N', 'O']
Agent's local target = ['E', 'F', 'H', 'I', 'K', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5257번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'I', 'P', 'Q']
Agent's local target = ['A', 'B', 'E', 'H', 'I', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5258번째 에피소드 시작
itmes ['B', 'E', 'F', 'K', 'Q']
Agent's local target = ['B', 'E', 'F', 'K', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5259번째 에피소드 시작
itmes ['C', 'H', 'K', 'M', 'N', 'O']
Agent's local target = ['C', 'H', 'K', 'M', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5260번째 에피소드 시작
itmes ['C', 'G', 'H', 'I', 'K', 'O']
Agent's local target = ['C', 'G', 'H', 'I', 'K', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5261번째 에피소드 시작
itmes ['G',



env 초기화 완료, 5332번째 에피소드 시작
itmes ['A', 'E', 'I', 'J', 'K', 'P']
Agent's local target = ['A', 'E', 'I', 'J', 'K', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5333번째 에피소드 시작
itmes ['A', 'B', 'H', 'L', 'M', 'N']
Agent's local target = ['A', 'B', 'H', 'L', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5334번째 에피소드 시작
itmes ['G', 'K', 'L', 'M', 'O', 'Q']
Agent's local target = ['G', 'K', 'L', 'M', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5335번째 에피소드 시작
itmes ['A', 'F', 'G', 'N', 'Q']
Agent's local target = ['A', 'F', 'G', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5336번째 에피소드 시작
itmes ['C', 'G', 'K', 'N', 'Q']
Agent's local target = ['C', 'G', 'K', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5337번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'K', 'N', 'O']
Agent's local target = ['A', 'B', 'C', 'H', 'K', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5338번째 에피소드 시작
itmes ['A', 'K', 'L',



env 초기화 완료, 5367번째 에피소드 시작
itmes ['C', 'F', 'H', 'I']
Agent's local target = ['C', 'F', 'H', 'I']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5368번째 에피소드 시작
itmes ['A', 'F', 'G', 'J', 'K', 'L']
Agent's local target = ['A', 'F', 'G', 'J', 'K', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5369번째 에피소드 시작
itmes ['C', 'E', 'G', 'H', 'J', 'N', 'P']
Agent's local target = ['C', 'E', 'G', 'H', 'J', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5370번째 에피소드 시작
itmes ['C', 'D', 'F', 'L', 'N', 'O']
Agent's local target = ['C', 'D', 'F', 'L', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5371번째 에피소드 시작
itmes ['C', 'J', 'K', 'Q']
Agent's local target = ['C', 'J', 'K', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5372번째 에피소드 시작
itmes ['F', 'H', 'K', 'L', 'M', 'O', 'P']
Agent's local target = ['F', 'H', 'K', 'L', 'M', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8

나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5401번째 에피소드 시작
itmes ['B', 'E', 'G', 'I', 'K', 'M']
Agent's local target = ['B', 'E', 'G', 'I', 'K', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5402번째 에피소드 시작
itmes ['B', 'D', 'G', 'J', 'K', 'O']
Agent's local target = ['B', 'D', 'G', 'J', 'K', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.0032326445436697284
data:  0.023111964888308044
data:  0.03873719118397118
data:  0.09782759649040099


env 초기화 완료, 5403번째 에피소드 시작
itmes ['A', 'E', 'H', 'J', 'M', 'O', 'Q']
Agent's local target = ['A', 'E', 'H', 'J', 'M', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 



env 초기화 완료, 5437번째 에피소드 시작
itmes ['A', 'I', 'J', 'N']
Agent's local target = ['A', 'I', 'J', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5438번째 에피소드 시작
itmes ['A', 'D', 'E', 'J', 'O', 'P']
Agent's local target = ['A', 'D', 'E', 'J', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5439번째 에피소드 시작
itmes ['D', 'N', 'P', 'Q']
Agent's local target = ['D', 'N', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5440번째 에피소드 시작
itmes ['C', 'I', 'L', 'M']
Agent's local target = ['C', 'I', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5441번째 에피소드 시작
itmes ['H', 'I', 'J', 'O']
Agent's local target = ['H', 'I', 'J', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5442번째 에피소드 시작
itmes ['A', 'B', 'D', 'H', 'I', 'P']
Agent's local target = ['A', 'B', 'D', 'H', 'I', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5443번째 에피소드 시작
itmes ['B', 'E', 'H', 'O', 'P']
Agent's local target = ['B', 'E', 'H', 'O', 'P']
action : 0



env 초기화 완료, 5503번째 에피소드 시작
itmes ['B', 'C', 'F', 'O']
Agent's local target = ['B', 'C', 'F', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5504번째 에피소드 시작
itmes ['D', 'E', 'F', 'G', 'J', 'K', 'O']
Agent's local target = ['D', 'E', 'F', 'G', 'J', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5505번째 에피소드 시작
itmes ['I', 'J', 'L', 'M', 'N']
Agent's local target = ['I', 'J', 'L', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.008585972607306506
data:  0.010051897127056288
data:  0.03139154419776627
data:  0.09870305405262182


env 초기화 완료, 5506번째 에피소드 시작
itmes ['A', 'B', 'D', 'M']
Agent's local target = ['A', 'B', 'D', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5507번째 에피소드 시작
itmes ['A', 'D', 'E

이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.012134327722585006
data:  0.09899401526110559


env 초기화 완료, 5541번째 에피소드 시작
itmes ['G', 'I', 'M', 'Q']
Agent's local target = ['G', 'I', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5542번째 에피소드 시작
itmes ['B', 'C', 'F', 'G', 'M', 'P']
Agent's local target = ['B', 'C', 'F', 'G', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5543번째 에피소드 시작
itmes ['A', 'B', 'C', 'F', 'H', 'O', 'Q']
Agent's local target = ['A', 'B', 'C', 'F', 'H', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5544번째 에피소드 시작
itmes ['B', 'D', 'I', 'J', 'O', 'Q']
Agent's local target = ['B', 'D', 'I', 'J', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5545번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'H', 'L', 'N']
Agent's local target = ['A', 'B', 'C', 'D', 'H', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5546번째 



env 초기화 완료, 5575번째 에피소드 시작
itmes ['A', 'C', 'F', 'G', 'Q']
Agent's local target = ['A', 'C', 'F', 'G', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.010207853972379067
data:  0.03165264798635103
data:  0.09959483091673355


env 초기화 완료, 5576번째 에피소드 시작
itmes ['B', 'D', 'J', 'N', 'O', 'P', 'Q']
Agent's local target = ['B', 'D', 'J', 'N', 'O', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.03950911271548359
data:  0.023666958341685335
data:  0.03951516180421204
data:  0.09961487143364187


env 초기화 완료, 5577번째 에피소드 시작
itmes ['E', 'G', 'I', 'J', 'K', 'L', 'P']
Agent's local 



env 초기화 완료, 5647번째 에피소드 시작
itmes ['B', 'F', 'I', 'M', 'Q']
Agent's local target = ['B', 'F', 'I', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5648번째 에피소드 시작
itmes ['D', 'G', 'M', 'N', 'O']
Agent's local target = ['D', 'G', 'M', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5649번째 에피소드 시작
itmes ['D', 'F', 'G', 'I', 'K', 'N', 'O']
Agent's local target = ['D', 'F', 'G', 'I', 'K', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5650번째 에피소드 시작
itmes ['C', 'H', 'N', 'P']
Agent's local target = ['C', 'H', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5651번째 에피소드 시작
itmes ['A', 'B', 'C', 'L', 'M']
Agent's local target = ['A', 'B', 'C', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5652번째 에피소드 시작
itmes ['C', 'D', 'G', 'H', 'I', 'K', 'N']
Agent's local target = ['C', 'D', 'G', 'H', 'I', 'K', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5653번째 에피소드 시작
itmes ['A', 'F', 'G', 'L', 'O', 'P', 'Q']

itmes ['D', 'I', 'K', 'O', 'P', 'Q']
Agent's local target = ['D', 'I', 'K', 'O', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.012322151865851932
data:  0.1008845353613414


env 초기화 완료, 5682번째 에피소드 시작
itmes ['E', 'F', 'H', 'L']
Agent's local target = ['E', 'F', 'H', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5683번째 에피소드 시작
itmes ['C', 'D', 'M', 'N', 'P']
Agent's local target = ['C', 'D', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 5, 0.1), (8, 5, 0.1), (9, 5, 0.1)]


action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.032381553920769426
data:  0.025839564080988708
data:  0.03238831576537735
data:  0.10259097661048885
data:  0.013072047628669098
data:  0.10262071751282781


env 초기화 완료, 5715번째 에피소드 시작
itmes ['A', 'B', 'H', 'L', 'Q']
Agent's local target = ['A', 'B', 'H', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5716번째 에피소드 시작
itmes ['B', 'C', 'I', 'J', 'M', 'N', 'O']
Agent's local target = ['B', 'C', 'I', 'J', 'M', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5717번째 에피소드 시작
itmes

action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.0325520918495022
data:  0.026129205806626782
data:  0.04066912746402414
data:  0.024468464898245203
data:  0.03448341539577766
data:  0.010360366313847447
data:  0.03452996705423808
data:  0.02450601805175538
data:  0.04069506055127774
data:  0.1034152905955342


env 초기화 완료, 5747번째 에피소드 시작
itmes ['B', 'I', 'J', 'L', 'N']
Agent's local target = ['B', 'I', 'J', 'L', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료,

action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5783번째 에피소드 시작
itmes ['C', 'E', 'F', 'H', 'I', 'M', 'Q']
Agent's local target = ['C', 'E', 'F', 'H', 'I', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5784번째 에피소드 시작
itmes ['A', 'D', 'I', 'K', 'M', 'N']
Agent's local target = ['A', 'D', 'I', 'K', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (5, 5, 0.1), (5, 4, 0.1)]
data:  0.0
data:  0.0008884086409086761
data:  0.003874568329899765
data:  0.026281361828934837
data:  0.032735779061261065
data:  0.10380133571841081


env 초기화 완료, 5785번째 에피소드 시작
itmes ['C', 'G', 'I', 'J', 'M', 'P', 'Q']
Agent's local target = ['C', 'G', 'I', 'J', 'M', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.



env 초기화 완료, 5857번째 에피소드 시작
itmes ['E', 'I', 'K', 'M', 'N']
Agent's local target = ['E', 'I', 'K', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1), (5, 8, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1), (5, 8, 0.1), (6, 8, 0.1)]
action : 3
나감
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1), (5, 8, 0.1), (6, 8, 0.1), (6, 9, 0.1)]
data:  0.0013682923430529



env 초기화 완료, 5892번째 에피소드 시작
itmes ['D', 'E', 'F', 'L', 'M', 'N']
Agent's local target = ['D', 'E', 'F', 'L', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.01325360772157386
data:  0.10461058022176652
data:  0.03500827697203316
data:  0.010535145171123307
data:  0.035034776144335956
data:  0.10462011916374434


env 초기화 완료, 5893번째 에피소드 시작
itmes ['B', 'C', 'D', 'G', 'H', 'L', 'M']
Agent's local target = ['B', 'C', 'D', 'G', 'H', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5894번째 에피소드 시작
itmes ['C', 'E', 'G', 'I', 'L', 'M']



env 초기화 완료, 5921번째 에피소드 시작
itmes ['D', 'I', 'K', 'P']
Agent's local target = ['D', 'I', 'K', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5922번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'I', 'J']
Agent's local target = ['A', 'B', 'E', 'H', 'I', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5923번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'L', 'M', 'O']
Agent's local target = ['A', 'B', 'C', 'D', 'L', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5924번째 에피소드 시작
itmes ['C', 'E', 'F', 'I', 'K', 'N']
Agent's local target = ['C', 'E', 'F', 'I', 'K', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5925번째 에피소드 시작
itmes ['H', 'I', 'J', 'K']
Agent's local target = ['H', 'I', 'J', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5926번째 에피소드 시작
itmes ['B', 'C', 'D', 'G', 'J', 'L', 'P']
Agent's local target = ['B', 'C', 'D', 'G', 'J', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5927번째 에피소드 시작
itmes ['A', 'F', 'H', 'L', 'M',



env 초기화 완료, 5953번째 에피소드 시작
itmes ['A', 'B', 'D', 'I', 'M', 'N', 'Q']
Agent's local target = ['A', 'B', 'D', 'I', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.03395915251541427
data:  0.10613080519735058
data:  0.013547510213055086
data:  0.10614019211683084


env 초기화 완료, 5954번째 에피소드 시작
itmes ['B', 'C', 'F', 'H', 'I', 'Q']
Agent's local target = ['B', 'C', 'F', 'H', 'I', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5955번째 에피소드 시작
itmes ['B', 'E', 'L', 'P']
Agent's local target = ['B', 'E', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5956번째 에피소드 시작
itmes ['A', 'F', 'H', 'I', 'O', 'Q']
Agent's local target = ['A', 'F', 'H', 'I', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 5957번



env 초기화 완료, 5986번째 에피소드 시작
itmes ['C', 'D', 'E', 'F', 'N']
Agent's local target = ['C', 'D', 'E', 'F', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 5987번째 에피소드 시작
itmes ['D', 'H', 'J', 'L', 'N', 'O']
Agent's local target = ['D', 'H', 'J', 'L', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.010965623453399184
data:  0.009370815388176643
data:  0.010974526891053844
data:  0.03412215633643218
data:  0.10656265299585264


env 초기화 완료, 5988번째 에피소드 시작
itmes ['C', 'D', 'G', 'J', 'M', 'N', 'O']
Agent's local target = ['C', 'D', 'G', 'J', 'M', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 5989번째 에피소드 시작
itmes ['A', 'C', '



env 초기화 완료, 6017번째 에피소드 시작
itmes ['G', 'H', 'J', 'K', 'L', 'Q']
Agent's local target = ['G', 'H', 'J', 'K', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6018번째 에피소드 시작
itmes ['A', 'B', 'D', 'F', 'I', 'P']
Agent's local target = ['A', 'B', 'D', 'F', 'I', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6019번째 에피소드 시작
itmes ['E', 'F', 'J', 'K', 'L', 'N', 'O']
Agent's local target = ['E', 'F', 'J', 'K', 'L', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (



env 초기화 완료, 6051번째 에피소드 시작
itmes ['G', 'H', 'K', 'L', 'M']
Agent's local target = ['G', 'H', 'K', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.01388247643341035
data:  0.10760643327557612


env 초기화 완료, 6052번째 에피소드 시작
itmes ['A', 'E', 'G', 'J', 'L', 'N', 'O']
Agent's local target = ['A', 'E', 'G', 'J', 'L', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6053번째 에피소드 시작
itmes ['A', 'D', 'H', 'I', 'J', 'K']
Agent's local target = ['A', 'D', 'H', 'I', 'J', 'K']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6054번째 에피소드 시작
itmes ['A', 'J', 'L', 'Q']
Agent's local target = ['A', 'J', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6055번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'K', 'L', 'O']
Agent's local target = ['A', 'B', 'E', 'H', 'K', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6056번째 에피소드 시작
itmes ['D', 'G', 'I', 'L', 'M']




env 초기화 완료, 6082번째 에피소드 시작
itmes ['B', 'D', 'I', 'J', 'K', 'L', 'M']
Agent's local target = ['B', 'D', 'I', 'J', 'K', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.04244498565044484
data:  0.025953173782795463
data:  0.036310365125874954
data:  0.1085859730247255
data:  0.034787118023812846
data:  0.10861511442742303


env 초기화 완료, 6083번째 에피소드 시작
itmes ['B', 'D', 'E', 'I', 'K', 'N', 'Q']
Agent's local target = ['B', 'D', 'E', 'I', 'K', 'N', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6084번째 에피소드 시작
itmes ['A', 'D', 'E', 'I',



env 초기화 완료, 6118번째 에피소드 시작
itmes ['B', 'C', 'D', 'H', 'L', 'P', 'Q']
Agent's local target = ['B', 'C', 'D', 'H', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6119번째 에피소드 시작
itmes ['F', 'H', 'J', 'M', 'N', 'Q']
Agent's local target = ['F', 'H', 'J', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.01400551458550238
data:  0.10890812076802821


env 초기화 완료, 6120번째 에피소드 시작
itmes ['B', 'C', 'J', 'L']
Agent's local target = ['B', 'C', 'J', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6121번째 에피소드 시작
itmes ['A', 'B', 'D', 'L', 'M', 'O', 'Q']
Agent's local target = ['A', 'B', 'D', 'L', 'M', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6122번째 에피소드 시작
itmes ['A', 'C', 'D', 'I', 'L', 'N', 'P']
Agent's local target = ['A', 'C', 'D', 'I', 'L', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6123번째 에피소드 시작
itmes ['A', 

나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6156번째 에피소드 시작
itmes ['B', 'C', 'L', 'M']
Agent's local target = ['B', 'C', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6157번째 에피소드 시작
itmes ['B', 'D', 'F', 'I', 'L', 'M', 'Q']
Agent's local target = ['B', 'D', 'F', 'I', 'L', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.03537156500206419
data:  0.011292286997642741
data:  0.035378027845563986
data:  0.10973226341510108


env 초기화 완료, 6158번째 에피소드 시작
itmes ['A', 'D', 'I', 'N', 'O', 'P', 'Q']
Agent's local target = ['A', 'D', 'I', 'N', 'O', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6159번째 에피소드 시작
itmes ['C', 'D', 'H', 'J', 'L', 'N', 'O']
Agent's local target = ['C', 'D', 'H', 'J', 'L', 'N', 'O']
action : 



env 초기화 완료, 6192번째 에피소드 시작
itmes ['B', 'D', 'E', 'F', 'G', 'J', 'M']
Agent's local target = ['B', 'D', 'E', 'F', 'G', 'J', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6193번째 에피소드 시작
itmes ['D', 'E', 'I', 'J', 'K', 'L']
Agent's local target = ['D', 'E', 'I', 'J', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6194번째 에피소드 시작
itmes ['A', 'D', 'F', 'I', 'K', 'P']
Agent's local target = ['A', 'D', 'F', 'I', 'K', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 6, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.009543262370568321
data:  0.011311157768942978
data:  0.0354



env 초기화 완료, 6226번째 에피소드 시작
itmes ['B', 'E', 'H', 'J', 'K', 'P', 'Q']
Agent's local target = ['B', 'E', 'H', 'J', 'K', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6227번째 에피소드 시작
itmes ['A', 'C', 'E', 'L', 'M', 'Q']
Agent's local target = ['A', 'C', 'E', 'L', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6228번째 에피소드 시작
itmes ['D', 'F', 'G', 'I', 'K', 'L', 'P']
Agent's local target = ['D', 'F', 'G', 'I', 'K', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6229번째 에피소드 시작
itmes ['A', 'C', 'D', 'E', 'F', 'H']
Agent's local target = ['A', 'C', 'D', 'E', 'F', 'H']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6230번째 에피소드 시작
itmes ['B', 'D', 'E', 'L']
Agent's local target = ['B', 'D', 'E', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.



env 초기화 완료, 6263번째 에피소드 시작
itmes ['A', 'D', 'G', 'I', 'J', 'K', 'P']
Agent's local target = ['A', 'D', 'G', 'I', 'J', 'K', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6264번째 에피소드 시작
itmes ['A', 'D', 'K', 'N']
Agent's local target = ['A', 'D', 'K', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6265번째 에피소드 시작
itmes ['E', 'G', 'H', 'K', 'N', 'P', 'Q']
Agent's local target = ['E', 'G', 'H', 'K', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6266번째 에피소드 시작
itmes ['B', 'C', 'E', 'J', 'K', 'L', 'N']
Agent's local target = ['B', 'C', 'E', 'J', 'K', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.014308531265347655
data:  0.11110292081055632


env 초기화 완료, 6267번째 에피소드 시작
itmes ['A', 'C', 'D', 'F', 'M', 'N', 'P']
Agent's local target = ['A', 'C', 'D', 'F', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
a

action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.0373684700107522
data:  0.11186694599698914


env 초기화 완료, 6298번째 에피소드 시작
itmes ['B', 'K', 'M', 'N', 'O']
Agent's local target = ['B', 'K', 'M', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6299번째 에피소드 시작
itmes ['A', 'C', 'F', 'M', 'O', 'Q']
Agent's local target = ['A', 'C', 'F', 'M', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.014325668702179897
data:  0.11187575930238944


env 초기화 완료, 6300번째 에피소드 시작
itmes ['A', 'C', 'I', 'K', 'O']
Agent's local target = ['A', 'C', 'I', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6301번째 에피소드 시작
itmes ['E', 'G', 'H', 'O', 'Q']
Agent's local target = ['E', 'G', 'H', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 



env 초기화 완료, 6332번째 에피소드 시작
itmes ['B', 'E', 'M', 'P']
Agent's local target = ['B', 'E', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6333번째 에피소드 시작
itmes ['D', 'F', 'H', 'J', 'K', 'M', 'Q']
Agent's local target = ['D', 'F', 'H', 'J', 'K', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.014342802711696148
data:  0.11220137026940673


env 초기화 완료, 6334번째 에피소드 시작
itmes ['D', 'F', 'H', 'L', 'O']
Agent's local target = ['D', 'F', 'H', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6335번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'L', 'M', 'N']
Agent's local target = ['A', 'B', 'E', 'H', 'L', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6336번째 에피소드 시작
itmes ['A', 'B', 'J', 'L', 'M', 'O']
Agent's local target = ['A', 'B', 'J', 'L', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6337번째 에피소드 시작
itmes ['B', 'D', 'F', 'K', 'L',

action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6366번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'L', 'M', 'N']
Agent's local target = ['A', 'B', 'C', 'D', 'L', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6367번째 에피소드 시작
itmes ['B', 'C', 'I', 'J', 'K', 'O']
Agent's local target = ['B', 'C', 'I', 'J', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6368번째 에피소드 시작
itmes ['A', 'E', 'J', 'M', 'O', 'P']
Agent's local target = ['A', 'E', 'J', 'M', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6369번째 에피소드 시작
itmes ['A', 'I', 'J']
Agent's local target = ['A', 'I', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6370번째 에피소드 시작
itmes ['C', 'E', 'I', 'J', 'L', 'P', 'Q']
Agent's local target = ['C', 'E', 'I', 'J', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6371번째 에피소드 시작
itmes ['B', 'C', 'M', 'P']
Agent's local target = ['B', 'C', 'M', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
a



env 초기화 완료, 6401번째 에피소드 시작
itmes ['D', 'E', 'G', 'L', 'M']
Agent's local target = ['D', 'E', 'G', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6402번째 에피소드 시작
itmes ['G', 'J', 'O', 'P']
Agent's local target = ['G', 'J', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6403번째 에피소드 시작
itmes ['B', 'K', 'L', 'M', 'P']
Agent's local target = ['B', 'K', 'L', 'M', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.01442561074667706
data:  0.1132247076397373


env 초기화 완료, 6404번째 에피소드 시작
itmes ['A', 'C', 'E', 'G', 'K']
Agent's local target = ['A', 'C', 'E', 'G', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 

Agent's local target = ['H', 'I', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1), (8, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1), (8, 7, 0.1), (8, 8, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 8, 0.1), (8, 7, 0.1), (8, 8, 0.1), (9, 8, 0.1)]
data:  0.0
data:  0.0007787771782306988
data:  0.0038311734338472556
data:  0.0007886993005128757
data:  0.003850790316503871
data:  0.012060200288494005
data:  0.03784023183580358
data:  0.11383854380125207


env 초기화 완료, 6436번째 에피소드 시작
itmes ['E', 'H', 'I', 'J', 'L', 'P', 'Q']
Agent's local target = ['E', 'H', 'I', 'J', 'L', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
a



env 초기화 완료, 6468번째 에피소드 시작
itmes ['C', 'E', 'I', 'J', 'K', 'N', 'P']
Agent's local target = ['C', 'E', 'I', 'J', 'K', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6469번째 에피소드 시작
itmes ['C', 'D', 'I', 'K', 'M', 'N', 'Q']
Agent's local target = ['C', 'D', 'I', 'K', 'M', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6470번째 에피소드 시작
itmes ['B', 'C', 'L', 'O', 'P']
Agent's local target = ['B', 'C', 'L', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6471번째 에피소드 시작
itmes ['A', 'F', 'G', 'I', 'N']
Agent's local target = ['A', 'F', 'G', 'I', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6472번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'M', 'P', 'Q']
Agent's local target = ['A', 'B', 'E', 'G', 'M', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6473번째 에피소드 시작
itmes ['A', 'E', 'G', 'J', 'L', 'M']
Agent's local target = ['A', 'E', 'G', 'J', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
a



env 초기화 완료, 6503번째 에피소드 시작
itmes ['A', 'B', 'C', 'G', 'O', 'P']
Agent's local target = ['A', 'B', 'C', 'G', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6504번째 에피소드 시작
itmes ['A', 'B', 'F', 'J', 'L', 'N', 'P']
Agent's local target = ['A', 'B', 'F', 'J', 'L', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6505번째 에피소드 시작
itmes ['B', 'F', 'G', 'I', 'P', 'Q']
Agent's local target = ['B', 'F', 'G', 'I', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 2, 0.1), (

action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (5, 7, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (5, 7, 0.1), (6, 7, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (8, 6, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (5, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1)]
actio

data:  0.0


env 초기화 완료, 6610번째 에피소드 시작
itmes ['A', 'D', 'H', 'K', 'L', 'O']
Agent's local target = ['A', 'D', 'H', 'K', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6611번째 에피소드 시작
itmes ['B', 'C', 'D', 'K', 'N', 'O']
Agent's local target = ['B', 'C', 'D', 'K', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6612번째 에피소드 시작
itmes ['F', 'I', 'J', 'O']
Agent's local target = ['F', 'I', 'J', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (6, 8, 



env 초기화 완료, 6644번째 에피소드 시작
itmes ['F', 'K', 'L', 'N', 'P', 'Q']
Agent's local target = ['F', 'K', 'L', 'N', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6645번째 에피소드 시작
itmes ['A', 'D', 'H', 'O']
Agent's local target = ['A', 'D', 'H', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6646번째 에피소드 시작
itmes ['C', 'E', 'I', 'J', 'O']
Agent's local target = ['C', 'E', 'I', 'J', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6647번째 에피소드 시작
itmes ['A', 'F', 'Q']
Agent's local target = ['A', 'F', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1), (9, 1, 0.1)]
data:  0.0
data:  0.00396711269844222
data:  0.01147319030919203
data:  0.038723254115057594
data:  0.1164842832609282


env 초기화 완료, 6648번째 에피소드 시작
itmes ['A', 'D', 'E', 'I', 'L', 'N']
Agen

action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6678번째 에피소드 시작
itmes ['C', 'F', 'G', 'I', 'L', 'M', 'P']
Agent's local target = ['C', 'F', 'G', 'I', 'L', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6679번째 에피소드 시작
itmes ['F', 'J', 'P']
Agent's local target = ['F', 'J', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6680번째 에피소드 시작
itmes ['A', 'D', 'F', 'J']
Agent's local target = ['A', 'D', 'F', 'J']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6681번째 에피소드 시작
itmes ['A', 'E', 'I', 'N']
Agent's local target = ['A', 'E', 'I', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7



env 초기화 완료, 6710번째 에피소드 시작
itmes ['A', 'D', 'J', 'N', 'P', 'Q']
Agent's local target = ['A', 'D', 'J', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.014981777786298537
data:  0.11755485025576778


env 초기화 완료, 6711번째 에피소드 시작
itmes ['E', 'F', 'I', 'Q']
Agent's local target = ['E', 'F', 'I', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6712번째 에피소드 시작
itmes ['A', 'B', 'I', 'K', 'L', 'N']
Agent's local target = ['A', 'B', 'I', 'K', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6713번째 에피소드 시작
itmes ['A', 'C', 'D', 'E', 'G', 'H', 'M']
Agent's local target = ['A', 'C', 'D', 'E', 'G', 'H', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6714번째 에피소드 시작
itmes ['D', 'H', 'J', 'K', 'M']
Agent's local target = ['D', 'H', 'J', 'K', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6715번째 에피소드 시작
itmes ['C', 'F', 'K', 'M', 'P']
Agent's l

itmes ['B', 'C', 'G', 'H', 'O']
Agent's local target = ['B', 'C', 'G', 'H', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6745번째 에피소드 시작
itmes ['D', 'I', 'M', 'Q']
Agent's local target = ['D', 'I', 'M', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (9, 7, 0.1)]
data:  0.0
data:  0.0040776317786541
data:  0.012962860239098966
data:  0.03962465362227913
data:  0.1178124975545923


env 초기화 완료, 6746번째 에피소드 시작
itmes ['C', 'F', 'G', 'I', 'N', 'O', 'P']
Agent's local target = ['C', 'F', 'G', 'I', 'N', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6747번째 에피소드 시작
itmes ['A', 'D', 'F', 'Q']
Agent's local target = ['A', 'D', 'F', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6748번째 에피소드 시작
itmes ['A', 'H', 'J', 'P', 'Q']
Agent's local targe



env 초기화 완료, 6777번째 에피소드 시작
itmes ['B', 'G', 'H', 'I', 'K', 'P', 'Q']
Agent's local target = ['B', 'G', 'H', 'I', 'K', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.04584128227738503
data:  0.11813919924761303


env 초기화 완료, 6778번째 에피소드 시작
itmes ['C', 'D', 'H', 'I', 'J', 'M', 'N']
Agent's local target = ['C', 'D', 'H', 'I', 'J', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7

action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.040126831276568915
data:  0.11907017362791075
data:  0.040132818593441255
data:  0.11907826661054796


env 초기화 완료, 6808번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'L', 'M']
Agent's local target = ['A', 'B', 'E', 'G', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6809번째 에피소드 시작
itmes ['E', 'J', 'K', 'P']
Agent's local target = ['E', 'J', 'K', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6810번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'Q']
Agent's local target = ['B', 'C', 'E', 'F', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6811번째 에피소드 시작
itmes ['C', 'F', 'H', 'L']
Agent's local target = ['C', 'F', 'H', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6812번째 에피소드 시작
itmes ['A', 'B', 



env 초기화 완료, 6842번째 에피소드 시작
itmes ['A', 'C', 'D', 'E', 'G', 'H', 'Q']
Agent's local target = ['A', 'C', 'D', 'E', 'G', 'H', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (8, 7, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
actio



env 초기화 완료, 6875번째 에피소드 시작
itmes ['B', 'C', 'G']
Agent's local target = ['B', 'C', 'G']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.010095004910475313
data:  0.011987987208374386
data:  0.039703092346180316
data:  0.12009736718371322


env 초기화 완료, 6876번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'L', 'N', 'Q']
Agent's local target = ['B', 'C', 'E', 'G', 'L', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6877번째 에피소드 시작
itmes ['C', 'H', 'I', 'J', 'L', 'M']
Agent's local target = ['C', 'H', 'I', 'J', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6878번째 에피소드 시작
itmes ['B', 'C', 'D', 'G', 'O', 'Q']
Agent's local target = ['B', 'C', 'D', 'G', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6879번째 에피소드 시

action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), 



env 초기화 완료, 6945번째 에피소드 시작
itmes ['B', 'C', 'G', 'P']
Agent's local target = ['B', 'C', 'G', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 6, 0.1), (6, 6, 0.1)]
data:  0.0
data:  0.011194252049142194
data:  0.031702864641746396
data:  0.0410997163945604
data:  0.1214494916055837


env 초기화 완료, 6946번째 에피소드 시작
itmes ['E', 'F', 'G', 'H', 'J', 'M', 'N']
Agent's local target = ['E', 'F', 'G', 'H', 'J', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6947번째 에피소드 시작
itmes ['B', 'C', 'D', 'H', 'I', 'Q']
Agent's local target = ['B', 'C', 'D', 'H', 'I', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6948번째 에피소드 시작
itmes ['A', 'D', 'E', 'H', 'I', 'K', 'L']
Agent's local target = ['A', 'D', 'E', 'H', 'I', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 



env 초기화 완료, 6982번째 에피소드 시작
itmes ['A', 'D', 'I', 'K', 'L', 'P', 'Q']
Agent's local target = ['A', 'D', 'I', 'K', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 6983번째 에피소드 시작
itmes ['A', 'B', 'J', 'K', 'M', 'P', 'Q']
Agent's local target = ['A', 'B', 'J', 'K', 'M', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6984번째 에피소드 시작
itmes ['E', 'K', 'O', 'P']
Agent's local target = ['E', 'K', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 6985번째 에피소드 시작
itmes ['I', 'K', 'P']
Agent's local target = ['I', 'K', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 6986번째 에피소드 시작
itmes ['C', 'D', 'I', 'J', 'M', 'P', 'Q']
Agent's local target = ['C', 'D', 'I', 'J', 'M', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.01232946415778408
data:  0.04045096246974974
data



env 초기화 완료, 7015번째 에피소드 시작
itmes ['A', 'C', 'K', 'L', 'N']
Agent's local target = ['A', 'C', 'K', 'L', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7016번째 에피소드 시작
itmes ['I', 'J', 'K', 'M', 'N', 'Q']
Agent's local target = ['I', 'J', 'K', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7017번째 에피소드 시작
itmes ['A', 'D', 'F', 'H', 'M', 'N', 'Q']
Agent's local target = ['A', 'D', 'F', 'H', 'M', 'N', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7018번째 에피소드 시작
itmes ['A', 'C', 'D', 'J', 'L', 'N', 'P']
Agent's local target = ['A', 'C', 'D', 'J', 'L', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7019번째 에피소드 시작
itmes ['C', 'D', 'J', 'L', 'N', 'P', 'Q']
Agent's local target = ['C', 'D', 'J', 'L', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7020번째 에피소드 시작
itmes ['D', 'E', 'F', 'H', 'I', 'P']
Agent's local target = ['D', 'E', 'F', 'H', 'I', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7021번째



env 초기화 완료, 7082번째 에피소드 시작
itmes ['C', 'E', 'F', 'Q']
Agent's local target = ['C', 'E', 'F', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 



env 초기화 완료, 7113번째 에피소드 시작
itmes ['A', 'K', 'L', 'O', 'Q']
Agent's local target = ['A', 'K', 'L', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.016124369302651393
data:  0.12374319675473236


env 초기화 완료, 7114번째 에피소드 시작
itmes ['A', 'C', 'D', 'G', 'I', 'K', 'L']
Agent's local target = ['A', 'C', 'D', 'G', 'I', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7115번째 에피소드 시작
itmes ['A', 'D', 'E', 'F', 'J', 'K', 'P']
Agent's local target = ['A', 'D', 'E', 'F', 'J', 'K', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7116번째 에피소드 시작
itmes ['A', 'E', 'F', 'I', 'N', 'P']
Agent's local target = ['A', 'E', 'F', 'I', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7117번째 에피소드 시작
itmes ['N', 'O', 'P']
Agent's local target = ['N', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7118번째 에피소드 시작
itmes ['C', 'D', 'E', 'G', 'J', 'K']
Agen



env 초기화 완료, 7148번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'H', 'K']
Agent's local target = ['B', 'C', 'E', 'F', 'H', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.04102948274718146
data:  0.12403737796763376


env 초기화 완료, 7149번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'K']
Agent's local target = ['A', 'B', 'C', 'H', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7150번째 에피소드 시작
itmes ['G', 'J', 'M', 'O']
Agent's local target = ['G', 'J', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7151번째 에피소드 시작
itmes ['E', 'F', 'J', 'L']
Agent's local target = ['E', 'F', 'J', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7152번째 에피소드 시작
itmes ['D', 'G', 'H', 'I', 'J', 'M', 'Q']
Agent's local target = ['D', 'G', 'H', 'I', 'J', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7153번째 에피소드 시작
itmes ['B', 'I', 'J', 'K', 'N']
Agent's local target = ['B', '



env 초기화 완료, 7183번째 에피소드 시작
itmes ['B', 'D', 'J', 'K', 'L', 'Q']
Agent's local target = ['B', 'D', 'J', 'K', 'L', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.01628629073167571
data:  0.1246285451725285


env 초기화 완료, 7184번째 에피소드 시작
itmes ['E', 'H', 'I', 'J', 'K', 'O', 'P']
Agent's local target = ['E', 'H', 'I', 'J', 'K', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7185번째 에피소드 시작
itmes ['D', 'F', 'K', 'L', 'N', 'O', 'Q']
Agent's local target = ['D', 'F', 'K', 'L', 'N', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7186번째 에피소드 시작
itmes ['A', 'C', 'D', 'K', 'N', 'O']
Agent's local target = ['A', 'C', 'D', 'K', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7187번째 에피소드 시작
itmes ['C', 'F', 'I', 'L', 'M', 'P', 'Q']
Agent's local target = ['C', 'F', 'I', 'L', 'M', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7188번째 에



env 초기화 완료, 7218번째 에피소드 시작
itmes ['A', 'D', 'E', 'M', 'O', 'Q']
Agent's local target = ['A', 'D', 'E', 'M', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7219번째 에피소드 시작
itmes ['A', 'B', 'C', 'D', 'H', 'K', 'M']
Agent's local target = ['A', 'B', 'C', 'D', 'H', 'K', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7220번째 에피소드 시작
itmes ['D', 'K', 'L', 'N', 'P']
Agent's local target = ['D', 'K', 'L', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7221번째 에피소드 시작
itmes ['A', 'B', 'C', 'I', 'N']
Agent's local target = ['A', 'B', 'C', 'I', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.041286585661640084
data:  0.12490126936673993
data:  0.04204103765926082
data:  0.12490877923980326


env 초기화 완료, 7222번



env 초기화 완료, 7253번째 에피소드 시작
itmes ['D', 'F', 'J', 'K']
Agent's local target = ['D', 'F', 'J', 'K']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7254번째 에피소드 시작
itmes ['A', 'D', 'K', 'L', 'N']
Agent's local target = ['A', 'D', 'K', 'L', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7255번째 에피소드 시작
itmes ['B', 'D', 'E', 'J', 'K', 'P', 'Q']
Agent's local target = ['B', 'D', 'E', 'J', 'K', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7256번째 에피소드 시작
itmes ['A', 'B', 'F', 'G', 'M', 'N']
Agent's local target = ['A', 'B', 'F', 'G', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7257번째 에피소드 시작
itmes ['A', 'F', 'H', 'I', 'N']
Agent's local target = ['A', 'F', 'H', 'I', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.016406497402754433
data:  0.1255108055493141


env 초기화 완료, 7258번째 에피소드 시작
itmes ['F', 'M', 'O', 'P']
Agent's local target = ['



env 초기화 완료, 7288번째 에피소드 시작
itmes ['A', 'C', 'G', 'J', 'Q']
Agent's local target = ['A', 'C', 'G', 'J', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7289번째 에피소드 시작
itmes ['D', 'J', 'N', 'P', 'Q']
Agent's local target = ['D', 'J', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7290번째 에피소드 시작
itmes ['D', 'I', 'J', 'K']
Agent's local target = ['D', 'I', 'J', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7291번째 에피소드 시작
itmes ['B', 'D', 'E', 'H', 'M', 'N', 'O']
Agent's local target = ['B', 'D', 'E', 'H', 'M', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7292번째 에피소드 시작
itmes ['A', 'I', 'J', 'Q']
Agent's local target = ['A', 'I', 'J', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7293번째 에피소드 시작
itmes ['C', 'G', 'J', 'K', 'M', 'P']
Agent's local target = ['C', 'G', 'J', 'K', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7294번째 에피소드 시작
itmes ['A', 'E', 'K', 'M', 'O', 'P']
Agent's local target = [

이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (8, 1, 0.1), (8, 0, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (8, 1, 0.1), (8, 0, 0.1), (8, 1, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (8, 1, 0.1), (8, 0, 0.1), (8, 1, 0.1), (8, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (8, 1, 0.1), (8, 0, 0.1), (8, 1, 0.1), (8, 2, 0.1), (8, 1, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1), (7, 1, 0.1), (8, 1, 0.1), (8, 0, 0.1), (8, 1, 0.1), 



env 초기화 완료, 7351번째 에피소드 시작
itmes ['F', 'G', 'H', 'M', 'P', 'Q']
Agent's local target = ['F', 'G', 'H', 'M', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7352번째 에피소드 시작
itmes ['B', 'E', 'I', 'K', 'L', 'N', 'P']
Agent's local target = ['B', 'E', 'I', 'K', 'L', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7353번째 에피소드 시작
itmes ['A', 'C', 'E', 'H', 'J', 'K', 'O']
Agent's local target = ['A', 'C', 'E', 'H', 'J', 'K', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7354번째 에피소드 시작
itmes ['C', 'E', 'H', 'N']
Agent's local target = ['C', 'E', 'H', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7355번째 에피소드 시작
itmes ['C', 'D', 'G', 'J', 'L', 'N', 'O']
Agent's local target = ['C', 'D', 'G', 'J', 'L', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1),



env 초기화 완료, 7383번째 에피소드 시작
itmes ['D', 'E', 'H', 'J', 'K', 'M', 'Q']
Agent's local target = ['D', 'E', 'H', 'J', 'K', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7384번째 에피소드 시작
itmes ['B', 'E', 'H', 'I', 'L', 'O']
Agent's local target = ['B', 'E', 'H', 'I', 'L', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.016535089781299896
data:  0.12781789297973667


env 초기화 완료, 7385번째 에피소드 시작
itmes ['A', 'C', 'F', 'G', 'I', 'M', 'O']
Agent's local target = ['A', 'C', 'F', 'G', 'I', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7386번째 에피소드 시작
itmes ['B', 'E', 'F', 'I', 'J', 'M', 'Q']
Agent's local target = ['B', 'E', 'F', 'I', 'J', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7387번째 에피소드 시작
itmes ['A', 'G', 'H', 'J', 'L']
Agent's local target = ['A', 'G', 'H', 'J', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7388번째 에피소드 시작
i



env 초기화 완료, 7415번째 에피소드 시작
itmes ['A', 'B', 'K', 'N', 'P']
Agent's local target = ['A', 'B', 'K', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7416번째 에피소드 시작
itmes ['A', 'E', 'F', 'G', 'H', 'M', 'O']
Agent's local target = ['A', 'E', 'F', 'G', 'H', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.04980748285122936
data:  0.03284329664533995
data:  0.04981250210294424
data:  0.12816718861980636


env 초기화 완료, 7417번째 에피소드 시작
itmes ['A', 'B', 'C', 'M', 'N', 'O', 'P']
Agent's local target = ['A', 'B', 'C', 'M', 'N', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7418번째 에피소드 시작
itmes ['G', 'H', 'K', 'M', 'Q']
Agent's local target = ['G', 'H', 'K', 'M', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 



env 초기화 완료, 7446번째 에피소드 시작
itmes ['C', 'D', 'E', 'N']
Agent's local target = ['C', 'D', 'E', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 

Agent's local target = ['E', 'F', 'I', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7476번째 에피소드 시작
itmes ['A', 'B', 'E', 'I', 'N', 'O', 'Q']
Agent's local target = ['A', 'B', 'E', 'I', 'N', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7477번째 에피소드 시작
itmes ['B', 'C', 'K', 'O']
Agent's local target = ['B', 'C', 'K', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7478번째 에피소드 시작
itmes ['E', 'G', 'M', 'N', 'O', 'P']
Agent's local target = ['E', 'G', 'M', 'N', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7479번째 에피소드 시작
itmes ['A', 'F', 'G', 'K', 'M', 'Q']
Agent's local target = ['A', 'F', 'G', 'K', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7480번째 에피소드 시작
itmes ['C', 'E', 'F', 'H', 'I', 'P']
Agent's local target = ['C', 'E', 'F', 'H', 'I', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7481번째 에피소드 시작
itmes ['D', 'E', 'H', 'L', 'N', 'O']
Agent's local target = ['D', 'E', 'H', 'L', 'N', 'O']
a



env 초기화 완료, 7507번째 에피소드 시작
itmes ['C', 'G', 'H', 'M', 'O', 'P']
Agent's local target = ['C', 'G', 'H', 'M', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7508번째 에피소드 시작
itmes ['B', 'K', 'L', 'N']
Agent's local target = ['B', 'K', 'L', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7509번째 에피소드 시작
itmes ['B', 'F', 'J', 'Q']
Agent's local target = ['B', 'F', 'J', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7510번째 에피소드 시작
itmes ['D', 'E', 'G', 'I', 'N', 'Q']
Agent's local target = ['D', 'E', 'G', 'I', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7511번째 에피소드 시작
itmes ['A', 'E', 'I', 'Q']
Agent's local target = ['A', 'E', 'I', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7512번째 에피소드 시작
itmes ['A', 'E', 'N', 'O']
Agent's local target = ['A', 'E', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7513번째 에피소드 시작
itmes ['B', 'I', 'J', 'L', 'O']
Agent's local target = ['B', 'I', 'J', 'L', 'O']
action : 2



env 초기화 완료, 7576번째 에피소드 시작
itmes ['B', 'I', 'K', 'Q']
Agent's local target = ['B', 'I', 'K', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.01679345849235779
data:  0.13047419990376155
data:  0.04321950611507804
data:  0.13048115248377118


env 초기화 완료, 7577번째 에피소드 시작
itmes ['C', 'D', 'G', 'I', 'L', 'Q']
Agent's local target = ['C', 'D', 'G', 'I', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7578번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'L', 'P', 'Q']
Agent's local target = ['A', 'B', 'C', 'H', 'L', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7579번째 에피소드 시작
itmes ['A', 'C', 'H', 'I', 'K', 'N', 'Q']
Agent's local target = ['A', 'C', 'H', 'I', 'K', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 



env 초기화 완료, 7649번째 에피소드 시작
itmes ['A', 'B', 'F', 'J', 'L', 'Q']
Agent's local target = ['A', 'B', 'F', 'J', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7650번째 에피소드 시작
itmes ['G', 'H', 'I', 'K', 'L', 'M', 'N']
Agent's local target = ['G', 'H', 'I', 'K', 'L', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.016870098968593903
data:  0.13103203435696847


env 초기화 완료, 7651번째 에피소드 시작
itmes ['E', 'H', 'K', 'M']
Agent's local target = ['E', 'H', 'K', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7652번째 에피소드 시작
itmes ['A', 'E', 'G', 'L', 'Q']
Agent's local target = ['A', 'E', 'G', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7653번째 에피소드 시작
itmes ['E', 'I', 'J', 'K', 'P']
Agent's local target = ['E', 'I', 'J', 'K', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7654번째 에피소드 시작
itmes ['C', 'E', 'H', 'M', 'N', 'P']
Agent's local 



env 초기화 완료, 7683번째 에피소드 시작
itmes ['B', 'G', 'H', 'L', 'M', 'Q']
Agent's local target = ['B', 'G', 'H', 'L', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7684번째 에피소드 시작
itmes ['C', 'I', 'L', 'N', 'Q']
Agent's local target = ['C', 'I', 'L', 'N', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7685번째 에피소드 시작
itmes ['B', 'C', 'G', 'H', 'J', 'M', 'P']
Agent's local target = ['B', 'C', 'G', 'H', 'J', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7686번째 에피소드 시작
itmes ['C', 'F', 'I', 'J', 'L', 'M', 'Q']
Agent's local target = ['C', 'F', 'I', 'J', 'L', 'M', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7687번째 에피소드 시작
itmes ['C', 'D', 'K', 'L', 'N', 'O']
Agent's local target = ['C', 'D', 'K', 'L', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.016895035445089423
data:  0.13150205647981986


env 초기화 완료, 7688번째 에피소드 시작
itmes ['A',



env 초기화 완료, 7719번째 에피소드 시작
itmes ['C', 'H', 'I', 'M', 'O']
Agent's local target = ['C', 'H', 'I', 'M', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7720번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'L', 'O', 'Q']
Agent's local target = ['A', 'B', 'E', 'H', 'L', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7721번째 에피소드 시작
itmes ['A', 'B', 'H', 'I', 'M', 'P']
Agent's local target = ['A', 'B', 'H', 'I', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7722번째 에피소드 시작
itmes ['C', 'D', 'G', 'K', 'L', 'N']
Agent's local target = ['C', 'D', 'G', 'K', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (7, 2, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.



env 초기화 완료, 7753번째 에피소드 시작
itmes ['A', 'F', 'H', 'M', 'N']
Agent's local target = ['A', 'F', 'H', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7754번째 에피소드 시작
itmes ['C', 'D', 'I', 'L', 'N', 'O']
Agent's local target = ['C', 'D', 'I', 'L', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7755번째 에피소드 시작
itmes ['A', 'H', 'J', 'L', 'N']
Agent's local target = ['A', 'H', 'J', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7756번째 에피소드 시작
itmes ['A', 'C', 'E', 'Q']
Agent's local target = ['A', 'C', 'E', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7757번째 에피소드 시작
itmes ['A', 'C', 'D', 'I', 'M', 'N', 'O']
Agent's local target = ['A', 'C', 'D', 'I', 'M', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7758번째 에피소드 시작
itmes ['D', 'G', 'H', 'I', 'N', 'O', 'P']
Agent's local target = ['D', 'G', 'H', 'I', 'N', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7759번째 에피소드 시작
itmes ['A', 'C', 'F', 'M', 'N',



env 초기화 완료, 7788번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'L', 'Q']
Agent's local target = ['A', 'B', 'C', 'H', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7789번째 에피소드 시작
itmes ['A', 'D', 'G', 'I', 'N']
Agent's local target = ['A', 'D', 'G', 'I', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7790번째 에피소드 시작
itmes ['B', 'D', 'E', 'J', 'N', 'O', 'Q']
Agent's local target = ['B', 'D', 'E', 'J', 'N', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7791번째 에피소드 시작
itmes ['A', 'D', 'G', 'L', 'M', 'P']
Agent's local target = ['A', 'D', 'G', 'L', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7792번째 에피소드 시작
itmes ['C', 'D', 'F', 'H', 'J', 'N', 'O']
Agent's local target = ['C', 'D', 'F', 'H', 'J', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7793번째 에피소드 시작
itmes ['C', 'E', 'H', 'I', 'J', 'P', 'Q']
Agent's local target = ['C', 'E', 'H', 'I', 'J', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7794번째



env 초기화 완료, 7822번째 에피소드 시작
itmes ['A', 'B', 'D', 'G', 'H', 'K', 'L']
Agent's local target = ['A', 'B', 'D', 'G', 'H', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7823번째 에피소드 시작
itmes ['A', 'D', 'I', 'L', 'N', 'O']
Agent's local target = ['A', 'D', 'I', 'L', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7824번째 에피소드 시작
itmes ['A', 'C', 'F', 'G', 'H', 'I']
Agent's local target = ['A', 'C', 'F', 'G', 'H', 'I']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1), (8, 0, 0.1)]
action : 2
나감
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (8, 1, 0.1), (8, 0, 0.1), (8, -1, 0.1)]
data:  0.0013275692440220493
data:  0.0016749726053175242
data:  0.004817132957412008
data:  0.01312525556673056
data:  0.0441060926056204
data:  0.132919861303065


env 초기화 완료, 7825번째 에



env 초기화 완료, 7858번째 에피소드 시작
itmes ['C', 'G', 'J', 'L', 'M', 'O']
Agent's local target = ['C', 'G', 'J', 'L', 'M', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7859번째 에피소드 시작
itmes ['A', 'B', 'C', 'F', 'L']
Agent's local target = ['A', 'B', 'C', 'F', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7860번째 에피소드 시작
itmes ['B', 'N', 'O', 'Q']
Agent's local target = ['B', 'N', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (7, 1, 0.1), (7, 0, 0.1)]
ac



env 초기화 완료, 7892번째 에피소드 시작
itmes ['D', 'F', 'L']
Agent's local target = ['D', 'F', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.017127857723939953
data:  0.13395611368877744
data:  0.01713614493816756
data:  0.13396271807740856
data:  0.017164431323673745
data:  0.13398932180560083
data:  0.05201



env 초기화 완료, 7927번째 에피소드 시작
itmes ['B', 'E', 'F', 'G', 'M', 'N', 'P']
Agent's local target = ['B', 'E', 'F', 'G', 'M', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7928번째 에피소드 시작
itmes ['C', 'F', 'I', 'M', 'O', 'P', 'Q']
Agent's local target = ['C', 'F', 'I', 'M', 'O', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5,



env 초기화 완료, 7962번째 에피소드 시작
itmes ['B', 'E', 'K', 'L', 'O', 'P', 'Q']
Agent's local target = ['B', 'E', 'K', 'L', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7963번째 에피소드 시작
itmes ['A', 'B', 'J', 'N', 'P']
Agent's local target = ['A', 'B', 'J', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7964번째 에피소드 시작
itmes ['D', 'G', 'H', 'I', 'K', 'L', 'Q']
Agent's local target = ['D', 'G', 'H', 'I', 'K', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7965번째 에피소드 시작
itmes ['A', 'E', 'H', 'J', 'N', 'Q']
Agent's local target = ['A', 'E', 'H', 'J', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7966번째 에피소드 시작
itmes ['D', 'E', 'F', 'I', 'O', 'P']
Agent's local target = ['D', 'E', 'F', 'I', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7967번째 에피소드 시작
itmes ['C', 'E', 'M']
Agent's local target = ['C', 'E', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 7968번째 에피소드 시작
itmes ['A', 'D', 'J', 'L']
Agen



env 초기화 완료, 7995번째 에피소드 시작
itmes ['D', 'F', 'J', 'O']
Agent's local target = ['D', 'F', 'J', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7996번째 에피소드 시작
itmes ['A', 'B', 'D', 'M', 'P']
Agent's local target = ['A', 'B', 'D', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7997번째 에피소드 시작
itmes ['A', 'E', 'F', 'H', 'I', 'K', 'O']
Agent's local target = ['A', 'E', 'F', 'H', 'I', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 7998번째 에피소드 시작
itmes ['A', 'F', 'H', 'J', 'M', 'N', 'Q']
Agent's local target = ['A', 'F', 'H', 'J', 'M', 'N', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 7999번째 에피소드 시작
itmes ['G', 'H', 'I', 'Q']
Agent's local target = ['G', 'H', 'I', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8000번째 에피소드 시작
itmes ['D', 'F', 'I', 'K', 'P']
Agent's local target = ['D', 'F', 'I', 'K', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1



env 초기화 완료, 8030번째 에피소드 시작
itmes ['A', 'C', 'F', 'I', 'N', 'O']
Agent's local target = ['A', 'C', 'F', 'I', 'N', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8031번째 에피소드 시작
itmes ['D', 'H', 'M', 'O']
Agent's local target = ['D', 'H', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.04572298057032551
data:  0.13648194912853165


env 초기화 완료, 8032번째 에피소드 시작
itmes ['B', 'E', 'N', 'O']
Agent's local target = ['B', 'E', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8033번째 에피소드 시작
itmes ['F', 'G', 'M', 'O', 'P', 'Q']
Agent's local target = ['F', 'G', 'M', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8034번째 에피소드 시작
itmes ['C', 'G', 'I', 'L', 'N', 'P', 'Q']
Agent's local target = ['C', 'G', 'I', 'L', 'N', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8035번째 에피소드 시작
itmes ['A', 'D', 'E', 'I', 'J']
Agent's local target



env 초기화 완료, 8066번째 에피소드 시작
itmes ['A', 'D', 'F', 'J', 'L', 'P', 'Q']
Agent's local target = ['A', 'D', 'F', 'J', 'L', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8067번째 에피소드 시작
itmes ['E', 'J', 'L', 'N', 'P']
Agent's local target = ['E', 'J', 'L', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8068번째 에피소드 시작
itmes ['A', 'D', 'G', 'I', 'M']
Agent's local target = ['A', 'D', 'G', 'I', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8069번째 에피소드 시작
itmes ['A', 'C', 'E', 'H', 'I', 'K', 'Q']
Agent's local target = ['A', 'C', 'E', 'H', 'I', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8070번째 에피소드 시작
itmes ['A', 'E', 'K', 'M', 'O', 'Q']
Agent's local target = ['A', 'E', 'K', 'M', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8071번째 에피소드 시작
itmes ['A', 'E', 'J', 'K', 'M', 'N']
Agent's local target = ['A', 'E', 'J', 'K', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8072번째 에피소드 시작
itmes ['F',



env 초기화 완료, 8103번째 에피소드 시작
itmes ['A', 'B', 'D', 'G', 'N', 'O']
Agent's local target = ['A', 'B', 'D', 'G', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.046685899046958204
data:  0.1371483339174444
data:  0.017571437478211695
data:  0.13715461908405266


env 초기화 완료, 8104번째 에피소드 시작
itmes ['C', 'D', 'E', 'L']
Agent's local target = ['C', 'D', 'E', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8105번째 에피소드 시작
itmes ['G', 'I', 'J', 'L']
Agent's local target = ['G', 'I', 'J', 'L']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8106번째 에피소드 시작
itmes ['A', 'F', 'G', 'J', 'L', 'M']
Agent's local target = ['A', 'F', 'G', 'J', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8107번째 에피소드 시작
itmes ['A', 'C', 'E'



env 초기화 완료, 8136번째 에피소드 시작
itmes ['A', 'I', 'J', 'M', 'N', 'Q']
Agent's local target = ['A', 'I', 'J', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8137번째 에피소드 시작
itmes ['F', 'I', 'J', 'M', 'N']
Agent's local target = ['F', 'I', 'J', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8138번째 에피소드 시작
itmes ['A', 'C', 'I', 'L', 'M', 'N']
Agent's local target = ['A', 'C', 'I', 'L', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.05286693360022329
data:  0.1374898261316115
data:  0.046741887677874405
data:  0.13749607714899834


env 초기화 완료, 8139번째 에피소드 시작
itmes ['A', 'B', 'C', 'M', 'P']
Agent's local target = ['A', 'B', 'C', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8140번째 에피소드 시작
i



env 초기화 완료, 8170번째 에피소드 시작
itmes ['A', 'F', 'G', 'H', 'I', 'O']
Agent's local target = ['A', 'F', 'G', 'H', 'I', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8171번째 에피소드 시작
itmes ['D', 'G', 'L', 'N', 'P']
Agent's local target = ['D', 'G', 'L', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8172번째 에피소드 시작
itmes ['A', 'B', 'J', 'K', 'L', 'N', 'Q']
Agent's local target = ['A', 'B', 'J', 'K', 'L', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)



env 초기화 완료, 8202번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'P']
Agent's local target = ['B', 'C', 'E', 'G', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.01494316816263255
data:  0.04698961839199727
data:  0.13917605415524953


env 초기화 완료, 8203번째 에피소드 시작
itmes ['D', 'F', 'O', 'P']
Agent's local target = ['D', 'F', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8204번째 에피소드 시작
itmes ['B', 'E', 'H', 'K', 'O', 'Q']
Agent's local target = ['B', 'E', 'H', 'K', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 5, 0.1

이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (7, 2, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.014616417875988606
data:  0.011727596557352357
data:  0.014624956234201007
data:  0.047464982859731206
data:  0.13988067455231873


env 초기화 완료, 8234번째 에피소드 시작
itmes ['E', 'F', 'N', 'O', 'P']
Agent's local target = ['E', 'F', 'N', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8235번째 에피소드 시작
itmes ['A', 'C', 'D', 'G', 'O']
Agent's local target = ['A', 'C', 'D', 'G', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8236번째 에피소드 시작
itmes ['B', 'C', 'G', 'H']
Agent's local target = ['B', 'C', 'G', 'H']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8237번째 에피소드 시작
itmes ['A', 'C', 'D', 'J', 'K', 'M', 'N']
Agent's local 

itmes ['G', 'H', 'O']
Agent's local target = ['G', 'H', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8269번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'I', 'K', 'O']
Agent's local target = ['A', 'B', 'E', 'G', 'I', 'K', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8270번째 에피소드 시작
itmes ['A', 'H', 'K', 'L', 'M', 'O']
Agent's local target = ['A', 'H', 'K', 'L', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8271번째 에피소드 시작
itmes ['B', 'C', 'D', 'I', 'L', 'N', 'Q']
Agent's local target = ['B', 'C', 'D', 'I', 'L', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8272번째 에피소드 시작
itmes ['C', 'I', 'O', 'P']
Agent's local target = ['C', 'I', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8273번째 에피소드 시작
itmes ['A', 'C', 'N', 'O', 'Q']
Agent's local target = ['A', 'C', 'N', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8274번째 에피소드 시작
itmes ['G', 'I', 'J', 'M']
Agent's local target = ['G', 'I', 'J', 'M']
action : 



env 초기화 완료, 8304번째 에피소드 시작
itmes ['C', 'H', 'J', 'O']
Agent's local target = ['C', 'H', 'J', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8305번째 에피소드 시작
itmes ['D', 'E', 'J', 'K', 'L', 'P']
Agent's local target = ['D', 'E', 'J', 'K', 'L', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8306번째 에피소드 시작
itmes ['A', 'B', 'G', 'H', 'I', 'K']
Agent's local target = ['A', 'B', 'G', 'H', 'I', 'K']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8307번째 에피소드 시작
itmes ['E', 'J', 'K', 'L', 'M', 'O', 'Q']
Agent's local target = ['E', 'J', 'K', 'L', 'M', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.015328048763695316
data:  0.04751820465092573
data:  0.14069192192878122


env 초기화 완료, 8308번째 에피소드 시작
itmes ['B', 'D', 'J', 'K']
Agent's local target = ['B', 'D', 'J', 'K']
action : 3
부딪힘
[(9, 5, 0.1



env 초기화 완료, 8339번째 에피소드 시작
itmes ['E', 'G', 'I', 'K', 'M', 'N', 'O']
Agent's local target = ['E', 'G', 'I', 'K', 'M', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8340번째 에피소드 시작
itmes ['A', 'I', 'J', 'K', 'M', 'P']
Agent's local target = ['A', 'I', 'J', 'K', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8341번째 에피소드 시작
itmes ['C', 'D', 'E', 'G', 'H', 'M', 'P']
Agent's local target = ['C', 'D', 'E', 'G', 'H', 'M', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.04773261953558299
data:  0.14104884522652214


env 초기화 완료, 8342번째 에피소드 시작
itmes ['A', 'D', 'G', 'J', 'K', 'L', 'P']
Agent's local target = ['A', 'D', 'G', 'J', 'K', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8343번째 에피소드 시작
itmes ['F', 'G', 'I', 'O', 'Q']
Agent's local target = ['F', 'G', 'I', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8344번째 에피소드 시작
it



env 초기화 완료, 8376번째 에피소드 시작
itmes ['D', 'E', 'I', 'K', 'P']
Agent's local target = ['D', 'E', 'I', 'K', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.018454441889398928
data:  0.14126769787654672
data:  0.04771441130314546
data:  0.14127357110675906


env 초기화 완료, 8377번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'H', 'O', 'Q']
Agent's local target = ['B', 'C', 'E', 'G', 'H', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8378번째 에피소드 시작
itmes ['A', 'D', 'E', 'H', 'J', 'L', 'M']
Agent's local target = ['A', 'D', 'E', 'H', 'J', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.05429000934015063
data:  0.1412994437496484


env 초기화 완



env 초기화 완료, 8412번째 에피소드 시작
itmes ['A', 'E', 'F', 'L', 'P']
Agent's local target = ['A', 'E', 'F', 'L', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.01849890311054691
data:  0.1417256087266197
data:  0.05440828659399797
data:  0.14173143616574704


env 초기화 완료, 8413번째 에피소드 시작
itmes ['A', 'I', 'J', 'L', 'M']
Agent's local target = ['A', 'I', 'J', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8414번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'I', 'M', 'O']
Agent's local target = ['A', 'B', 'C', 'H', 'I', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8415번째 에피소드 시작
itmes ['A', 'C', 'E', 'I', 'J', 'L', 'P']
Agent's local target = ['A', 'C', 'E', 'I', 'J', 'L', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0

action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (7, 6, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (7, 6, 0.1), (8, 6, 0.1), (8, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 6, 0.1), (7, 7, 0.1), (6, 7, 0.1), (7, 7, 0.1), (8, 7, 0.1), (8, 6, 0.1), (7, 6, 0.1), 

data:  0.0


env 초기화 완료, 8478번째 에피소드 시작
itmes ['A', 'B', 'E', 'N', 'P', 'Q']
Agent's local target = ['A', 'B', 'E', 'N', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8479번째 에피소드 시작
itmes ['A', 'C', 'D', 'E', 'K', 'L', 'Q']
Agent's local target = ['A', 'C', 'D', 'E', 'K', 'L', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8480번째 에피소드 시작
itmes ['C', 'E', 'H', 'M', 'N']
Agent's local target = ['C', 'E', 'H', 'M', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (5, 3, 0.1), (5, 2, 0.1)]
data:  0.0
data:  0.0006587385810405266
data:  0.004539537318371925
data:  0.03365671435502589
data:  0.0549436828367962
data:  0.14318863181121602


env 초기화 완료, 8481번째 에피소드 시작
itmes ['



env 초기화 완료, 8512번째 에피소드 시작
itmes ['B', 'D', 'F', 'H', 'I', 'K', 'L']
Agent's local target = ['B', 'D', 'F', 'H', 'I', 'K', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8513번째 에피소드 시작
itmes ['B', 'E', 'J', 'M', 'N']
Agent's local target = ['B', 'E', 'J', 'M', 'N']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8514번째 에피소드 시작
itmes ['A', 'J', 'K', 'O', 'P']
Agent's local target = ['A', 'J', 'K', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8515번째 에피소드 시작
itmes ['A', 'B', 'F', 'L', 'M', 'N', 'Q']
Agent's local target = ['A', 'B', 'F', 'L', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.



env 초기화 완료, 8546번째 에피소드 시작
itmes ['A', 'B', 'C', 'E', 'G', 'I', 'K']
Agent's local target = ['A', 'B', 'C', 'E', 'G', 'I', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8547번째 에피소드 시작
itmes ['A', 'C', 'J', 'L', 'M', 'O', 'Q']
Agent's local target = ['A', 'C', 'J', 'L', 'M', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8548번째 에피소드 시작
itmes ['D', 'F', 'G', 'H', 'K']
Agent's local target = ['D', 'F', 'G', 'H', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.04872707665368752
data:  0.1445029913953331


env 초기화 완료, 8549번째 에피소드 시작
itmes ['A', 'C', 'E', 'I', 'L', 'O', 'P']
Agent's local target = ['A', 'C', 'E', 'I', 'L', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8550번째 에피소드 시작
itmes ['C', 'D', 'E', 'F', 'L']
Agent's local target = ['C', 'D', 'E', 'F', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8551번째 에피소드 시작
itmes ['B', '



env 초기화 완료, 8580번째 에피소드 시작
itmes ['C', 'K', 'L', 'M', 'N', 'Q']
Agent's local target = ['C', 'K', 'L', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8581번째 에피소드 시작
itmes ['A', 'E', 'G', 'I', 'K']
Agent's local target = ['A', 'E', 'G', 'I', 'K']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8582번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'J']
Agent's local target = ['B', 'C', 'E', 'F', 'J']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8583번째 에피소드 시작
itmes ['A', 'C', 'D', 'F', 'G', 'J', 'M']
Agent's local target = ['A', 'C', 'D', 'F', 'G', 'J', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8584번째 에피소드 시작
itmes ['D', 'H', 'J', 'N', 'O', 'Q']
Agent's local target = ['D', 'H', 'J', 'N', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8585번째 에피소드 시작
itmes ['B', 'D', 'L', 'N', 'Q']
Agent's local target = ['B', 'D', 'L', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8586번째 에피소드 시작
itmes ['A', 'C', 'D', 'K', 'M',



env 초기화 완료, 8616번째 에피소드 시작
itmes ['A', 'E', 'F', 'G']
Agent's local target = ['A', 'E', 'F', 'G']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8617번째 에피소드 시작
itmes ['A', 'I', 'K', 'Q']
Agent's local target = ['A', 'I', 'K', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.018789135129674735
data:  0.14523681106849085


env 초기화 완료, 8618번째 에피소드 시작
itmes ['B', 'C', 'M', 'N', 'O']
Agent's local target = ['B', 'C', 'M', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8619번째 에피소드 시작
itmes ['A', 'D', 'J', 'K', 'L', 'M']
Agent's local target = ['A', 'D', 'J', 'K', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8620번째 에피소드 시작
itmes ['D', 'E', 'Q']
Agent's local target = ['D', 'E', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6,

Agent's local target = ['G', 'K', 'N', 'O', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8654번째 에피소드 시작
itmes ['D', 'F', 'H', 'N', 'O']
Agent's local target = ['D', 'F', 'H', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8655번째 에피소드 시작
itmes ['A', 'H', 'J', 'K', 'M', 'O', 'Q']
Agent's local target = ['A', 'H', 'J', 'K', 'M', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8656번째 에피소드 시작
itmes ['C', 'G', 'N', 'O', 'Q']
Agent's local target = ['C', 'G', 'N', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8657번째 에피소드 시작
itmes ['C', 'D', 'J', 'O', 'P']
Agent's local target = ['C', 'D', 'J', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8658번째 에피소드 시작
itmes ['B', 'C', 'E', 'H', 'K', 'O', 'Q']
Agent's local target = ['B', 'C', 'E', 'H', 'K', 'O', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8659번째 에피소드 시작
itmes ['A', 'B', 'C', 'L', 'M', 'P']
Agent's local target = ['A', 'B', 'C', 'L', 'M', '



env 초기화 완료, 8690번째 에피소드 시작
itmes ['A', 'B', 'G', 'K', 'M', 'N', 'O']
Agent's local target = ['A', 'B', 'G', 'K', 'M', 'N', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8691번째 에피소드 시작
itmes ['A', 'B', 'P']
Agent's local target = ['A', 'B', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8692번째 에피소드 시작
itmes ['A', 'B', 'C', 'G', 'M', 'O', 'P']
Agent's local target = ['A', 'B', 'C', 'G', 'M', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8693번째 에피소드 시작
itmes ['A', 'C', 'D', 'K', 'L', 'M', 'P']
Agent's local target = ['A', 'C', 'D', 'K', 'L', 'M', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.018905959684244418
data:  0.14581671794644324


env 초기화 완료, 8694번째 에피소드 시작
itmes ['G', 'I', 'M', 'P']
Agent's local target = ['G', 'I', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8695번째 에피소드 시작
itmes ['A', 'E', 'F', 'H', 'I', 'N', 'O']



env 초기화 완료, 8726번째 에피소드 시작
itmes ['C', 'D', 'F', 'H', 'M', 'N', 'Q']
Agent's local target = ['C', 'D', 'F', 'H', 'M', 'N', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8727번째 에피소드 시작
itmes ['A', 'G', 'H', 'I', 'J', 'M', 'P']
Agent's local target = ['A', 'G', 'H', 'I', 'J', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8728번째 에피소드 시작
itmes ['B', 'E', 'H', 'I', 'O', 'P', 'Q']
Agent's local target = ['B', 'E', 'H', 'I', 'O', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8729번째 에피소드 시작
itmes ['I', 'K', 'L', 'M']
Agent's local target = ['I', 'K', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (8, 2, 0.1), (9, 2, 0.1)]
data:  0.0
data:  0.015156



env 초기화 완료, 8761번째 에피소드 시작
itmes ['A', 'C', 'F', 'H', 'N', 'P', 'Q']
Agent's local target = ['A', 'C', 'F', 'H', 'N', 'P', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8762번째 에피소드 시작
itmes ['A', 'C', 'H', 'L', 'M']
Agent's local target = ['A', 'C', 'H', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8763번째 에피소드 시작
itmes ['D', 'F', 'G', 'L', 'Q']
Agent's local target = ['D', 'F', 'G', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8764번째 에피소드 시작
itmes ['B', 'E', 'G', 'J', 'L', 'N', 'P']
Agent's local target = ['B', 'E', 'G', 'J', 'L', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 6, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 6, 0.1), (8, 7, 0.1), (8, 6, 0.1), (9, 6, 0.1)]
data:  0.0
data:  0.0164787696969305



env 초기화 완료, 8798번째 에피소드 시작
itmes ['D', 'J', 'K', 'M', 'P', 'Q']
Agent's local target = ['D', 'J', 'K', 'M', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8799번째 에피소드 시작
itmes ['A', 'H', 'J', 'K', 'N', 'P']
Agent's local target = ['A', 'H', 'J', 'K', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.050325648712083206
data:  0.14721960266509368


env 초기화 완료, 8800번째 에피소드 시작
itmes ['F', 'H', 'N', 'O', 'P']
Agent's local target = ['F', 'H', 'N', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.050330616147211994
data:  0.14722488070482717


env 초기화 완료, 8801번째 에피소드 시작
itmes ['B', 'E', 'F', 'H', 'J', 'L', 'Q']
Agent's local target = ['B', 'E', 'F', 'H', 'J', 'L', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8



env 초기화 완료, 8833번째 에피소드 시작
itmes ['B', 'C', 'K', 'M', 'P']
Agent's local target = ['B', 'C', 'K', 'M', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8834번째 에피소드 시작
itmes ['A', 'K', 'L', 'M', 'N']
Agent's local target = ['A', 'K', 'L', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8835번째 에피소드 시작
itmes ['H', 'I', 'J', 'L', 'N', 'P']
Agent's local target = ['H', 'I', 'J', 'L', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8836번째 에피소드 시작
itmes ['E', 'F', 'I', 'N']
Agent's local target = ['E', 'F', 'I', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8837번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'H', 'I', 'K']
Agent's local target = ['B', 'C', 'E', 'G', 'H', 'I', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8838번째 에피소드 시작
itmes ['A', 'D', 'G', 'M', 'P']
Agent's local target = ['A', 'D', 'G', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8839번째 에피소드 시작
itmes ['C', 'G', 'H', 'Q']
Agent's local target = [



env 초기화 완료, 8872번째 에피소드 시작
itmes ['A', 'D', 'G', 'I', 'J', 'N']
Agent's local target = ['A', 'D', 'G', 'I', 'J', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 8873번째 에피소드 시작
itmes ['D', 'I', 'J', 'L', 'Q']
Agent's local target = ['D', 'I', 'J', 'L', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8874번째 에피소드 시작
itmes ['A', 'B', 'H', 'I', 'J', 'K', 'L']
Agent's local target = ['A', 'B', 'H', 'I', 'J', 'K', 'L']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8875번째 에피소드 시작
itmes ['E', 'G', 'H', 'J', 'K', 'Q']
Agent's local target = ['E', 'G', 'H', 'J', 'K', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.01901131870649055
data:  0.14794643503889265


env 초기화 완료, 8876번째 에피소드 시작
itmes ['D', 'F', 'I', 'N', 'Q']
Agent's local target = ['D', 'F', 'I', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8877번째 에피소드 시작
itmes ['F', 'I', 'J', 'N', 'O', 

action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8905번째 에피소드 시작
itmes ['G', 'L', 'N', 'O']
Agent's local target = ['G', 'L', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8906번째 에피소드 시작
itmes ['E', 'G', 'I', 'J', 'K', 'O', 'P']
Agent's local target = ['E', 'G', 'I', 'J', 'K', 'O', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8907번째 에피소드 시작
itmes ['B', 'E', 'M', 'O']
Agent's local target = ['B', 'E', 'M', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8908번째 에피소드 시작
itmes ['C', 'E', 'F', 'I', 'K', 'L', 'O']
Agent's local target = ['C', 'E', 'F', 'I', 'K', 'L', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8909번째 에피소드 시작
itmes ['A', 'E', 'F', 'G', 'L']
Agent's local target = ['A', 'E', 'F', 'G', 'L']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 8910번째 에피소드 시작
itmes ['A', 'C', 'N', 'P']
Agent's local target = ['A', 'C', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 3
이동
[(8, 4,

data:  0.0008392214616059617
data:  0.0025936430303854755
data:  0.007795510641608417
data:  0.013861985179669448
data:  0.038225620435639505
data:  0.056836024242917386
data:  0.03836179787359594
data:  0.05698034064049309
data:  0.03478797024297773
data:  0.05066365684335457
data:  0.034964491445953434
data:  0.05714464260642904
data:  0.148945346036946


env 초기화 완료, 8935번째 에피소드 시작
itmes ['A', 'E', 'G', 'H', 'I', 'J', 'K']
Agent's local target = ['A', 'E', 'G', 'H', 'I', 'J', 'K']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.050848590477670236
data:  0.14915045150234232


env 초기화 완료, 8936번째 에피소드 시작
itmes ['A', 'H', 'J', 'L', 'M']
Agent's local target = ['A', 'H', 'J', 'L', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 8937번째 에피소드 시작
itmes ['B', 'C', 'E', 'G', 'O']
Agent's local target = ['B', 'C', 'E', 'G', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4,

action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.05755596001341779
data:  0.14941119719284143
data:  0.0509594597794279
data:  0.03859639746110077
data:  0.05098436383344996
data:  0.14941625607312214
data:  0.05756020441741645
data:  0.14946131444751484


env 초기화 완료, 8969번째 에피소드 시작
itmes ['A', 'B', 'I', 'M', 'N', 'Q']
Agent's local target = ['A', 'B', 'I', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동



env 초기화 완료, 9001번째 에피소드 시작
itmes ['E', 'G', 'I', 'J', 'N', 'O']
Agent's local target = ['E', 'G', 'I', 'J', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.004665859968432364
data:  0.03539335702105807
data:  0.05098822909349119
data:  0.14975670927306964


env 초기화 완료, 9002번째 에피소드 시작
itmes ['B', 'D', 'G', 'H', 'M', 'N', 'P']
Agent's local target = ['B', 'D', 'G', 'H', 'M', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9003번째 에피소드 시작
itmes ['A', 'H', 'K', 'N', 'Q']
Agent's local target = ['A', 'H', 'K', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9004번째 에피소드 시작
itmes ['E', 'H', 'I', 'K', 'L', 'N']
Agent's local target = ['E', 'H', 'I', 'K', 'L', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화



env 초기화 완료, 9037번째 에피소드 시작
itmes ['A', 'D', 'E', 'J', 'M', 'O']
Agent's local target = ['A', 'D', 'E', 'J', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 2, 0.1)]
data:  0.0
data:  0.004724925843097277
data:  0.03561562188512919
data:  0.058082427175172736
data:  0.15011681385414152


env 초기화 완료, 9038번째 에피소드 시작
itmes ['A', 'D', 'F', 'H', 'L', 'M']
Agent's local target = ['A', 'D', 'F', 'H', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
actio



env 초기화 완료, 9067번째 에피소드 시작
itmes ['C', 'J', 'M', 'N', 'Q']
Agent's local target = ['C', 'J', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9068번째 에피소드 시작
itmes ['C', 'E', 'J', 'K', 'O']
Agent's local target = ['C', 'E', 'J', 'K', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9069번째 에피소드 시작
itmes ['E', 'F', 'K', 'Q']
Agent's local target = ['E', 'F', 'K', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9070번째 에피소드 시작
itmes ['B', 'E', 'G', 'H', 'M', 'N']
Agent's local target = ['B', 'E', 'G', 'H', 'M', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9071번째 에피소드 시작
itmes ['B', 'K', 'L', 'M', 'N', 'O']
Agent's local target = ['B', 'K', 'L', 'M', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9072번째 에피소드 시작
itmes ['E', 'F', 'M', 'O']
Agent's local target = ['E', 'F', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:



env 초기화 완료, 9103번째 에피소드 시작
itmes ['D', 'I', 'K', 'O']
Agent's local target = ['D', 'I', 'K', 'O']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9104번째 에피소드 시작
itmes ['A', 'B', 'E', 'L', 'N', 'Q']
Agent's local target = ['A', 'B', 'E', 'L', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9105번째 에피소드 시작
itmes ['E', 'F', 'H', 'K', 'P']
Agent's local target = ['E', 'F', 'H', 'K', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.004863016157036681
data:  0.036119798337793045
data:  0.05146682093558001
data:  0.15074562854697113



env 초기화 완료, 9139번째 에피소드 시작
itmes ['A', 'B', 'D', 'F', 'G', 'H', 'O']
Agent's local target = ['A', 'B', 'D', 'F', 'G', 'H', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.05181067198735468
data:  0.15122384528051136
data:  0.05136245120594118
data:  0.1512287228959833
data:  0.019535386805153935
dat

action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.05877144326075636
data:  0.15182650949996895
data:  0.051606712121369545
data:  0.15183132684901895


env 초기화 완료, 9173번째 에피소드 시작
itmes ['B', 'C', 'F', 'J', 'K']
Agent's local target = ['B', 'C', 'F', 'J', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9174번째 에피소드 시작
itmes ['B', 'E', 'I', 'L', 'O', 'Q']
Agent's local target = ['B', 'E', 'I', 'L', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9175번째 에피소드 시작
itmes ['A', 'C', 'D', 'E', 'K', 'O', 'P']
Agent's local target = ['A', 'C', 'D', 'E', 'K', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.019645586069394455
data:  0.15185614371633405


env 초기화 완료, 9176번째 에피소드 시작
itmes ['B', 'F', 'G', 'H', 'I']
Agent's local target = ['B', 'F', 'G', 'H

action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9207번째 에피소드 시작
itmes ['A', 'B', 'E', 'H', 'I', 'M', 'Q']
Agent's local target = ['A', 'B', 'E', 'H', 'I', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9208번째 에피소드 시작
itmes ['E', 'F', 'O', 'P', 'Q']
Agent's local target = ['E', 'F', 'O', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (8, 4, 0.1), (8, 3, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.05202953636232641
data:  0.15234319744670693
data:  0.05203433340869018
data:  0.036467155552978185
data:  0.05900025659711965
data:  0.15234796312696228


env 초기화 완료, 9209번째 에피소드 시작
itmes [

action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9241번째 에피소드 시작
itmes ['A', 'B', 'C', 'K', 'L', 'M', 'O']
Agent's local target = ['A', 'B', 'C', 'K', 'L', 'M', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9242번째 에피소드 시작
itmes ['B', 'J', 'L', 'O', 'P', 'Q']
Agent's local target = ['B', 'J', 'L', 'O', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9243번째 에피소드 시작
itmes ['A', 'C', 'E', 'J', 'P', 'Q']
Agent's local target = ['A', 'C', 'E', 'J', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9244번째 에피소드 시작
itmes ['A', 'B', 'I', 'L', 'M', 'Q']
Agent's local target = ['A', 'B', 'I', 'L', 'M', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9245번째 에피소드 시작
itmes ['F', 'G', 'J', 'L', 'P']
Agent's local target = ['F', 'G', 'J', 'L', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9246번째 에피소드 시작
itmes ['C', 'D', 'G', 'H', 'I', 'L', 'M']
Agent's local target = ['C', 'D', 'G', 'H', 'I', 'L', 'M']
action : 3
부딪힘
[(9, 5, 0.1)]
d



env 초기화 완료, 9275번째 에피소드 시작
itmes ['C', 'E', 'F', 'G', 'L', 'M']
Agent's local target = ['C', 'E', 'F', 'G', 'L', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9276번째 에피소드 시작
itmes ['C', 'G', 'H', 'I', 'K', 'L', 'P']
Agent's local target = ['C', 'G', 'H', 'I', 'K', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9277번째 에피소드 시작
itmes ['B', 'C', 'H', 'K', 'L', 'P']
Agent's local target = ['B', 'C', 'H', 'K', 'L', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9278번째 에피소드 시작
itmes ['B', 'E', 'G', 'I', 'M', 'N', 'Q']
Agent's local target = ['B', 'E', 'G', 'I', 'M', 'N', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9279번째 에피소드 시작
itmes ['B', 'F', 'G', 'H', 'I', 'K', 'P']
Agent's local target = ['B', 'F', 'G', 'H', 'I', 'K', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9280번째 에피소드 시작
itmes ['A', 'D', 'P']
Agent's local target = ['A', 'D', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9281번째 에피소드 시작
itmes ['A',

부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9350번째 에피소드 시작
itmes ['J', 'K', 'Q']
Agent's local target = ['J', 'K', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9351번째 에피소드 시작
itmes ['B', 'D', 'G', 'K', 'N', 'O', 'P']
Agent's local target = ['B', 'D', 'G', 'K', 'N', 'O', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.019969873276307264
data:  0.15434407914531695


env 초기화 완료, 9352번째 에피소드 시작
itmes ['B', 'C', 'D', 'E', 'H', 'J', 'L']
Agent's local target = ['B', 'C', 'D', 'E', 'H', 'J', 'L']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9353번째 에피소드 시작
itmes ['A', 'C', 'N', 'O', 'P']
Agent's local target = ['A', 'C', 'N', 'O', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9354번째 에피소드 시작
itmes ['A', 'B', 'F', 'G', 'N']
Agent's local target = ['A', 'B', 'F', 'G', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9355번째 에피소드 시작
itmes ['A', 'D', 'F', 

data:  0.0


env 초기화 완료, 9385번째 에피소드 시작
itmes ['A', 'D', 'E', 'H', 'K', 'N', 'P']
Agent's local target = ['A', 'D', 'E', 'H', 'K', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9386번째 에피소드 시작
itmes ['B', 'I', 'L', 'O']
Agent's local target = ['B', 'I', 'L', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9387번째 에피소드 시작
itmes ['C', 'F', 'G', 'I', 'K', 'Q']
Agent's local target = ['C', 'F', 'G', 'I', 'K', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9388번째 에피소드 시작
itmes ['D', 'G', 'H', 'L', 'O', 'Q']
Agent's local target = ['D', 'G', 'H', 'L', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9389번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'J', 'N', 'P']
Agent's local target = ['A', 'B', 'E', 'G', 'J', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9390번째 에피소드 시작
itmes ['G', 'H', 'L', 'N', 'Q']
Agent's local target = ['G', 'H', 'L', 'N', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9391번째 에피소드 시작
itmes ['A'



env 초기화 완료, 9421번째 에피소드 시작
itmes ['A', 'C', 'O', 'P', 'Q']
Agent's local target = ['A', 'C', 'O', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9422번째 에피소드 시작
itmes ['D', 'E', 'J', 'K', 'N', 'P']
Agent's local target = ['D', 'E', 'J', 'K', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9423번째 에피소드 시작
itmes ['F', 'I', 'N', 'O', 'P']
Agent's local target = ['F', 'I', 'N', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9424번째 에피소드 시작
itmes ['C', 'I', 'N', 'O']
Agent's local target = ['C', 'I', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (6, 5, 0.1), (7, 5, 0.1



env 초기화 완료, 9453번째 에피소드 시작
itmes ['C', 'F', 'H', 'M', 'P']
Agent's local target = ['C', 'F', 'H', 'M', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 3, 0.1)]
data:  0.0
data:  0.020113858974531863
data:  0.15565282340635794


env 초기화 완료, 9454번째 에피소드 시작
itmes ['B', 'E', 'G', 'M', 'O', 'P']
Agent's local target = ['B', 'E', 'G', 'M', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9455번째 에피소드 시작
itmes ['E', 'G', 'H', 'J', 'M', 'N', 'Q']
Agent's local target = ['E', 'G', 'H', 'J', 'M', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.02012184758863441
data:  0.15565725812401732
data:  0.0619780722424772
data:  0.1556616923982049


env 초기화 완료, 9456번째 에



env 초기화 완료, 9488번째 에피소드 시작
itmes ['D', 'E', 'G', 'H', 'K', 'M', 'P']
Agent's local target = ['D', 'E', 'G', 'H', 'K', 'M', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9489번째 에피소드 시작
itmes ['D', 'H', 'I', 'N', 'O', 'Q']
Agent's local target = ['D', 'H', 'I', 'N', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9490번째 에피소드 시작
itmes ['B', 'E', 'H', 'J', 'M', 'P', 'Q']
Agent's local target = ['B', 'E', 'H', 'J', 'M', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9491번째 에피소드 시작
itmes ['B', 'C', 'E', 'J', 'Q']
Agent's local target = ['B', 'C', 'E', 'J', 'Q']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9492번째 에피소드 시작
itmes ['B', 'D', 'H', 'J']
Agent's local target = ['B', 'D', 'H', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9493번째 에피소드 시작
itmes ['B', 'G', 'H', 'J', 'L']
Agent's local target = ['B', 'G', 'H', 'J', 'L']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9,



env 초기화 완료, 9561번째 에피소드 시작
itmes ['A', 'B', 'C', 'H', 'J', 'M', 'N']
Agent's local target = ['A', 'B', 'C', 'H', 'J', 'M', 'N']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9562번째 에피소드 시작
itmes ['A', 'B', 'E', 'G', 'O']
Agent's local target = ['A', 'B', 'E', 'G', 'O']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9563번째 에피소드 시작
itmes ['A', 'B', 'C', 'G', 'J', 'K', 'P']
Agent's local target = ['A', 'B', 'C', 'G', 'J', 'K', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9564번째 에피소드 시작
itmes ['C', 'D', 'H', 'K', 'M', 'N', 'P']
Agent's local target = ['C', 'D', 'H', 'K', 'M', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9565번째 에피소드 시작
itmes ['A', 'E', 'H', 'I', 'M', 'P']
Agent's local target = ['A', 'E', 'H', 'I', 'M', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9566번째 에피소드 시작
itmes ['A', 'C', 'H', 'L', 'N']
Agent's local target = ['A', 'C', 'H', 'L', 'N']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
a



env 초기화 완료, 9638번째 에피소드 시작
itmes ['F', 'I', 'L', 'M', 'N', 'P']
Agent's local target = ['F', 'I', 'L', 'M', 'N', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 0
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (6, 4, 0.1)]
data:  0.0
data:  0.0625209174930827
data:  0.15686385671526187


env 초기화 완료, 9639번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'I', 'N', 'O']
Agent's local target = ['B', 'C', 'E', 'F', 'I', 'N', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.05309344062723462
data:  0.041022204361309746
data:  0.06252466540133339

data:  0.0
data:  0.020349484855017738
data:  0.15726260589286803
data:  0.06268710898614148
data:  0.04107399833065952
data:  0.053192194436977785
data:  0.15726687963227876


env 초기화 완료, 9672번째 에피소드 시작
itmes ['D', 'E', 'F', 'J', 'N', 'O']
Agent's local target = ['D', 'E', 'F', 'J', 'N', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9673번째 에피소드 시작
itmes ['A', 'D', 'F', 'G', 'H', 'N', 'P']
Agent's local target = ['A', 'D', 'F', 'G', 'H', 'N', 'P']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9674번째 에피소드 시작
itmes ['C', 'E', 'O', 'Q']
Agent's local target = ['C', 'E', 'O', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9675번째 에피소드 시작
itmes ['B', 'C', 'E', 'F', 'H', 'L', 'N']
Agent's local target = ['B', 'C', 'E', 'F', 'H', 'L', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9676번째 에피소드 시작
itmes ['D', 'F', 'N', 'P', 'Q']
Agent's local target = ['D', 'F', 'N', 'P', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9677번째 에피소드 시작
itmes 



env 초기화 완료, 9705번째 에피소드 시작
itmes ['C', 'D', 'E', 'H', 'I', 'P']
Agent's local target = ['C', 'D', 'E', 'H', 'I', 'P']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.020437263218120345
data:  0.15778635227136162


env 초기화 완료, 9706번째 에피소드 시작
itmes ['E', 'G', 'H', 'L', 'M', 'O']
Agent's local target = ['E', 'G', 'H', 'L', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.053450195111180064
data:  0.1577905736361345
data:  0.05345485009166895
data:  0.15779479457877088


env 초기화 완료, 9707번째 에피소드 시작
itmes ['A', 'E', 'F', 'G', 'H']
Agent's local target = ['A', 'E', 'F', 'G', 'H']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
a



env 초기화 완료, 9776번째 에피소드 시작
itmes ['F', 'H', 'I', 'J', 'Q']
Agent's local target = ['F', 'H', 'I', 'J', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9777번째 에피소드 시작
itmes ['B', 'D', 'F', 'J', 'L', 'N', 'P']
Agent's local target = ['B', 'D', 'F', 'J', 'L', 'N', 'P']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9778번째 에피소드 시작
itmes ['A', 'B', 'D', 'E', 'J', 'L', 'O']
Agent's local target = ['A', 'B', 'D', 'E', 'J', 'L', 'O']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9779번째 에피소드 시작
itmes ['A', 'B', 'C', 'G', 'K', 'N', 'P']
Agent's local target = ['A', 'B', 'C', 'G', 'K', 'N', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9780번째 에피소드 시작
itmes ['E', 'F', 'G', 'I', 'L', 'M']
Agent's local target = ['E', 'F', 'G', 'I', 'L', 'M']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (



env 초기화 완료, 9809번째 에피소드 시작
itmes ['A', 'D', 'E', 'N', 'Q']
Agent's local target = ['A', 'D', 'E', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.020508841045321063
data:  0.15973073724706674


env 초기화 완료, 9810번째 에피소드 시작
itmes ['D', 'E', 'I', 'N', 'Q']
Agent's local target = ['D', 'E', 'I', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 0
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (8, 4, 0.1), (8, 5, 0.1)]
ac



env 초기화 완료, 9844번째 에피소드 시작
itmes ['A', 'D', 'E', 'F', 'P', 'Q']
Agent's local target = ['A', 'D', 'E', 'F', 'P', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9845번째 에피소드 시작
itmes ['B', 'C', 'D', 'O', 'Q']
Agent's local target = ['B', 'C', 'D', 'O', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.020540632739751354
data:  0.16009088996436313


env 초기화 완료, 9846번째 에피소드 시작
itmes ['A', 'B', 'G', 'H', 'K', 'O', 'Q']
Agent's local target = ['A', 'B', 'G', 'H', 'K', 'O', 'Q']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기화 완료, 9847번째 에피소드 시작
itmes ['C', 'F', 'I', 'J', 'K', 'N', 'Q']
Agent's local target = ['C', 'F', 'I', 'J', 'K', 'N', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 2
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0

action : 3
이동
[(8, 4, 0.1), (8, 5, 0.1)]
action : 1
부딪힘
[(8, 4, 0.1), (8, 5, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.0551166230725783
data:  0.16055467206477161


env 초기화 완료, 9879번째 에피소드 시작
itmes ['B', 'F', 'G', 'H', 'N', 'P', 'Q']
Agent's local target = ['B', 'F', 'G', 'H', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.02056446816622787
data:  0.16055861659756512


env 초기화 완료, 9880번째 에피소드 시작
itmes ['B', 'C', 'F', 'K', 'Q']
Agent's local target = ['B', 'C', 'F', 'K', 'Q']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9881번째 에피소드 시작
itmes ['A', 'D', 'F', 'H', 'I', 'K', 'M']
Agent's local target = ['A', 'D', 'F', 'H', 'I', 'K', 'M']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9882번째 에피소드 시작
itmes ['B', 'C', 'D', 'E', 'I', 'J']
Agent's local target = ['B', 'C', 'D', 'E', 'I', 'J']
action : 1
나감
[(10, 4, 0.1)]
data:  0.0


env 초기화 완료, 9883번째 에피소드 시작
itmes ['D', 



env 초기화 완료, 9913번째 에피소드 시작
itmes ['B', 'D', 'F', 'I', 'J', 'K', 'M']
Agent's local target = ['B', 'D', 'F', 'I', 'J', 'K', 'M']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9914번째 에피소드 시작
itmes ['B', 'G', 'I', 'N', 'P', 'Q']
Agent's local target = ['B', 'G', 'I', 'N', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (8, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (8, 3, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.020596237613147203
data:  0.16116573228799894
data:  0.054456603655789707
data:  0.16116961571477015


env 초기화 완료, 9915번째 에피소드 시작
itmes ['C', 'F', 'G', 'H', 'J', 'K']
Agent's local target = ['C', 'F', 'G', 'H', 'J', 'K']
action : 2
부딪힘
[(9, 3, 0.1)]
data:  0.0


env 초기화 완료, 9916번째 에피소드 시작
itmes ['A', 'C', 'F', 'G', 'N']
Agent's local target = ['A', 'C', 'F', 'G', 'N']
action : 3
부딪힘
[(9, 5, 0.1)]
data:  0.0


env 초기



env 초기화 완료, 9947번째 에피소드 시작
itmes ['B', 'D', 'F', 'I', 'L', 'M', 'O']
Agent's local target = ['B', 'D', 'F', 'I', 'L', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (9, 4, 0.1)]
action : 1
나감
[(8, 4, 0.1), (9, 4, 0.1), (10, 4, 0.1)]
data:  0.0
data:  0.020627994354193806
data:  0.16137608259539027


env 초기화 완료, 9948번째 에피소드 시작
itmes ['F', 'G', 'H', 'I', 'L', 'P', 'Q']
Agent's local target = ['F', 'G', 'H', 'I', 'L', 'P', 'Q']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1)]
action : 3
부딪힘
[(8, 4, 0.1), (7, 4, 0.1), (8, 4, 0.1), (9, 4, 0.1), (9, 5, 0.1)]
data:  0.0
data:  0.020635931554758388
data:  0.16137994498713074
data:  0.06480973592299498
data:  0.16138380699263202


env 초기화 완료, 9949번째 에피소드 시작
itmes ['C', 'E', 'G', 'K', 'L', 'O', 'P']
Agent's local target = ['C', 'E', 'G', 'K', 'L', 'O', 'P']
action : 3
부딪힘
[(9, 5, 0.1)]




env 초기화 완료, 9982번째 에피소드 시작
itmes ['C', 'G', 'I', 'K', 'L', 'M', 'O']
Agent's local target = ['C', 'G', 'I', 'K', 'L', 'M', 'O']
action : 0
이동
[(8, 4, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1)]
action : 2
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1)]
action : 0
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1)]
action : 1
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1)]
action : 3
이동
[(8, 4, 0.1), (7, 4, 0.1), (7, 5, 0.1), (7, 4, 0.1), (7, 3, 0.1), (8, 3, 0.1), (7, 3, 0.1), (6, 3, 0.1), (7, 3, 0.1), (7, 4, 0.1)]
actio

In [10]:
from google.colab import drive
drive.mount('/content/drive')

Mounted at /content/drive


# 몬테카를로 prediction 4방향 랜덤 정책 구현
* 값이 정확하게 나오지 않을 뿐더러 이 방법은 매번 골 포인트가 달라지니 엄청나게 많은 계산을 해야되고 매번 골 포인트가 바뀔때마다 다시 계산을 해야되서 좋지 않은 방법이라 생각을 했다.
