In [1]:
import import_ipynb
import collections
import datetime
import os
import shutil #shutil 모듈은 파일과 파일 모음에 대한 여러 가지 고수준 연산을 제공합니다. 
#특히, 파일 복사와 삭제를 지원하는 함수가 제공됩니다. 

import tensorflow as tf
import numpy as np
import distutils.util


class ModelStatsParams:
    def __init__(self,
                 save_model='models/save_model',
                 moving_average_length=20):
        self.save_model = save_model
        self.moving_average_length = moving_average_length
        self.log_file_name = datetime.datetime.now().strftime("%Y%m%d-%H%M%S")
        #'20210511-211656' : 년/달/날짜 - 시/분/초
        self.training_images = False


class ModelStats:

    def __init__(self, params: ModelStatsParams, display, force_override=False):
        self.params = params
        self.display = display #?

        self.evaluation_value_callback = None
        self.env_map_callback = None
        self.log_value_callbacks = []
        self.trajectory = []

        self.log_dir = "logs/training/" + params.log_file_name
        #ex) 'logs/training/20210511-212027'
        self.tensorboard_callback = tf.keras.callbacks.TensorBoard(log_dir=self.log_dir,
                                                                   histogram_freq=100)
        #log_dir : the path of the directory where to save the log files to be parsed by TensorBoard.
        #histogram_freq : frequency (in epochs) at which to compute activation and weight histograms for the layers of the model.
        self.model = None

        if os.path.isdir(self.log_dir): #self.log_dir이 존재할 경우 True 리턴
            if force_override:
                shutil.rmtree(self.log_dir) #지정된 폴더와 하위 디렉토리 폴더, 파일를 모두 삭제
            else:
                print(self.log_dir, 'already exists.')
                resp = input('Override log file? [Y/n]\n') # Y or n을 input으로 받음
                if resp == '' or distutils.util.strtobool(resp):
                    #rest == '' : input에서 아무것도 치지 않음(즉, 빈칸 입력)
                    #strtobool : Convert a string representation of truth to true (1) or false (0).
                    #strtobool('true', '1', 'y', 'yes') = 1
                    print('Deleting old log dir')
                    shutil.rmtree(self.log_dir) #지정된 폴더와 하위 디렉토리 폴더, 파일를 모두 삭제
                else:
                    raise AttributeError('Okay bye') #raise : 사용자가 직접 오류를 일으킴

        self.training_log_writer = tf.summary.create_file_writer(self.log_dir + '/training')
        self.testing_log_writer = tf.summary.create_file_writer(self.log_dir + '/test')
        #tf.summary.create_file_writer : 주어진 log_dir로 summary file 만듬

        
        self.evaluation_deque = collections.deque(maxlen=params.moving_average_length)
        #maxlen=params.moving_average_length인 비어있는 deque(double-ended-queue) 생성
        self.eval_best = -float('inf') #-float('inf') = -inf
        self.bar = None

    def set_evaluation_value_callback(self, callback: callable): 
        #callback에 들어오는 것을 callable 즉, 객체로호출가능하게 설정하고 그 객체를 def에서 사용(이렇게 이해함)
        #physics.ipynb에서 callback = get_cral로 사용함
        #get_cral = self.get_collection_ratio() * self.state.all_landed
        self.evaluation_value_callback = callback

    #environoment.ipynb에서 사용함
    def add_experience(self, experience):
        self.trajectory.append(experience)

    #Agent.ipynb에서 사용함
    def set_model(self, model):
        self.tensorboard_callback.set_model(model)
        #set_model : Sets Keras model and writes graph if specified.
        self.model = model

    #BaseGrid.ipynb에서 사용함
    def set_env_map_callback(self, callback: callable):
        self.env_map_callback = callback

    #GridRewards.ipynb에서 사용
    def add_log_data_callback(self, name: str, callback: callable):
        self.log_value_callbacks.append((name, callback))

    def log_training_data(self, step):

        with self.training_log_writer.as_default():
            #with구문에서 self.training_log_writer을 기본값으로 설정
            #with구문은 코드 실행이 시작 할 때 설정이 필요하고 코드가 종료 되는 
            #시점에 해제가 필요한 경우에 사용하면 편리한 문법이다.
            self.log_data(step, self.params.training_images)

    def log_testing_data(self, step):
        with self.testing_log_writer.as_default():
            #with구문에서 self.testig_log_writer을 기본값으로 설정
            self.log_data(step)

        if self.evaluation_value_callback: 
            #get_collection_ratio()의 값은 모르지만 state.all_landed 즉, 모든 agent가 land -> True가 되면 
            #evaluationo_deque에 추가를 한다. get_collection_ratio 값을
            self.evaluation_deque.append(self.evaluation_value_callback())

    def log_data(self, step, images=True):

        for callback in self.log_value_callbacks:
            tf.summary.scalar(callback[0], callback[1](), step=step)
            #scalar summary 작성(주로 accuracy, cost(loss)와 같은 scalar 텐서에 사용)
            #callback[1]()에서 ()있는 이유는 GridRewards에서 def get_cumulative_reward(self):로 정의를 했기 때문
        if images:
            trajectory = self.display.display_episode(self.env_map_callback(), trajectory=self.trajectory)
            tf.summary.image('trajectory', trajectory,
                             step=step)
            #image가 있다면 image형 summary 제시

    def save_if_best(self):
        print('self.evaluation_deque:', self.evaluation_deque)
        
        if len(self.evaluation_deque) < self.params.moving_average_length:
            #self.evaluation_deque의 길이가 moving_average_length임을 감안하면 deque = 50으로 가득찼을 때
            #아래 함수 실행
            return

        eval_mean = np.mean(self.evaluation_deque) #deque에 대해서 전체 평균 내기
        print('eval_mean:', eval_mean)
        if eval_mean > self.eval_best:
            self.eval_best = eval_mean
            if self.params.save_model != '':
                print('Saving best with:', eval_mean)
                self.model.save_weights(self.params.save_model + '_best')
                #해당 경로의 model의 weights 저장 'models/save_model' + '_best'

    def get_log_dir(self):
        return self.log_dir

    def training_ended(self):

        if self.params.save_model != '':
            self.model.save_weights(self.params.save_model + '_unfinished')
            print('Model saved as', self.params.save_model + '_unfinished')

    def save_episode(self, save_path):
        f = open(save_path + ".txt", "w")
        #파일이름 , w : 쓰기모드

        for callback in self.log_value_callbacks:
            f.write(callback[0] + ' ' + str(callback[1]()) + '\n')
        f.close()

    def on_episode_begin(self, episode_count):
        self.tensorboard_callback.on_epoch_begin(episode_count) #Called at the start of an epoch.(only train)
        self.trajectory = []

    def on_episode_end(self, episode_count):
        self.tensorboard_callback.on_epoch_end(episode_count) #Called at the end of an epoch.(only train)