# 6.5 구현하기: 아담 모델 클래스

## 6.5.1 기반 클래스 파일 실행시키기

In [1]:
%run ../chap05/mlp_model.ipynb

## 6.5.2 AdamModel 클래스 선언

In [2]:
class AdamModel(MlpModel):
    def __init__(self, name, dataset, hconfigs):
        self.use_adam = False
        super(AdamModel, self).__init__(name, dataset, hconfigs)

## 6.5.3 신경망 역전파 메서드 재정의

In [3]:
def adam_backprop_layer(self, G_y, hconfig, pm, aux):
    x, y = aux
    
    if hconfig is not None: G_y = relu_derv(y) * G_y
        
    g_y_weight = x.transpose()
    g_y_input = pm['w'].transpose()
    
    G_weight = np.matmul(g_y_weight, G_y)
    G_bias = np.sum(G_y, axis = 0)
    G_input = np.matmul(G_y, g_y_input)
    
    self.update_param(pm, 'w', G_weight) # 파라미터 값을 직접고 치던 것을 update_param() 메서드를 호출해 처리
    self.update_param(pm, 'b', G_bias)
    
    return G_input

AdamModel.backprop_layer = adam_backprop_layer

## 6.5.4  파라미터 수정 메서드 정의

In [4]:
def adam_update_param(self, pm, key, delta):
    if self.use_adam:
        delta = self.eval_adam_delta(pm, key, delta)
    
    pm[key] -= self.learning_rate * delta
    
AdamModel.update_param = adam_update_param

## 6.5.5 두 가지 파라미터 수정 메서드 정의

In [None]:
def adam_eval_adam_delta(self, pm, key, delta):
    ro_1 = 0.9
    ro_2 = 0.999
    epsilon = 1.0e-8
    
    skey, tkey, step = 's' + key, 't' + key, 'n' + key
    if skey not in pm:
        pm[skey] = np.zeros(pm[key].shape)
        pm[tkey] = np.zeros(pm[key].shape)
        pm[step] = 0
        
    s = pm[skey] = ro_1 * pm[skey] + (1 - ro_1) * delta
    t = pm[tkey] = ro_2 * pm[tkey] + (1 - ro_2) * (delta * delta)
    
    pm[step] += 1
    s = s / (1 - np.power(ro_1, pm[step]))
    t = t / (1 - np.power(ro_2, pm[step]))
    
    return s / (np.sqrt(t) + epsilon)

AdamModel.eval_adam_delta = adam_eval_adam_delta