모델의 웨이트를 얻어오는 방법을 공부하겠습니다. 그러기 위해서 일단 다음과 같이 모델을 만듭니다.

In [1]:
# 2 -> 3 -> 2 -> 1

import tensorflow.keras as keras
import numpy as np

x_train = np.array( [[0,1], [2,3], [4,5]] )
y_train = np.array( [ [x.sum()] for x in x_train ] )
print("x_train"); print(x_train)
print("y_train"); print(y_train)
x_test = np.array( [[6,7], [8,9]] )
y_test = np.array( [ [x.sum()] for x in x_test ] )
print("x_test"); print(x_test)
print("y_test"); print(y_test)

d1 = keras.layers.Dense( 3, name='d1' )
d2 = keras.layers.Dense( 2, name='d2' )
d3 = keras.layers.Dense( 1, name='d3' )

x = keras.layers.Input( shape=(2,), name='x' )
d1_out = d1(x)
d2_out = d2(d1_out)
d3_out = d3(d2_out)

model = keras.models.Model(x, d3_out)
model.summary()

x_train
[[0 1]
 [2 3]
 [4 5]]
y_train
[[1]
 [5]
 [9]]
x_test
[[6 7]
 [8 9]]
y_test
[[13]
 [17]]
Model: "model"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
x (InputLayer)               [(None, 2)]               0         
_________________________________________________________________
d1 (Dense)                   (None, 3)                 9         
_________________________________________________________________
d2 (Dense)                   (None, 2)                 8         
_________________________________________________________________
d3 (Dense)                   (None, 1)                 3         
Total params: 20
Trainable params: 20
Non-trainable params: 0
_________________________________________________________________


레이어를 담은 변수를 바로 사용하거나 모델의 레이어를 이름을 지정하여 레이어를 가지고 오고 그 레이어의 웨이트를 프린트해보면 리스트 형식으로 나오는데 첫번째 원소는 입력에 곱해질 웨이트 들로 이루어진 넘파이 어레이고 두번째 원소는 웨이트를 곱한 후 더해줄 바이어스들로 이루어진 넘파이 어레이입니다. 웨이트의 행의 갯수는 입력의 원소의 갯수, 즉 전 레이어의 노드수이고 열의 갯수는 현재레이어의 출력의 갯수, 즉 현재 레이어의 노드 수 입니다.

In [2]:
d1_weights = d1.get_weights()
print('d1_weights'); print(d1_weights, '\n')
# 만약 순차모델로 만들었거나 레이어를 가리키는 변수 d1 을 정의하지 않았다면
# 다음과 같이 이름으로 레이어를 가지고 올수 있다.
d1 = model.get_layer('d1')
d1_weights = d1.get_weights()
print('d1_weights'); print(d1_weights, '\n')

print('d1_weights')
print(d1_weights[0])
print(d1_weights[1], '\n')

d1_weights
[array([[-0.57954854,  0.03897893, -1.0474204 ],
       [-1.0065249 ,  1.0086961 , -0.98431623]], dtype=float32), array([0., 0., 0.], dtype=float32)] 

d1_weights
[array([[-0.57954854,  0.03897893, -1.0474204 ],
       [-1.0065249 ,  1.0086961 , -0.98431623]], dtype=float32), array([0., 0., 0.], dtype=float32)] 

d1_weights
[[-0.57954854  0.03897893 -1.0474204 ]
 [-1.0065249   1.0086961  -0.98431623]]
[0. 0. 0.] 



set_weights 로 웨이트를 지정해 넣어줄 수 있습니다. 첫번째 Dense 레이어에 특정 웨이트를 넣어준후 다시 프린트해보면 넣어준 값으로 웨이트들이 변해있는것을 알 수 있습니다.

In [3]:
weights = [ np.array([[1,3,5],[2,4,6]], np.float32), np.array([1,2,3], np.float32) ]
d1 = model.get_layer('d1')
d1.set_weights(weights)
d1_weights = d1.get_weights()
print('d1_weights')
print(d1_weights[0])
print(d1_weights[1])

d1_weights
[[1. 3. 5.]
 [2. 4. 6.]]
[1. 2. 3.]


두번째 덴스 레이어에도 웨이트를 넣어주고 확인해 봅니다.

In [4]:
weights = [ np.array([[1,4],[2,5],[3,6]], np.float32), np.array([1,2], np.float32) ]
d2 = model.get_layer('d2')
d2.set_weights(weights)
d2_weights = d2.get_weights()
print('d2_weights')
print(d2_weights[0])
print(d2_weights[1])

d2_weights
[[1. 4.]
 [2. 5.]
 [3. 6.]]
[1. 2.]


세번째 덴스 레이어에도 웨이트를 넣어주고 확인해 봅니다.

In [5]:
weights = [ np.array([[1],[2]], np.float32), np.array([1], np.float32) ]
d3 = model.get_layer('d3')
d3.set_weights(weights)
d3_weights = d3.get_weights()
print('d3_weights')
print(d3_weights[0])
print(d3_weights[1])

d3_weights
[[1.]
 [2.]]
[1.]


레이어와 입력을 받으면 그 레이어의 출력을 계산하는 함수를 만들어 봅니다.

In [6]:
def compute_layer_output(layer, input_batch):
    weights = layer.get_weights()
    return np.matmul(input_batch, weights[0]) + weights[1]

첫번째 덴스레이어의 중간 출력과 위의 함수로 계산한 결과가 같은지 확인합니다.

In [7]:
model_d1 = keras.models.Model(model.input, d1.output)
model_d1.summary()
d1_predict = model_d1.predict( x_test )
d1_out = compute_layer_output( d1, x_test )
print('d1_predict'); print(d1_predict)
print('d1_out'); print(d1_out)

Model: "model_1"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
x (InputLayer)               [(None, 2)]               0         
_________________________________________________________________
d1 (Dense)                   (None, 3)                 9         
Total params: 9
Trainable params: 9
Non-trainable params: 0
_________________________________________________________________
d1_predict
[[21. 48. 75.]
 [27. 62. 97.]]
d1_out
[[21. 48. 75.]
 [27. 62. 97.]]


모델의 최종 출력과 우리가 만든 함수로 계산한 결과가 같은지 확인합니다.

In [8]:
d1_out = compute_layer_output( d1, x_test )
d2_out = compute_layer_output( d2, d1_out )
d3_out = compute_layer_output( d3, d2_out )

print('d3_out'); print(d3_out)
print('model predict'); print(model.predict(x_test))

d3_out
[[1896.]
 [2448.]]
model predict
[[1896.]
 [2448.]]
