In [13]:
import numpy as np
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import SimpleRNN, Dense

# 입력 데이터 (1개의 타임스텝을 가진 시퀀스)
X = np.array([[0], [1], [2], [3], [4]])  # 입력 시퀀스
y = np.array([[0], [2], [4], [6], [8]])  # 각 입력의 2배가 출력


# 모델 생성
model = Sequential([
    SimpleRNN(10, input_shape=(1, 1)),  # 입력: 시퀀스 길이 1, 피처 1개
    Dense( units=32),
    Dense(1)  # 출력: 하나의 값
])

model.compile(optimizer='adam', loss='mse')
model.fit(X, y, epochs=300)

# 예측
pred = model.predict(X)
print("One-to-One 예측 결과:", pred)


Epoch 1/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1s/step - loss: 29.4247
Epoch 2/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - loss: 28.7417
Epoch 3/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 28.0668
Epoch 4/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 29ms/step - loss: 27.4000
Epoch 5/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 30ms/step - loss: 26.7413
Epoch 6/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 28ms/step - loss: 26.0907
Epoch 7/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 25.4483
Epoch 8/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step - loss: 24.8141
Epoch 9/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 44ms/step - loss: 24.1882
Epoch 10/300
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 31ms/step - loss: 23.5705
E

# 4번: Many-to-Many (다대다 - 순차적 출력)

Sequential API에서도 사용할 수 있습니다. 다만, Sequential API는 단일 출력만 반환하도록 설계되어 있기 때문에, return_state=True를 사용하여 출력과 상태를 동시에 반환하려면 Model 클래스를 사용하는 것이 적합

In [22]:
from tensorflow.keras.layers import SimpleRNN, Dense, Input
from tensorflow.keras.models import Model
import numpy as np

# 입력 데이터 (3개의 샘플, 각 샘플에 3개의 타임스텝, 각 타임스텝에 1개의 피처)
X = np.array([[[0], [1], [2]], [[3], [4], [5]], [[6], [7], [8]]])
y = np.array([[[0], [1], [2]], [[3], [4], [5]], [[6], [7], [8]]])
# 입력 정의
input_layer = Input(shape=(3, 1))

# SimpleRNN 생성, return_sequences=True는 전체 시퀀스 출력, return_state=True는 마지막 상태 반환
rnn_layer, final_state = SimpleRNN(10, return_sequences=True, return_state=True)(input_layer)

# 타임스텝별로 출력을 반환하는 Dense 레이어
dense1 = Dense(32)(rnn_layer)
output_layer = Dense(1)(dense1)

# 모델 생성
model = Model(inputs=input_layer, outputs=[output_layer, final_state])

# 모델 컴파일
model.compile(optimizer='adam', loss='mse')

# 모델 학습
model.fit(X, [y, np.zeros((3, 10))], epochs=100, verbose=0)

# 예측 (출력과 함께 상태 반환)
pred, final_hidden_state = model.predict(X)
print("출력 (Many-to-Many, 순차적 출력):\n", pred)
print("\n최종 상태 (Hidden state):\n", final_hidden_state)


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 125ms/step
출력 (Many-to-Many, 순차적 출력):
 [[[-0.15876538]
  [ 1.7226143 ]
  [ 2.1553352 ]]

 [[ 4.3126106 ]
  [ 4.2996025 ]
  [ 5.353817  ]]

 [[ 5.578347  ]
  [ 6.163129  ]
  [ 6.3933306 ]]]

최종 상태 (Hidden state):
 [[-0.25978673 -0.23256506  0.05586782 -0.28829595 -0.10715878 -0.6363773
  -0.14780249 -0.04316387  0.5455804  -0.46167478]
 [-0.8176178  -0.9029839   0.8741284  -0.375958   -0.5164111  -0.9448284
  -0.67586243  0.8017986   0.9578607  -0.7849558 ]
 [-0.8759755  -0.98926026  0.9718558  -0.8218534  -0.872429   -0.9948962
  -0.8541502   0.9365875   0.994036   -0.9706108 ]]


# Sequence to Sequence

####  ecoder - decoder

입력 시퀀스:      x1 → x2 → x3 → x4  ...  → xn
                   ↓   ↓   ↓   ↓         ↓
              ┌──→ h1 → h2 → h3 → h4  ...  → hn ─┐   (인코더)
              │                                ↓
              └────────────────────────────────→ z (context vector)
                                               ↓
                                         ┌────→ y1 → y2 → y3 → y4 ... → ym
                                         │        ↓   ↓   ↓   ↓       ↓
                                         └──→ 디코더  (출력 시퀀스 생성)


In [24]:
import numpy as np
from tensorflow.keras.models import Model
from tensorflow.keras.layers import SimpleRNN, Dense, Input

# 입력 시퀀스 (5개의 샘플, 각 샘플에 10개의 타임스텝, 각 타임스텝에 1개의 피처)
encoder_input_data = np.array([[[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]],
                               [[1], [2], [3], [4], [5], [6], [7], [8], [9], [10]],
                               [[2], [3], [4], [5], [6], [7], [8], [9], [10], [11]],
                               [[3], [4], [5], [6], [7], [8], [9], [10], [11], [12]],
                               [[4], [5], [6], [7], [8], [9], [10], [11], [12], [13]]])

# 출력 시퀀스 (목표 값)
decoder_target_data = np.array([[[1], [2], [3], [4], [5], [6], [7], [8], [9], [10]],
                                [[2], [3], [4], [5], [6], [7], [8], [9], [10], [11]],
                                [[3], [4], [5], [6], [7], [8], [9], [10], [11], [12]],
                                [[4], [5], [6], [7], [8], [9], [10], [11], [12], [13]],
                                [[5], [6], [7], [8], [9], [10], [11], [12], [13], [14]]])

# 1. 인코더 (Encoder)
encoder_inputs = Input(shape=(10, 1))  # 10개의 타임스텝, 1개의 피처
encoder_rnn, encoder_state = SimpleRNN(64, return_state=True)(encoder_inputs)

# 2. 디코더 (Decoder)
decoder_inputs = Input(shape=(10, 1))  # 디코더 입력 (타겟 시퀀스)
decoder_rnn = SimpleRNN(64, return_sequences=True)(decoder_inputs, initial_state=encoder_state)

dense1 = Dense(32)(decoder_rnn)
decoder_outputs = Dense(1)(dense1)
# decoder_outputs = Dense(1)(decoder_rnn)

# 인코더-디코더 모델 정의
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# 모델 컴파일 및 학습
model.compile(optimizer='adam', loss='mse')
model.fit([encoder_input_data, decoder_target_data], decoder_target_data, epochs=100)

# 모델 요약 출력
model.summary()

# 예측 예시 (입력 시퀀스와 같은 형태로 예측)
pred = model.predict([encoder_input_data, decoder_target_data])
print("\n예측 결과:\n", pred)


Epoch 1/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m2s[0m 2s/step - loss: 85.1204
Epoch 2/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step - loss: 74.7749
Epoch 3/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 35ms/step - loss: 65.2578
Epoch 4/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 56.5686
Epoch 5/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - loss: 48.6870
Epoch 6/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - loss: 41.5894
Epoch 7/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 33ms/step - loss: 35.2497
Epoch 8/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - loss: 29.6384
Epoch 9/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 32ms/step - loss: 24.7233
Epoch 10/100
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 36ms/step - loss: 20.4702
E

[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 249ms/step

예측 결과:
 [[[ 0.9439773]
  [ 1.8910663]
  [ 2.7487805]
  [ 3.9007537]
  [ 4.95953  ]
  [ 6.215344 ]
  [ 6.9487514]
  [ 8.048154 ]
  [ 9.067711 ]
  [10.136908 ]]

 [[ 2.0433624]
  [ 3.0425644]
  [ 3.9925535]
  [ 5.0247974]
  [ 5.9184303]
  [ 7.0875173]
  [ 7.9387627]
  [ 9.0663395]
  [10.12568  ]
  [11.146725 ]]

 [[ 3.104349 ]
  [ 4.067638 ]
  [ 5.162745 ]
  [ 6.056233 ]
  [ 6.9010196]
  [ 8.001297 ]
  [ 8.973932 ]
  [10.120363 ]
  [11.136688 ]
  [11.946184 ]]

 [[ 4.0859737]
  [ 5.0375423]
  [ 6.2765985]
  [ 7.051184 ]
  [ 7.906102 ]
  [ 8.988861 ]
  [10.056081 ]
  [11.129059 ]
  [11.93956  ]
  [12.4578285]]

 [[ 4.970907 ]
  [ 6.0008326]
  [ 7.3317585]
  [ 8.038061 ]
  [ 8.951372 ]
  [10.054428 ]
  [11.100317 ]
  [11.93659  ]
  [12.455445 ]
  [12.74593  ]]]


#### encoder_state: **컨텍스트 벡터 (z)**

설명:
- encoder_rnn: 인코더 RNN의 전체 출력(여러 타임스텝에서의 출력). 이 경우에는 마지막 타임스텝의 출력만 필요하므로 return_sequences=False를 기본값으로 사용해 전체 시퀀스를 반환하지 않습니다.
- encoder_state: 인코더의 마지막 타임스텝의 상태를 의미합니다. 이것이 컨텍스트 벡터로, 디코더의 초기 상태로 전달됩니다.

#### 컨텍스트 벡터 (Context Vector)의 역할:
- 인코더는 입력 시퀀스를 처리하며 각 타임스텝에서 상태를 업데이트합니다. 마지막 타임스텝에서 생성된 상태가 입력 시퀀스의 정보가 압축된 고정된 벡터입니다.
- 디코더는 이 벡터를 사용하여 입력 시퀀스에 대한 정보를 바탕으로 출력 시퀀스를 생성합니다.
이 encoder_state는 디코더의 초기 상태로 전달되어, 디코더가 출력 시퀀스를 생성할 때 참조하게 됩니다.

### z (context vector)를 출력하는 코드

In [None]:
import numpy as np
from tensorflow.keras.models import Model
from tensorflow.keras.layers import SimpleRNN, Dense, Input

# 입력 시퀀스 샘플
encoder_input_data = np.array([[[0], [1], [2], [3], [4], [5], [6], [7], [8], [9]]])

# 1. 인코더 (Encoder)
encoder_inputs = Input(shape=(10, 1))
encoder_rnn, encoder_state = SimpleRNN(64, return_state=True)(encoder_inputs)

# 2. 디코더 (Decoder)
decoder_inputs = Input(shape=(10, 1))
decoder_rnn = SimpleRNN(64, return_sequences=True)(decoder_inputs, initial_state=encoder_state)
decoder_outputs = Dense(1)(decoder_rnn)

# 인코더-디코더 모델 정의
model = Model([encoder_inputs, decoder_inputs], decoder_outputs)

# 모델 컴파일 및 학습
model.compile(optimizer='adam', loss='mse')

# 인코더 모델을 따로 정의하여 context vector 확인
encoder_model = Model(encoder_inputs, encoder_state)

# 예측을 통해 컨텍스트 벡터 확인
context_vector = encoder_model.predict(encoder_input_data)
print("컨텍스트 벡터 (z):\n", context_vector)


#### 설명:
- **encoder_model**은 인코더만을 따로 추출하여, 입력 시퀀스를 처리한 후 **마지막 상태(컨텍스트 벡터)**를 반환하도록 정의한 모델입니다.
- **context_vector**는 인코더에서 생성된 마지막 상태, 즉 **컨텍스트 벡터(z)**입니다.
- 이 값은 디코더의 초기 상태로 전달되어 출력 시퀀스를 생성하는 데 사용됩니다.

#### 결과:
- context_vector는 인코더가 입력 시퀀스를 처리한 후 마지막 타임스텝에서 반환한 64차원의 벡터입니다. 이는 입력 시퀀스의 정보를 압축한 값으로, 디코더에서 출력 시퀀스를 생성할 때 참조합니다.

#### 요약:
- **컨텍스트 벡터 (z)**는 인코더의 마지막 상태를 나타내며, 입력 시퀀스의 전체 정보를 요약한 벡터입니다.
- 디코더는 이 벡터를 기반으로 출력 시퀀스를 생성합니다.
- 위 코드에서 encoder_state가 바로 컨텍스트 벡터이며, 이를 디코더로 전달하여 출력 시퀀스를 생성합니다.