<a href="https://colab.research.google.com/github/ancestor9/2025_Winter_Deep-Learning-with-TensorFlow/blob/main/20260121_05_RNN/Understanding_of_RNN.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<img src = 'https://i.imgur.com/rg4iG2p.png'>

## **RNN을 통한 데이터 변환 : Representation Data**

### 1. 데이터 변환 과정 (차원 확대)
- **입력(Input)**  
  - 100일 × 하루 32개 변수  
  - 총 데이터 수: **3,200 (100 × 32)**

- **RNN 처리**  
  - 매 시점마다 32개 입력 → **64개 내부 특징(feature)**으로 변환  
  - 시간 정보를 반영하며 순차적으로 처리

- **출력(Output)**  
  - 100일 × 하루 64개 특징  
  - 총 데이터 수: **6,400 (100 × 64)**

---

### 2. 32 → 64로 늘린 이유 (Feature Expansion)
- 더 **풍부하고 복합적인 패턴**을 표현하기 위함
- 관측된 원시 지표를 넘어,  
  - 시간적 의존성  
  - 잠재적 패턴  
  - 추상적 의미  
  를 내부 상태로 학습

**예시**
- 입력 32개: 온도, 습도, 거래량 등 관측값  
- 출력 64개: 계절성, 추세, 잠재 확률, 복합 신호 등 고차원 표현

---

### 3. 핵심 가중치 행렬의 역할
- **W (64 × 32)**  
  - 현재 입력을 64차원 특징 공간으로 변환  
- **U (64 × 64)**  
  - 이전 시점의 기억(hidden state)을 현재 시점으로 전달  

---

### 4. 한 줄 정의
- `final_output_sequence`는  
  **3,200개의 원본 시계열 데이터를 RNN이 시간 흐름에 따라 6,400개의 심층 특징으로 재해석한 결과**

---

In [2]:
import numpy as np

# Number of timesteps in the input sequence (step이 day라면 100일치 sequence를 입력)
timesteps = 100
# Dimensionality of the input feature space (최저온도, 최고온도, 강수량, 평균온도 등등의 시계열특성이 32개)
input_features = 32
# Dimensionality of the output feature space
output_features = 64

In [5]:
# Input data: random noise for the sake of the example
inputs = np.random.random((timesteps, input_features))
print(inputs.shape)

(100, 32)


In [6]:
# Initial state: an all-zero vector
state_t = np.zeros((output_features,))
print(state_t.shape)

(64,)


In [15]:

# Creates random weight matrices
W = np.random.random((output_features, input_features))
U = np.random.random((output_features, output_features))
b = np.random.random((output_features,))

print(f'W shape {W.shape}\nU shape {U.shape} \nb shape {b.shape}')

print(f'State에는 {input_features}개의 노드(뉴런)')

W shape (64, 32)
U shape(64, 64) 
b shape(64,)
State에는 32개의 노드(뉴런)


In [21]:
successive_outputs = []
# input_t is a vector of shape (input_features,).
steps = 0
for input_t in inputs:
    steps += 1
    if steps % 10 == 0:
        print(f'step {steps}')
    # Combines the input with the current state (the previous output)
    # to obtain the current output. We use tanh to add nonlinearity (we
    # could use any other activation function).
    output_t = np.tanh(np.dot(W, input_t) + np.dot(U, state_t) + b)
    # Stores this output in a list
    successive_outputs.append(output_t)
    # Updates the state of the network for the next timestep
    state_t = output_t

print(f'\n\ninput_t {input_t.shape}\n')
print(f'WX {np.dot(W, input_t).shape}')
print(f'Wh {np.dot(U, state_t).shape}')
print(f'b {b.shape}')

step 10
step 20
step 30
step 40
step 50
step 60
step 70
step 80
step 90
step 100


input_t (32,)

WX (64,)
Wh (64,)
b (64,)


In [22]:

# The final output is a rank-2 tensor of shape (timesteps, output_features).
final_output_sequence = np.concatenate(successive_outputs, axis=0)
final_output_sequence

array([1., 1., 1., ..., 1., 1., 1.])

In [4]:
final_output_sequence.shape

(6400,)

## final_output_sequence 의미



In [24]:
# 1차원인 (6400,)을 (100, 64)로 변환
reshaped_output = final_output_sequence.reshape(100, 64)

print(reshaped_output.shape)
# 결과: (100, 64)

(100, 64)


In [25]:
reshaped_output

array([[1., 1., 1., ..., 1., 1., 1.],
       [1., 1., 1., ..., 1., 1., 1.],
       [1., 1., 1., ..., 1., 1., 1.],
       ...,
       [1., 1., 1., ..., 1., 1., 1.],
       [1., 1., 1., ..., 1., 1., 1.],
       [1., 1., 1., ..., 1., 1., 1.]])