PyTorch에서는 torch.nn.RNN, torch.nn.LSTM, torch.nn.GRU 클래스를 사용하여 순환 신경망을 쉽게 구현할 수 있습니다. 각 클래스는 공통적으로 아래와 같은 주요 파라미터를 가집니다.

input_size: 입력 특성의 차원 (예: 피처 개수)

hidden_size: 은닉 상태의 차원 (뉴런 개수)

num_layers: RNN의 레이어 개수 (층이 깊을수록 복잡한 패턴 학습 가능)

batch_first: True이면 입력 텐서의 첫 번째 차원이 배치 크기가 됨 (기본값은 False)

dropout: 층 간 드롭아웃 적용 여부 (과적합 방지)

bidirectional: 양방향 RNN 사용 여부 (기본값 False)


In [9]:


import torch
import torch.nn as nn

rnn = nn.RNN(input_size= 10, hidden_size= 20, num_layers=1, batch_first=False)
x = torch.randn(3,32,10) #(Seq_len, batchsize, input_size)
# "나는 학교에 간다" Seq = 3
# "난는 학원에간다"
# "나는 회사에간다"
# "나는 병원에간다" 배치사이즈가 4
# "나는" 이라는 것을 몇개의 차원으로 표시할거냐? input_size만큼
# "학교에" 이라는 것을 몇개의 차원으로 표시할거냐? input_size만큼
out, hidden = rnn(x)# out.shape = seq_len, batch, hidden_size,
print(out.shape, hidden.shape) # hidden.shape = num_layer, batch, hidden

torch.Size([3, 32, 20]) torch.Size([1, 32, 20])


out: 모든 타임스텝의 출력 ([batch_size, seq_len, hidden_size])

hidden: 마지막 타임스텝의 은닉 상태 ([num_layers, batch_size, hidden_size])

In [7]:
rnn = nn.RNN(input_size= 10, hidden_size= 20, num_layers=1, batch_first=True)
# (batchsize, Seq_len, input_size) 이렇게 쓰기

x = torch.randn(32,3,10)
out, hidden = rnn(x)
print(out.shape, hidden.shape)

torch.Size([32, 3, 20]) torch.Size([1, 32, 20])


In [16]:
out[-1:,:,:] # out의 마지막 배치

tensor([[[-1.5680e-01, -3.1595e-01, -3.3374e-01, -5.3983e-01, -2.6354e-01,
          -4.6347e-01,  2.1344e-01, -5.3873e-02,  3.7803e-01, -4.1837e-01,
          -6.9153e-01, -8.1356e-01,  2.5033e-01,  1.6343e-01, -3.1165e-01,
           5.1447e-02,  5.5671e-01,  2.5888e-02,  4.8584e-01, -4.5649e-01],
         [-3.3470e-01, -2.9690e-01, -6.5903e-02, -2.9473e-02, -5.9635e-01,
          -5.2839e-01,  3.6916e-01,  3.1472e-01,  3.1355e-01, -2.6017e-01,
          -2.0392e-01, -8.3504e-01,  9.4409e-02, -1.1333e-01, -6.3425e-01,
          -1.3455e-01,  4.7347e-01,  2.4565e-01, -3.3138e-03, -6.1292e-01],
         [-4.9773e-01, -1.0005e-02,  1.5837e-01,  1.7651e-02, -3.9301e-01,
          -2.4058e-01,  5.8439e-01,  5.0034e-01,  4.7519e-01, -3.2815e-01,
          -4.0324e-01, -7.1937e-01, -4.1451e-01, -5.8544e-01,  1.9571e-01,
          -2.4399e-01, -3.1234e-02,  1.3768e-01,  6.7859e-01,  2.6124e-01],
         [-4.4921e-01, -2.8168e-01, -2.1877e-01, -1.3516e-01,  1.4904e-01,
           1.3417e-02,

In [17]:
hidden[:,1:,:] # 히든의 마지막 배치
# out의 마지막이랑 히든의 마지막이 같음.

tensor([[[-3.3470e-01, -2.9690e-01, -6.5903e-02, -2.9473e-02, -5.9635e-01,
          -5.2839e-01,  3.6916e-01,  3.1472e-01,  3.1355e-01, -2.6017e-01,
          -2.0392e-01, -8.3504e-01,  9.4409e-02, -1.1333e-01, -6.3425e-01,
          -1.3455e-01,  4.7347e-01,  2.4565e-01, -3.3138e-03, -6.1292e-01],
         [-4.9773e-01, -1.0005e-02,  1.5837e-01,  1.7651e-02, -3.9301e-01,
          -2.4058e-01,  5.8439e-01,  5.0034e-01,  4.7519e-01, -3.2815e-01,
          -4.0324e-01, -7.1937e-01, -4.1451e-01, -5.8544e-01,  1.9571e-01,
          -2.4399e-01, -3.1234e-02,  1.3768e-01,  6.7859e-01,  2.6124e-01],
         [-4.4921e-01, -2.8168e-01, -2.1877e-01, -1.3516e-01,  1.4904e-01,
           1.3417e-02,  3.5577e-02, -4.1256e-02,  3.4687e-03, -3.8626e-01,
           1.8457e-01, -7.2293e-01, -3.9513e-01,  1.8371e-01, -3.6393e-01,
          -2.5425e-01, -5.1369e-01,  3.9059e-01, -1.8386e-01,  1.1649e-01],
         [ 4.3691e-01,  7.1259e-01, -5.7750e-01,  3.7342e-01,  3.8143e-02,
           9.5162e-02,

In [None]:
lstm = nn.LSTM(input_size= 10, hidden_size= 20, num_layers=1, batch_first=True)

x = torch.randn(32,3,10) # batch, seq_len, input
out, (hidden,cell) = lstm(x) # hidden과 셀이 같이 붙어나옴
print(out.shape, hidden.shape, cell.shape)

# GRU

In [None]:
gru = nn.GRU(input_size= 10, hidden_size= 20, num_layers=1, batch_first=True)


x = torch.randn(32,3,10)
out, hidden = gru(x)
print(out.shape, hidden.shape)

# 시계열 데이터 실습

In [None]:
import numpy as np


def generate_sin_wave(seq_len, num_samples):
    x = np.linspace(0, seq_len, num_samples)