# **순환 신경망 RNN Recurrent Neural Network**

RNN은 신경망 내부의 상태 정보를 기억할 수 있으며, 이러한 상태 정보를 이용해서 사람의 음성이나 수많은 단어로 이루어진 소설과 같이 연속적이며 **순서 Sequence**가 있는 데이터를 분석하고 미래 값을 예측하는데 적합한 딥러닝 모형

* RNN 은닉층에서는 **tanh, 하이퍼볼릭 탄젠트 Hyperbolic Tangent 함수**로 은닉층의 출력값을 계산하고 출력층으로 보내줌
* 은닉층 내부의 순환구조, RNN에서는 은닉층 출력 값이 츨력층으로 전달되는 것과 동시에 그 값을 다시 은닉층 입력 값으로 들여보내주는 **순환 recurrent** 구조로 되어 있음
* RNN 아키텍처는 은닉층 내부에 데이터를 순환시키는 구조를 가지고 있어서, **순환 신경망 Recurrent Neural Network** 으로 불리며, 이러한 순환 구조 덕분에 **순서가 있는 데이터**를 처리하는데 강점을 가짐

 1. 은닉층 내의 순환 Recurrent 구조를 이용하여 과거 데이터를 기억
 2. 새롭게 입력되는 데이터와 은닉층에서 기억하고 있는 과거 데이터를 연결시켜서 그 의미를 알아내는 기능을 가지고 있음


* **cell = tf.contrib.rnn.BasicRNN(num_units=hidden_size)**

 **[입력 파라미터] hidden_size** : 내부 순환 구조를 가지고 있는 은닉층에서 **원핫 One-Hot**으로 표현되는 **출력 크기**

 **[리턴 값] cell** : 입력으로 주어진 hidden_size를 가지는 **은닉층 객체 cell을 리턴**


* **outputs, _states = tf.nn.dynamic_rnn(cell, x_data, initial_state, dtype=tf.float32)**

 **[입력 파라미터] cell** : tf.contrib.rnn.BasicRNNCell(...) 리턴 값인 **은닉층 객체 cell**

 **[입력 파라미터] x_data** : 순서를 가지고 있는 입력 데이터, 즉 **sequence data**를 나타내며, 텐서플로의 플레이스홀더 placeholder 노드 Node임

 **[입력 파라미터] initial_state** : 은닉층 객체인 cell의 초기상태로서 일반적으로 **0값**으로 초기화

 **[리턴 값] outputs, _states** : 은닉층 출력과 상태를 각각 outputs, _states로 리턴하지만, 실제로는 은닉층 출력 값인 outputs만 주로 사용


* **seq_loss = tf.contrib.seq2seq.sequence_loss(logits=outputs, targets=label, weights=weights)**

 **[입력 파라미터] outputs** : tf.nn.dyamic_rnn(...)의 리턴 값이 outputs, 즉 **은닉층의 출력값**

 **[입력 파라미터] label** : **정답데이터**, 일반적으로 플레이스홀더 palceholder 형태

 **[입력 파라미티] weights** : 일반적으로 **tf.ones([batch_size, sequence_length])**와 같이 **1**로 초기화된 텐서. **batch_size**는 신경망에서 말하는 일반적인 배치 사이즈 Batch size, **sequence_length**는 입력으로 주어지는 문장인, 순서가 있는 데이터 (Sequence Data)의 길이(Length)를 나타냄

 **[리턴 값] seq_loss** : 순서가 있는 데이터(Sequence Data)에 대한 손실 함수로서, **크로스 엔트로피 오차(Loss)**를 리턴












# 가상환경 만들기

In [1]:
%env PYTHONPATH = # /env/python

env: PYTHONPATH=# /env/python


In [2]:
!wget https://repo.anaconda.com/miniconda/Miniconda3-py38_4.12.0-Linux-x86_64.sh
!chmod +x Miniconda3-py38_4.12.0-Linux-x86_64.sh
!./Miniconda3-py38_4.12.0-Linux-x86_64.sh -b -f -p /usr/local
!conda update conda

--2024-04-04 05:22:49--  https://repo.anaconda.com/miniconda/Miniconda3-py38_4.12.0-Linux-x86_64.sh
Resolving repo.anaconda.com (repo.anaconda.com)... 104.16.131.3, 104.16.130.3, 2606:4700::6810:8203, ...
Connecting to repo.anaconda.com (repo.anaconda.com)|104.16.131.3|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 76120962 (73M) [application/x-sh]
Saving to: ‘Miniconda3-py38_4.12.0-Linux-x86_64.sh’


2024-04-04 05:22:50 (203 MB/s) - ‘Miniconda3-py38_4.12.0-Linux-x86_64.sh’ saved [76120962/76120962]

PREFIX=/usr/local
Unpacking payload ...
Collecting package metadata (current_repodata.json): - \ done
Solving environment: / - \ done

## Package Plan ##

  environment location: /usr/local

  added / updated specs:
    - _libgcc_mutex==0.1=main
    - _openmp_mutex==4.5=1_gnu
    - brotlipy==0.7.0=py38h27cfd23_1003
    - ca-certificates==2022.3.29=h06a4308_1
    - certifi==2021.10.8=py38h06a4308_2
    - cffi==1.15.0=py38hd667e15_1
    - charset-normaliz

In [3]:
import sys
sys.path.append('/usr/local/lib/python3.8/site-packages')

In [4]:
!conda create -n myenv python=3.6

Collecting package metadata (current_repodata.json): - \ | / - \ | done
Solving environment: - failed with repodata from current_repodata.json, will retry with next repodata source.
Collecting package metadata (repodata.json): | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | / - \ | done
Solving environment: - \ | / - \ | done


  current version: 4.12.0
  latest version: 24.3.0

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /usr/local/envs/myenv

  added / updated specs:
    - python=3.6


The following packages will be downloaded:

    package          

In [27]:
%%shell
eval "$(conda shell.bash hook)"
conda activate myenv
pip install tensorflow==1.15
# pip install tensorflow-addons





In [19]:
# !conda install keras

Collecting package metadata (current_repodata.json): - \ | / - \ | / - \ | / - \ | done
Solving environment: - \ | / - \ | / - \ | / - \ | / - \ | / - \ done


  current version: 4.12.0
  latest version: 24.3.0

Please update conda by running

    $ conda update -n base -c defaults conda



## Package Plan ##

  environment location: /usr/local

  added / updated specs:
    - keras


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    blas-1.0                   |              mkl           6 KB
    intel-openmp-2023.1.0      |   hdb19cb5_46306        17.2 MB
    keras-2.12.0               |   py38h06a4308_0         1.6 MB
    keras-preprocessing-1.1.2  |     pyhd3eb1b0_0          35 KB
    libgfortran-ng-11.2.0      |       h00389a5_1          20 KB
    libgfortran5-11.2.0        |       h1234567_1         2.0 MB
    m

# 해당 코드 .py 파일 실행

In [29]:
%%shell
eval "$(conda shell.bash hook)"
conda activate myenv
python3 /content/rnn.py   # /content 경로에 임의의 .py 파일 생성(파일 더블클릭 후 실행된 파일 화면창에 코드 기록)

# tensorflow v1 에서 contrib 지원 불가로, 아래의 코드 실행이 안됨.
# cell = tf.contrib.rnn.BasicRNNCell(num_units=hidden_size)
# seq_loss = tf.contrib.seq2seq.sequence_loss(logits=outputs, targets=T, weights=weights)

Instructions for updating:
non-resource variables are not supported in the long term
Traceback (most recent call last):
  File "/content/rnn.py", line 45, in <module>
    cell = tf.contrib.rnn.BasicRNNCell(num_units=hidden_size)
  File "/usr/local/envs/myenv/lib/python3.6/site-packages/tensorflow_core/python/util/module_wrapper.py", line 193, in __getattr__
    attr = getattr(self._tfmw_wrapped_module, name)
AttributeError: module 'tensorflow._api.v1.compat.v1' has no attribute 'contrib'


CalledProcessError: Command 'eval "$(conda shell.bash hook)"
conda activate myenv
python3 /content/rnn.py   # /content 경로에 임의의 .py 파일 생성(파일 더블클릭 후 실행된 파일 화면창에 코드 기록)
' returned non-zero exit status 1.

# rnn.py 파일에 작성된 코드 내용

In [None]:
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

import numpy as np

# import tensorflow_addons as tfa
# import keras
# from tf_keras.__internal__ import KerasTensor


#1. 'gohome'을 원핫(One-Hot) 방식으로 나타냄

## gohome
idx2char = ['g', 'o', 'h', 'm', 'e']        # g=0, o=1, h=2, m=3, e=4

x_data = [[0, 1, 2, 1, 3]]                  # gohom

x_one_hot = [[[1, 0, 0, 0],
              [0, 1, 0, 0],
              [0, 0, 1, 0],
              [0, 1, 0, 0],
              [0, 0, 0, 1]]]

t_data = [[1, 2, 1, 3, 4]]                  # ohome


#2. RNN 하이퍼 파라미터 설정 및 텐서플로 노드 정의

## RNN 하이퍼 파라미터 설정
num_classes = 5                             # 정답의 크기 : 'ohome'
input_dim = 4                               # 입력 데이터의 원핫 One-Hot 크기 : 'gohom'
hidden_size = 5                             # 은닉층 출력 크기를 나타내는 변수,
                                            # 은닉층 출력 값은 출력층으로 바로 전달되어 정답을 만드는 역할, 정답의 크기와 동일
batch_size = 1                              # 한 번에 신경망을 들어가는 데이터의 개수
sequence_length = 5                         # 입력으로 들어가는 문장의 길이
learning_rate = 0.1

## 입력과 정답을 위한 플레이스홀더(placeholder) 정의
X = tf.placeholder(tf.float32, [None, sequence_length, input_dim])
T = tf.placeholder(tf.int32, [None, sequence_length])


#3. 은닉층 객체 cell 노드 및 은닉층 출력 노드 정의 ( LSTM:BasicLSTMCell(), GRU:GRUCell() )

cell = tf.contrib.rnn.BasicRNNCell(num_units=hidden_size)
# cell = tf.nn.rnn_cell.BasicRNNCell(num_units=hidden_size)

initial_state = cell.zero_state(batch_size, tf.float32)

outputs, _states = tf.nn.dynamic_rnn(cell, X, initial_state=initial_state, dtype=tf.float32)


#4. 손실 함수 계산 및 가중치, 바이어스 업데이트

weights = tf.ones([batch_size, sequence_length])

seq_loss = tf.contrib.seq2seq.sequence_loss(logits=outputs, targets=T, weights=weights)
# seq_loss = tfa.seq2seq.sequence_loss(logits=outputs, targets=T, weights=weights)

loss = tf.reduce_mean(seq_loss)

train = tf.train.AdamOptimizer(learning_rate=learning_rate).minimize(loss)

y = prediction = tf.argmax(outputs, axis=2)


#5. 노드와 연산 실행

with tf.Session() as sess :

  sess.run(tf.global_variables_initializer())

  for step in range(2001) :

    loss_val, _ = sess.run([loss, train], feed_dict={X : x_one_hot, T : t_data})

    result = sess.run(y, feed_dict={X: one_hot})

    if step % 400 == 0:

      print("step = ", step, ", loss = ", loss_val, ", prediction = ", result, ", target = ", t_data)

      result_str = [idx2char[c] for c in np.squeeze(result)]

      print("\nPrediction = ", ''.join(result_str))


# 다른 예제 foxfax, hihello

In [None]:

# #foxfax

# idx2char = ['f', 'o', 'x', 'a']

# x_data = [[0, 1, 2, 0, 3]] #foxfa

# x_one_hot = [[[1, 0, 0, 0],
#               [0, 1, 0, 0],
#               [0, 0, 1, 0],
#               [1, 0, 0, 0],
#               [0, 0, 0, 1]]]

# t_data = [[1, 2, 0, 3, 2]] #oxfax


# # hihello

# idx2char = ['h', 'i', 'e', 'l', 'o']

# x_data = [[0, 1, 0, 2, 3, 3]] #hihell

# x_one_hot = [[[1, 0, 0, 0, 0],
#               [0, 1, 0, 0, 0],
#               [1, 0, 0, 0, 0],
#               [0, 0, 1, 0, 0],
#               [0, 0, 0, 1, 0],
#               [0, 0, 0, 1, 0]]]

# t_data = [[1, 0, 2, 3, 3, 4]] #ihello

# num_classes = 6
# input_dim = 4
# hidden_size = 6
# batch_size = 1
# squence_length = 6
# learning_rate = 0.1