# RNN(Recurrent Neural Networks)

- 앞의 입력 값을 기억
- 앞에서 나온 입력에 대한 결과가 뒤에서 나오는 입력 값에 영향을 줌
- 활성함수로 하이퍼볼릭탄젠트 사용, 미분하면 전체값이 0 ~ 0.5로 나와서 경사소실문제 야기하지만, 마지막(가까이 있는) 입력일수록 더 많이 영향을 끼치게하는 효과도 있어서 사용    
    
  
- 문제점 : 예측하려는 것과 가장 높은 상관 관계를 가진 입력 값이 앞쪽에 있으면 미분으로 인한 경사소실로 예측하기 어려움
- 해결방안 : LSTM(Long Short Term Memory)
- LSTM : 기억을 관리 해줌 (데이터가 입력되는 순서에 따라서만 중요도를 생각하는 RNN과 달리 기존의 들어왔던 입력들의 중요도를 중간에 따로 계산함) 그럼 입력 순서에 상관없이 중요도가 설정됨

In [None]:
# 5글자로 된 단어
# 앞의 4글자를 입력하면 마지막 글자를 출력
# great,  freak, right, light, fight, hello, apple
# 머신러닝 한다 -> 글자가 아니라 숫자를 집어 넣겠다. <- 인코딩 작업 

In [None]:
# 들어간 문자
# g, r, e, a, t, f, k, i, h, l, o, p

In [None]:
# 12개의 알파벳 원핫인코딩
g = [1,0,0,0,0,0,0,0,0,0,0,0]
r = [0,1,0,0,0,0,0,0,0,0,0,0]
e = [0,0,1,0,0,0,0,0,0,0,0,0]
a = [0,0,0,1,0,0,0,0,0,0,0,0]
t = [0,0,0,0,1,0,0,0,0,0,0,0]
i = [0,0,0,0,0,1,0,0,0,0,0,0]
h = [0,0,0,0,0,0,1,0,0,0,0,0]
l = [0,0,0,0,0,0,0,1,0,0,0,0]
f = [0,0,0,0,0,0,0,0,1,0,0,0]
k = [0,0,0,0,0,0,0,0,0,1,0,0]
o = [0,0,0,0,0,0,0,0,0,0,1,0]
p = [0,0,0,0,0,0,0,0,0,0,0,1]


In [None]:
# 데이터 만들기
# great, right, light, freak, hello, apple, fight
# [[h,e,l,l,o], [r,i,g,h,t],[l,i,g,h,t],[f,r,e,a,k],[f,i,g,h,t],[a,p,p,l,e], [g,r,e,a,t]]

In [None]:
import numpy as np
data = np.array([
    [g,r,e,a,t],
    [r,i,g,h,t],
    [l,i,g,h,t],
    [f,i,g,h,t],
    [f,r,e,a,k],
    [a,p,p,l,e],
    [h,e,l,l,o]
])

In [None]:
data.shape
# 데이터 갯수, 한 데이터 안의 변수의 개수, 변수의 개수
# sample, timestamp, feature

(7, 5, 12)

In [None]:
X_train = data[:,:-1]
y_train = data[:,-1]

In [None]:
X_train.shape, y_train.shape

((7, 4, 12), (7, 12))

In [None]:
# 모델링
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense, SimpleRNN

model = Sequential()

model.add(SimpleRNN(units = 10, input_shape=(4,12)))   # input_shape=(timestamp, feature) / 기본 activation이 tanh(하이퍼볼릭탄젠트)

model.add(Dense(12, activation='softmax'))   # 원핫인코딩한걸 라벨 값으로 가지고 있으니까 softmax

model.summary()

Model: "sequential_1"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
 simple_rnn_1 (SimpleRNN)    (None, 10)                230       
                                                                 
 dense_1 (Dense)             (None, 12)                132       
                                                                 
Total params: 362
Trainable params: 362
Non-trainable params: 0
_________________________________________________________________


In [None]:
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [None]:
h1 = model.fit(X_train, y_train, epochs=500)

In [None]:
# g,  r,  e,  a,  t,  i,  h,  l,  f,  k,  o,  p
# 1,  2,  3,  4,  5,  6,  7,  8,  9,  10, 11, 12

In [None]:
X_test = np.array([[h,e,l,l]])

In [None]:
pre = model.predict(X_test)
p1,p2,p3,p4,p5,p6,p7,p8,p9,p10,p11,p12 = pre[0][0],pre[0][1],pre[0][2],pre[0][3],pre[0][4],pre[0][5],pre[0][6],pre[0][7],pre[0][8],pre[0][9],pre[0][10],pre[0][11]
list1 = [p1,p2,p3,p4,p5,p6,p7,p8,p9,p10,p11,p12]
if max(list1) == p1:
  print('g')
elif max(list1) == p2:
  print('r')
elif max(list1) == p3:
  print('e')
elif max(list1) == p4:
  print('a')
elif max(list1) == p5:
  print('t')
elif max(list1) == p6:
  print('i')
elif max(list1) == p7:
  print('h')
elif max(list1) == p8:
  print('l')
elif max(list1) == p9:
  print('f')
elif max(list1) == p10:
  print('k')
elif max(list1) == p11:
  print('o')
elif max(list1) == p12:
  print('p')

o
