# RNN ( Many to One)
> 참고
1. https://github.com/deeplearningzerotoall/TensorFlow/blob/master/tf_2.x/lab-12-1-many-to-one-keras-eager.ipynb

> 참고사항
* map, lambda등등 python의 collection은 모두 'Python - Basic'노트북에 사용법을 정리해놨습니다.

* RNN의 Many to One형태를 사용하여 Binary 분류를 하는 예제

In [1]:
import tensorflow as tf

## Data & Pre-Processing -1 

In [2]:
# Dataset
data = ['good', 'bad', 'worse', 'so good','so bad','best']
target = [1, 0, 0, 1, 0, 1]

# Word Index ( Token )
idx_char = list(set("".join(data)))
char_to_idx = {word:idx for idx, word in enumerate(idx_char)}
idx_to_char = {idx:word for idx, word in enumerate(idx_char)}

print(idx_char)
print(char_to_idx)
print(idx_to_char)

['e', 'a', ' ', 'r', 't', 'w', 'o', 'd', 'g', 's', 'b']
{'e': 0, 'a': 1, ' ': 2, 'r': 3, 't': 4, 'w': 5, 'o': 6, 'd': 7, 'g': 8, 's': 9, 'b': 10}
{0: 'e', 1: 'a', 2: ' ', 3: 'r', 4: 't', 5: 'w', 6: 'o', 7: 'd', 8: 'g', 9: 's', 10: 'b'}


## Data & Pre-Processing - 2

In [3]:
# Token을 바탕으로 데이터 값 변환
word_to_idx = lambda word: [char_to_idx.get(char) for char in word]
data_x = list(map(word_to_idx, data)) # token을 바탕으로 데이터 변환.
data_x_len = list(map(lambda word: len(word), data_x)) # 변환된 데이터의 길이

print(data_x)

[[8, 6, 6, 7], [10, 1, 7], [5, 6, 3, 9, 0], [9, 6, 2, 8, 6, 6, 7], [9, 6, 2, 10, 1, 7], [10, 0, 9, 4]]


## Data & Pre-Processing - 3
* Padding
    * RNN으로 데이터를 훈련시킬때 Sequence길이가 일정해야 합니다. 데이터의 각각 서로 다른 길이를 맞추기 위해서 padding을 사용합니다. 기본적으로 0으로 패딩을 합니다.
```python
tf.keras.preprocessing.sequence.pad_sequence(
    sequence = 데이터,
    maxlen = Sequence의 최대 길이,
    padding = 패딩을 어디로 줄지? ( 'post' )
    truncating = 길이 줄이기 ( 'post' )
```

In [4]:
max_sequence = 10
data_X = tf.keras.preprocessing.sequence.pad_sequences(sequences = data_x, maxlen=max_sequence, padding='post', truncating='post')

print("---data_x---\n")
print(data_x,"\n")

print("---data_X---\n")
print(data_X)

---data_x---

[[8, 6, 6, 7], [10, 1, 7], [5, 6, 3, 9, 0], [9, 6, 2, 8, 6, 6, 7], [9, 6, 2, 10, 1, 7], [10, 0, 9, 4]] 

---data_X---

[[ 8  6  6  7  0  0  0  0  0  0]
 [10  1  7  0  0  0  0  0  0  0]
 [ 5  6  3  9  0  0  0  0  0  0]
 [ 9  6  2  8  6  6  7  0  0  0]
 [ 9  6  2 10  1  7  0  0  0  0]
 [10  0  9  4  0  0  0  0  0  0]]


## Data set

In [5]:
batch_size = 2

dataset = tf.data.Dataset.from_tensor_slices((data_X, target))
dataset = dataset.shuffle(buffer_size = 4).batch(batch_size=2)

print(dataset)

<BatchDataset shapes: ((None, 10), (None,)), types: (tf.int32, tf.int32)>


## Creating Model

### Hyper Parameter

In [6]:
# Embedding층에 들어가는 입출력 차원수
input_dim = len(char_to_idx) # 13
output_dim = len(char_to_idx)

# RNN 훈련시 사용하는 파라미터
hidden_size = 10 # num of units in each cell ( 셀마다의 unit 수 )
num_classes = 2 # 분류 수 ( 1:positive , 0 : negative )
learning_rate = 0.01
epochs = 30

### Embedding
* Text는 비정형데이터이자, 컴퓨터가 이해할 수 없는 데이터이다. 그러므로 숫자화 시켜줄 필요가 있는데, 크게는 토큰 기반과 임베딩 방법이 있다.
```python
tf.keras.layers.Embedding(
    input_dim = 입력 차원수,
    output_dim = 출력 차원수,
    mask_zero = 0값으로 패딩된 부분을 연산 제외 여부
    ) 
```
https://www.tensorflow.org/api_docs/python/tf/keras/layers/Embedding

In [7]:
model = tf.keras.Sequential()
model.add(tf.keras.layers.Embedding(input_dim=input_dim, output_dim=output_dim, trainable=False, mask_zero=True, input_length=max_sequence))
print(model(data_X).shape)

(6, 10, 11)


### Model

In [8]:
# RNN Cell
cell = tf.keras.layers.SimpleRNNCell(units=hidden_size, activation='tanh')
model.add(tf.keras.layers.RNN(cell=cell))
model.add(tf.keras.layers.Dense(units=num_classes))
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
embedding (Embedding)        (None, 10, 11)            121       
_________________________________________________________________
rnn (RNN)                    (None, 10)                220       
_________________________________________________________________
dense (Dense)                (None, 2)                 22        
Total params: 363
Trainable params: 242
Non-trainable params: 121
_________________________________________________________________


## function

In [9]:
# cost
def cost_function(y_true, y_pred):
    return tf.reduce_mean(tf.keras.losses.sparse_categorical_crossentropy(y_true=y_true, y_pred=y_pred))

optimizer = tf.optimizers.Adam(learning_rate = learning_rate)

def run_optimizer(model, x, y):
    with tf.GradientTape() as tape:
        predict = model(x)
        cost = cost_function(y, predict)
    grads = tape.gradient(cost, model.variables)
    optimizer.apply_gradients(grads_and_vars=zip(grads, model.variables))
    return cost

## Training

In [10]:
cost_log = []

for epoch in range(epochs):
    cost_avg = 0
    training_step = 0

    for x_batch, y_batch in dataset:
        cost = run_optimizer(model, x_batch, y_batch)
        cost_avg+=cost
        training_step+=1

    cost_avg /= training_step
    cost_log.append(cost_avg)

    if (epoch+1) % 5 == 0:
        print("epoch : {}, cost : {:.5f}".format(epoch+1, cost_avg))

hypothesis = tf.argmax(model(data_X), axis=-1)
print(tf.reduce_mean(tf.cast(tf.equal(hypothesis, target),dtype=tf.float32)))

epoch : 5, cost : 0.57762
epoch : 10, cost : 0.57762
epoch : 15, cost : 0.46210
epoch : 20, cost : 0.46210
epoch : 25, cost : 0.46210
epoch : 30, cost : 0.46210
tf.Tensor(1.0, shape=(), dtype=float32)
