<a href="https://colab.research.google.com/github/Seongwoong-sk/PyTorch-Deep-Learning-Zero-To-All/blob/main/lab_11_2_2_hihello.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 'Hihello' example
- 'Hihello' problem
  - wll predict the next characer of input character
  - model이 어디까지 진행된 상태인지 저장하는 RNN의 Hidden State의 역할이 되게 중요함
- Data setting
  - One hot encoding
- Cross entropy loss
  - 1번째 파라미터 : model의 output
  - 2번째 : 정답 레이블
- Code run through

# How can we represent characters?
We can represent them by `index`
- 'h' -> 0
- 'i' -> 1
- 'e' -> 2
- 'l' -> 3
- 'o' -> 4

```
# list of available characters
char_set = ['h','i','e','l','o']

```

따라서 continuous하지 않고 categorical한 data를 표현할 때는 One-hot encoding이라는 방법을 씀
- 마지막 문자는 one_hot으로 넣지 않음
  - 마지막 문자를 예측하는 거기 때문에

O가 맨 마지막에 있으니깐 O전에는 **input**으로 사용되고 / 처음 h를 뺀 ihello는 y의 output으로 사용됨

In [None]:
import torch
import torch.optim as optim
import numpy as np

In [None]:
# Random seed to make results deterministic and reproducible
torch.manual_seed(0)

<torch._C.Generator at 0x7fe49194ba30>

In [None]:
# declare dictionary

char_set = ['h', 'i', 'e', 'l', 'o']

5

In [None]:
# hyper parameters

input_size = len(char_set)
hidden_size = len(char_set)
learning_rate = 0.1

## 데이터 준비

In [None]:
# data setting
# One hot Encoding

x_data = [[0, 1, 0, 2, 3, 3]] # h, i, h, e, l, l

x_one_hot = [[[1, 0, 0, 0, 0], # h
              [0, 1, 0, 0, 0], # i
              [1, 0, 0, 0, 0], # h
              [0, 0, 1, 0, 0], # e
              [0, 0, 0, 1, 0], # l
              [0, 0, 0, 1, 0]]] # l

y_data = [[1, 0, 2, 3, 3, 4]] # hihello에서 처음 h를 뺀 ihello

In [None]:
# transform as torch tensor variable

X = torch.FloatTensor(x_one_hot)
Y = torch.LongTensor(y_data)

In [None]:
# declare RNN


rnn = torch.nn.RNN(input_size, hidden_size, batch_first=True)  # batch_first guarantees the order of output = (B, S, Input_size)

In [None]:
# loss & optimizer setting

criterion = torch.nn.CrossEntropyLoss()
optimizer = optim.Adam(rnn.parameters(), learning_rate)

In [None]:
# start training
for i in range(100):

    optimizer.zero_grad()

    # _status : 만약 다음 input이 있으면 그 다음 input은 RNN의 안에서 계산할 때 쓰이게 될 hidden state
    # 여기서는 주어진 hidden state는 모든 input을 다 처리하고 나오는 hidden state이기 때문에 따로 쓰이지는 않음
    outputs, _status = rnn(X) # |outputs| = (1,6,5)

    # shape를 batch_dimension이 앞에 오도록 시작하게끔 바꿔준 다음에 loss 계산
    loss = criterion(outputs.view(-1, input_size), Y.view(-1))
    loss.backward()

    optimizer.step()

    # 실제로 모델이 어떻게 예측했는지
    # argmax(axis=2) : index가 2인 dimension 즉, 어떤 character인지 나타내는 dimension에서 어떤 character가 가장 가능성 있는지에 대한 숫자를 가지고 있는데 이 중 가장 큰 숫자가 있는 index를 가져오는 함수
    # 이렇게 가장 큰 index들만 가져온 후 character set에서 이 index가 어떤 character에 해당되는지를 가져오고 나서 파이썬 join() 함수를 통해 하나의 string으로 만들어줌
    # np.squeeze는 dimension이 1인 축을 없애주는 함수
    result = outputs.data.numpy().argmax(axis=2)
    result_str = ''.join([char_set[c] for c in np.squeeze(result)])
    print(i, "loss: ", loss.item(), "prediction: ", result, "true Y: ", y_data, "prediction str: ", result_str)

0 loss:  0.5316367745399475 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
1 loss:  0.5314880609512329 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
2 loss:  0.5313376784324646 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
3 loss:  0.5311968326568604 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
4 loss:  0.5310570597648621 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
5 loss:  0.5309184193611145 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
6 loss:  0.5307874083518982 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
7 loss:  0.5306558609008789 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
8 loss:  0.5305277705192566 prediction:  [[1 3 2 3 3 4]] true Y:  [[1, 0, 2, 3, 3, 4]] prediction str:  ilello
9