
# 주제 : 딥러닝으로 Seq2Seq 계산기 만들기
--------------
## 실습 가이드
    1. 데이터를 다운로드하여 Colab에 불러옵니다.
    2. 필요한 라이브러리는 모두 코드로 작성되어 있습니다.
    3. 코드는 위에서부터 아래로 순서대로 실행합니다.
    4. 전체 문제 구성은 좌측 첫 번째 아이콘을 통해 확인할 수 있습니다.

## 데이터 소개
    - 이번 주제는 직접 랜덤 생성한 Dataset을 사용합니다.
    - 학습 데이터와 정답 데이터는, 각각의 아래와 같습니다.
    
    1. train_text
      23 + 13
      1 - 3
      32 + 5
      1 + 62 ...
    
    2. train_answer
      36
      -1
      37
      63 ...


    
- 데이터 출처: 없음

## 최종 목표
    - Seq2Seq 기반 모델의 이해
    - word embedding 이해
    - 시계열 데이터 학습 이해
    
  - 출제자 : 손근영 강사


In [None]:
import tensorflow as tf
from tensorflow import keras
from keras.layers import Dense
from keras.models import Sequential

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings 
from IPython.display import Image

warnings.filterwarnings('ignore')
%matplotlib inline

SEED = 34

## Step 1. 도입전 기본 처리

### 문제 1. 랜덤 2자리 더하기 데이터와 정답셋 생성

In [None]:
# 랜덤 2자리 더하기 데이터와 정답셋을 오만쌍 생성해주세요.

## Step 2. 전처리

### 문제 2. train_text, train_anser에서 나오는 모든 token을 map<token, id>형태로 변경

In [None]:
# train_text, train_anser에서 나오는 모든 token을 map<token, id>형태로 변경하세요. (단, + -> 10, PAD -> 12, EOS -> 13)

### 문제 3. vacab의 역형태인 map<id, token> 형태도 생성

In [None]:
# vocab의 역형태인 <id, token>을 생성하세요.

### 문제 4. train_text와 train_anser를 BOW 형태로 변경

In [None]:
# train_text와 train_anser를 BOW 형태로 변경하세요.

### 문제 5. train_bow_text와 train_bow_answer에 padding을 추가하여 완전한 np.array로 변경하세요.

In [None]:
# train_bow_text와 train_bow_answer에 padding을 추가하여 완전한 np.array로 변경하세요.

### 문제 6. train_bow_text를 train_data_bow, test_data_bow로 (98%, 2%의 개수) 분리해보세요.

In [None]:
# train_bow_text를 train_bows, test_bows로 (98%, 2%의 개수) 분리해보세요.

## Step 3. 시각화 방법

### 문제 7. train_data_bow에서 등장하는 token의 분포를 출력해보세요.

In [None]:
#  train_data_bow에서 등장하는 token의 분포를 출력해보세요.

### 문제 8. train_answer_bow에서 등장하는 token의 분포를 출력해보세요.

In [None]:
#  train_answer_bow에서 등장하는 token의 분포를 출력해보세요.

## Step 4. Seq2Seq용 입출력 보정

### 문제 9. train/test_answer_bow를 한쪽씩 당겨서 decoder에 주입시킬 데이터를 생성해보세요.

In [None]:
# train/test_answer_bow를 한쪽씩 당겨서 decoder에 주입시킬 데이터를 생성해보세요.

### 문제 10. 정답으로 처리될 train/test_answer_bow를 onehot 인코딩으로 바꾸기

In [None]:
# train/test_anser_bow를 onehot으로 바꾸는 코드를 작성하세요

### 문제 11. data_bow, anser_bow, shift_answer_bow, onehot를 1개씩 출력해보세요.

In [None]:
# data_bow, shift_answer_bow, onehot, answer_bow등을 1개씩 출력해보세요

### 문제 12. onehot를 readable하게 바꿔주는 함수를 작성해보세요.

In [None]:
# onehot을 readable하게 바꿔주는 함수를 작성해보세요. (단, EOS는 .으로 PAD는 공백으로 전환)

### 문제 13. bow를 readable하게 바꿔주는 함수를 작성해보세요.

In [None]:
# bow를 readable하게 바꿔주는 함수를 작성해보세요. (단, EOS는 .으로 PAD는 _으로 전환)

## Step 5. Seq2Seq 모델링

### 문제 14. Seq2Seq 모델 구축

In [None]:
# seq2seq 모델을 구축하고 학습모델, encoder, decoder를 획득하세요

### 문제 15. 학습 모델을 생성하고 summary를 출력하세요. 

In [None]:
# 학습 모델을 생성하고 summary를 출력하세요.

### 문제 16. encoder, decoder에 대한 summary를 출력하세요.

In [None]:
 # encoder, decoder에 대한 summary를 출력하세요.

### 문제 17. 학습모델을 학습해보세요.

In [None]:
# 학습모델을 학습해보세요.

### 문제 18. 학습 진행 사항을 plt으로 출력하세요.

In [None]:
# hist의 accuracy와 loss를 plt의 plot을 이용하여 출력하는 코드를 작성하세요.

## Step 6. 모델 결과 확인

### 문제 19. plain2bow를 이용하여 encoder에 bow를 주입하고 z를 받아보세요.

In [None]:
# plain2bow를 이용하여 encoder에 bow를 주입하고 z를 받아보세요.

### 문제 20. z와 PAD를 이용하여 첫번째 decoder 값을 획득해보세요.

In [None]:
# z와 PAD를 이용하여 첫번째 decoder 값을 획득해보세요.

### 문제 21. first_pred에 값이 가장 큰 index를 이용하여 문자로 decoding 하세요.

In [None]:
# first_pred에 값이 가장 큰 index를 이용하여 문자로 decoding 하세요.

### 문제 22. first_z와 first_pred를 이용해서 second_pred를 획득하고 문자로 decoding 해보세요.

In [None]:
# irst_z와 first_pred를 이용해서 second_pred를 획득하고 문자로 decoding 해보세요.

### 문제 23. 입력 text가 주어지면 bow로 바꾼뒤 pad가 나올 때까지 문자를 decoding하는 함수를 만드세요.


In [None]:
# z와 pad가 주어지면 pad가 나올 때까지 문자를 decoding하는 함수를 만드세요.

### 문제 24. decoding으로 몇가지 산술 연산을 테스트해보세요.

In [None]:
# decoding으로 몇가지 산술 연산을 테스트해보세요

### 문제 25. 모델을 평가해보세요.

In [None]:
# 모델을 평가해보세요.

## Step 7. 모델 저장 및 로드, 다운

### 문제 26. 모델을 저장하세요.

In [None]:
# 모델을 저장하는 코드를 작성하세요.

### 문제 27. 모델 파일을 새로운 모델에 로드하세요.

In [None]:
# 모델을 로드하는 코드를 작성하세요.

### 문제 28. 로드한 모델을 test 데이터로 평가해보세요.


In [None]:
# 로드한 모델을 test 데이터로 평가해보세요.

### 문제 29. 모델을 내 컴퓨터에 저장해보세요

In [None]:
# 모델을 내 컴퓨터에 저장해보세요.