In [1]:
import import_ipynb
import sys
sys.path.append('..')
sys.path.append('../ch07')

import numpy as np
from dataset import sequence
from common.optimizer import Adam
from common.trainer import Trainer
from common.util import eval_seq2seq
from attention_seq2seq import AttentionSeq2seq
from ch07.seq2seq import Seq2seq
from ch07.peeky_seq2seq import PeekySeq2seq

importing Jupyter notebook from ../dataset/sequence.ipynb
importing Jupyter notebook from ../common/optimizer.ipynb
importing Jupyter notebook from ../common/trainer.ipynb
importing Jupyter notebook from ../common/util.ipynb
importing Jupyter notebook from attention_seq2seq.ipynb
importing Jupyter notebook from ../common/time_layers.ipynb
importing Jupyter notebook from ../common/layers.ipynb
importing Jupyter notebook from ../common/functions.ipynb
importing Jupyter notebook from ../ch07/seq2seq.ipynb
importing Jupyter notebook from ../common/base_model.ipynb
importing Jupyter notebook from ../ch08/attention_layer.ipynb
importing Jupyter notebook from ../ch07/peeky_seq2seq.ipynb


# 데이터 읽기

In [2]:
(x_train, t_train), (x_test, t_test) = sequence.load_data('date.txt')
char_to_id, id_to_char = sequence.get_vocab()

# 입력 문장 반전

In [3]:
x_train, x_test = x_train[:, ::-1], x_test[:, ::-1]

# 하이퍼파라미터 설정

In [4]:
vocab_size = len(char_to_id)
wordvec_size = 16
hidden_size = 256
batch_size = 128
max_epoch = 10
max_grad = 5.0

# 모델 설정

In [5]:
model = AttentionSeq2seq(vocab_size, wordvec_size, hidden_size)
optimizer = Adam()
trainer = Trainer(model, optimizer)

In [6]:
acc_list = []
for epoch in range(max_epoch):
    trainer.fit(x_train, t_train, max_epoch = 1, batch_size = batch_size, max_grad = max_grad)
    correct_num = 0
    
    for i in range(len(x_test)):
        question, correct = x_test[[i]], t_test[[i]]
        verbose = i < 10
        correct_num += eval_seq2seq(model, question, correct, id_to_char, verbose, is_reverse = True)
        
    acc = float(correct_num) / len(x_test)
    
    acc_list.append(acc)
    
    print('val acc {}'.format(acc * 100, ".3f"))
    
model.save_params()

| 에폭 1 |  반복 1 / 351 | 시간 1[s] | 손실 4.08
| 에폭 1 |  반복 21 / 351 | 시간 21[s] | 손실 3.09
| 에폭 1 |  반복 41 / 351 | 시간 42[s] | 손실 1.90
| 에폭 1 |  반복 61 / 351 | 시간 62[s] | 손실 1.72
| 에폭 1 |  반복 81 / 351 | 시간 83[s] | 손실 1.46
| 에폭 1 |  반복 101 / 351 | 시간 104[s] | 손실 1.19
| 에폭 1 |  반복 121 / 351 | 시간 125[s] | 손실 1.14
| 에폭 1 |  반복 141 / 351 | 시간 146[s] | 손실 1.09
| 에폭 1 |  반복 161 / 351 | 시간 167[s] | 손실 1.06
| 에폭 1 |  반복 181 / 351 | 시간 189[s] | 손실 1.04
| 에폭 1 |  반복 201 / 351 | 시간 210[s] | 손실 1.03
| 에폭 1 |  반복 221 / 351 | 시간 231[s] | 손실 1.02
| 에폭 1 |  반복 241 / 351 | 시간 251[s] | 손실 1.02
| 에폭 1 |  반복 261 / 351 | 시간 272[s] | 손실 1.01
| 에폭 1 |  반복 281 / 351 | 시간 293[s] | 손실 1.00
| 에폭 1 |  반복 301 / 351 | 시간 314[s] | 손실 1.00
| 에폭 1 |  반복 321 / 351 | 시간 335[s] | 손실 1.00
| 에폭 1 |  반복 341 / 351 | 시간 355[s] | 손실 1.00
Q 10/15/94                     
T 1994-10-15
[91m☒[0m 1978-08-11
---
Q thursday, november 13, 2008  
T 2008-11-13
[91m☒[0m 1978-08-11
---
Q Mar 25, 2003                 
T 2003-03-25
[91m☒[0m 1978

| 에폭 6 |  반복 281 / 351 | 시간 276[s] | 손실 0.00
| 에폭 6 |  반복 301 / 351 | 시간 296[s] | 손실 0.00
| 에폭 6 |  반복 321 / 351 | 시간 316[s] | 손실 0.00
| 에폭 6 |  반복 341 / 351 | 시간 335[s] | 손실 0.00
Q 10/15/94                     
T 1994-10-15
[91m☒[0m 1994-05-15
---
Q thursday, november 13, 2008  
T 2008-11-13
[92m☑[0m 2008-11-13
---
Q Mar 25, 2003                 
T 2003-03-25
[92m☑[0m 2003-03-25
---
Q Tuesday, November 22, 2016   
T 2016-11-22
[92m☑[0m 2016-11-22
---
Q Saturday, July 18, 1970      
T 1970-07-18
[92m☑[0m 1970-07-18
---
Q october 6, 1992              
T 1992-10-06
[92m☑[0m 1992-10-06
---
Q 8/23/08                      
T 2008-08-23
[92m☑[0m 2008-08-23
---
Q 8/30/07                      
T 2007-08-30
[92m☑[0m 2007-08-30
---
Q 10/28/13                     
T 2013-10-28
[91m☒[0m 2013-08-22
---
Q sunday, november 6, 2016     
T 2016-11-06
[91m☒[0m 2016-01-06
---
val acc 81.04
| 에폭 7 |  반복 1 / 351 | 시간 1[s] | 손실 0.11
| 에폭 7 |  반복 21 / 351 | 시간 20[s] | 손실 0.03
| 에폭 7 |  반복