# **Attention Ensemble  - Soft Voting**
---

### **Import Libraries**

In [58]:
import tensorflow as tf
from keras.models import Model
import matplotlib.pyplot as plt
import matplotlib.ticker as ticker
from sklearn.model_selection import train_test_split 

import unicodedata
import re
import numpy as np
import os
import io
import time
import random
import openpyxl

### **데이터 로드**

In [59]:
path_to_file = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/spa-eng/spa.txt'
path_to_file_esb = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/spa-eng/spa_for_esb.txt'

### **데이터 랜덤 셔플**


*   [영어, 스페인어] 쌍 shuffle file 새로 저장
*   번역 테스트 시 주석 처리



In [60]:
# lines = io.open(path_to_file, encoding='UTF-8').read().strip().split('\n')
# random.shuffle(lines)
# f = open(path_to_file_esb, 'w')
# for i in lines:
#     data = i + '\n'
#     f.write(data)
# f.close()

### **데이터(문장) 전처리**

In [61]:
# 유니코드 파일을 아스키 코드 파일로 변환합니다.
def unicode_to_ascii(s):
  return ''.join(c for c in unicodedata.normalize('NFD', s)
      if unicodedata.category(c) != 'Mn')


def preprocess_sentence(w):
  w = unicode_to_ascii(w.lower().strip())

  # 단어와 단어 뒤에 오는 구두점(.)사이에 공백을 생성합니다.
  # 예시: "he is a boy." => "he is a boy ."
  # 참고:- https://stackoverflow.com/questions/3645931/python-padding-punctuation-with-white-spaces-keeping-punctuation
  w = re.sub(r"([?.!,¿])", r" \1 ", w)
  w = re.sub(r'[" "]+', " ", w)

  # (a-z, A-Z, ".", "?", "!", ",")을 제외한 모든 것을 공백으로 대체합니다.
  w = re.sub(r"[^a-zA-Z?.!,¿]+", " ", w)

  w = w.strip()

  # 모델이 예측을 시작하거나 중단할 때를 알게 하기 위해서
  # 문장에 start와 end 토큰을 추가합니다.
  w = '<start> ' + w + ' <end>'
  return w

### **Dataset 생성**
1. 문장에 있는 억양을 제거합니다.
2. 불필요한 문자를 제거하여 문장을 정리합니다.
3. 다음과 같은 형식으로 문장의 쌍을 반환합니다: [영어, 스페인어]

In [62]:
def create_dataset(path, num_examples):
  lines = io.open(path, encoding='UTF-8').read().strip().split('\n')

  word_pairs = [[preprocess_sentence(w) for w in l.split('\t')]  for l in lines[:num_examples]]

  return zip(*word_pairs)

### **Language 가 들어오면 공백 단위로 토큰화**
- fit_on_texts(): 문자 데이터를 입력받아서 리스트의 형태로 변환
- texts_to_sequences: 텍스트 안의 단어들을 숫자 시퀀스로 출력
- pad_sequcences(tensor, padding='post') : 서로 다른 개수의 단어로 이루어진 문장을 같은 길이로 만들어주기 위해 패딩을 사용
  - padding = 'post' : [[ 0  0  0  5  3  2  4], [ 0  0  0  5  3  2  7],...,]
  - padding = 'pre' : 뒤 부터 패딩이 채워짐
  - 가장 긴 sequence 의 길이 만큼
  

In [63]:
def tokenize(lang):
  lang_tokenizer = tf.keras.preprocessing.text.Tokenizer(
      filters='')
  lang_tokenizer.fit_on_texts(lang)

  tensor = lang_tokenizer.texts_to_sequences(lang)

  tensor = tf.keras.preprocessing.sequence.pad_sequences(tensor,
                                                         padding='post')

  return tensor, lang_tokenizer

### **전처리된 타겟 문장과 입력 문장 쌍을 생성**
- input_tensor : input 문장의 패딩 처리된 숫자 시퀀스
- inp_lang_tokenizer : input 문장을 공백 단위로 토큰화, 문자 -> 리스트 변환
- target_tensor, targ_lang_tokenizer : 위와 비슷


In [64]:
def load_dataset(path, num_examples=None):
  
  targ_lang, inp_lang = create_dataset(path, num_examples)

  input_tensor, inp_lang_tokenizer = tokenize(inp_lang)
  target_tensor, targ_lang_tokenizer = tokenize(targ_lang)

  return input_tensor, target_tensor, inp_lang_tokenizer, targ_lang_tokenizer

### **언어 데이터셋 크기 제한**
- 언어 데이터셋을 아래의 크기로 제한하여 훈련과 검증을 수행
- inp_lang, targ_lang : 인풋,타겟 문장의 문자 -> 리스트 변환 결과
- max_length_targ, max_length_inp : 인풋, 타겟 문장의 '패딩된' 숫자 시퀀스 길이 -> 타겟 텐서와 입력 텐서의 최대 길이

In [65]:
# num_examples = 30000
num_examples = 60000
input_tensor, target_tensor, inp_lang, targ_lang = load_dataset(path_to_file_esb, num_examples)

max_length_targ, max_length_inp = target_tensor.shape[1], input_tensor.shape[1]

### **데이터셋 (테스트 & 검증) 분리**

In [66]:
# 훈련 집합과 검증 집합을 80대 20으로 분리합니다.
input_tensor_train, input_tensor_val, target_tensor_train, target_tensor_val = train_test_split(input_tensor, target_tensor, test_size=0.2)

# 훈련 집합과 검증 집합의 데이터 크기를 출력합니다.
print(len(input_tensor_train), len(target_tensor_train), len(input_tensor_val), len(target_tensor_val))

48000 48000 12000 12000


### 인덱스 -> 해당 word 로

```
Input Language; index to word mapping
1 ----> <start>
93 ----> tomas
27 ----> le
1063 ----> escribio
7 ----> a
120 ----> maria
3 ----> .
2 ----> <end>
```


```
Target Language; index to word mapping
1 ----> <start>
8 ----> tom
695 ----> wrote
6 ----> to
31 ----> mary
3 ----> .
2 ----> <end>
```



In [67]:
def convert(lang, tensor):
  for t in tensor:
    if t!=0:
      print ("%d ----> %s" % (t, lang.index_word[t]))

### **Buffer, Batch, epoch, embedding dimension, units 설정**
- Tokenizer 의 word_index 속성 : 속성은 단어와 숫자의 키-값 쌍을 포함하는 딕셔너리를 반환
- 따라서 vocab_inp_size, vocab_inp_size : 인풋, 타겟의 단어-숫자 딕셔너리 최대 길이 + 1 (?)
- dataset.batch(BATCH_SIZE, drop_remainder = True) : 배치사이즈 만큼 분할 후 남은 데이터를 drop 할 것인지 여부
- shuffle : 데이터셋 적절히 섞어준다.

In [68]:
BUFFER_SIZE = len(input_tensor_train)
BATCH_SIZE = 64
steps_per_epoch = len(input_tensor_train)//BATCH_SIZE
embedding_dim = 256
units = 1024
vocab_inp_size = len(inp_lang.word_index)+1
vocab_tar_size = len(targ_lang.word_index)+1

# 훈련 집합에서만 shuffle, batch
dataset = tf.data.Dataset.from_tensor_slices((input_tensor_train, target_tensor_train)).shuffle(BUFFER_SIZE)
dataset = dataset.batch(BATCH_SIZE, drop_remainder=True)

In [69]:
example_input_batch, example_target_batch = next(iter(dataset))
example_input_batch.shape, example_target_batch.shape

(TensorShape([64, 53]), TensorShape([64, 51]))

### **Encoder**


1.   초기화 : vocab_size(단어의 크기), embedding_dim(임베딩 차원 수), enc_units(인코더의 히든 사이즈), batch_sz(배치 사이즈)
  - embedding_dim : 단어 -> 임베딩 벡터로 하기 위한 차원 수
2.  call : gru 에 들어가 output, state 출력
3.  initialize_hidden_state : 맨 처음 gru에 들어가기 위한 더미 입력 값




In [70]:
class Encoder(tf.keras.Model):
  def __init__(self, vocab_size, embedding_dim, enc_units, batch_sz):
    super(Encoder, self).__init__()
    self.batch_sz = batch_sz
    self.enc_units = enc_units
    self.embedding = tf.keras.layers.Embedding(vocab_size, embedding_dim)
    self.gru = tf.keras.layers.GRU(self.enc_units,
                                   return_sequences=True,
                                   return_state=True,
                                   recurrent_initializer='glorot_uniform')

  def call(self, x, hidden):
    x = self.embedding(x)
    output, state = self.gru(x, initial_state = hidden)
    return output, state

  def initialize_hidden_state(self):
    return tf.zeros((self.batch_sz, self.enc_units))

### **Encoder 객체 생성**

In [71]:
# encoder = Encoder(vocab_inp_size, embedding_dim, units, BATCH_SIZE)

### **Attention**


In [72]:
class BahdanauAttention(tf.keras.layers.Layer):
  def __init__(self, units):
    super(BahdanauAttention, self).__init__()
    self.W1 = tf.keras.layers.Dense(units)
    self.W2 = tf.keras.layers.Dense(units)
    self.V = tf.keras.layers.Dense(1)

  def call(self, query, values):
    # 쿼리 은닉 상태(query hidden state)는 (batch_size, hidden size)쌍으로 이루어져 있습니다.
    # query_with_time_axis은 (batch_size, 1, hidden size)쌍으로 이루어져 있습니다.
    # values는 (batch_size, max_len, hidden size)쌍으로 이루어져 있습니다.
    # 스코어(score)계산을 위해 덧셈을 수행하고자 시간 축을 확장하여 아래의 과정을 수행합니다.
    query_with_time_axis = tf.expand_dims(query, 1)

    # score는 (batch_size, max_length, 1)쌍으로 이루어져 있습니다.
    # score를 self.V에 적용하기 때문에 마지막 축에 1을 얻습니다.
    # self.V에 적용하기 전에 텐서는 (batch_size, max_length, units)쌍으로 이루어져 있습니다.
    score = self.V(tf.nn.tanh(
        self.W1(query_with_time_axis) + self.W2(values)))

    # attention_weights는 (batch_size, max_length, 1)쌍으로 이루어져 있습니다. 
    attention_weights = tf.nn.softmax(score, axis=1)

    # 덧셈이후 컨텍스트 벡터(context_vector)는 (batch_size, hidden_size)쌍으로 이루어져 있습니다.
    context_vector = attention_weights * values
    context_vector = tf.reduce_sum(context_vector, axis=1)

    return context_vector, attention_weights

### **Decoder**


1.   초기화 : vocab_size(단어의 크기), embedding_dim(임베딩 차원 수), enc_units(인코더의 히든 사이즈), batch_sz(배치 사이즈)
2.   encoder 와의 차이점 : 마지막 fully_connected_layer(tf.keras.layers.Dense) 추가



In [73]:
class Decoder(tf.keras.Model):
  def __init__(self, vocab_size, embedding_dim, dec_units, batch_sz):
    super(Decoder, self).__init__()
    self.batch_sz = batch_sz
    self.dec_units = dec_units
    self.embedding = tf.keras.layers.Embedding(vocab_size, embedding_dim)
    self.gru = tf.keras.layers.GRU(self.dec_units,
                                   return_sequences=True,
                                   return_state=True,
                                   recurrent_initializer='glorot_uniform')
    self.fc = tf.keras.layers.Dense(vocab_size)

    # 어텐션을 사용합니다.
    self.attention = BahdanauAttention(self.dec_units)

  def call(self, x, hidden, enc_output):
    # enc_output는 (batch_size, max_length, hidden_size)쌍으로 이루어져 있습니다.
    context_vector, attention_weights = self.attention(hidden, enc_output)

    # 임베딩층을 통과한 후 x는 (batch_size, 1, embedding_dim)쌍으로 이루어져 있습니다.
    x = self.embedding(x)

    # 컨텍스트 벡터와 임베딩 결과를 결합한 이후 x의 형태는 (batch_size, 1, embedding_dim + hidden_size)쌍으로 이루어져 있습니다.
    x = tf.concat([tf.expand_dims(context_vector, 1), x], axis=-1)

    # 위에서 결합된 벡터를 GRU에 전달합니다.
    output, state = self.gru(x)

    # output은 (batch_size * 1, hidden_size)쌍으로 이루어져 있습니다.
    output = tf.reshape(output, (-1, output.shape[2]))

    # output은 (batch_size, vocab)쌍으로 이루어져 있습니다.
    x = self.fc(output)

    # return x, state, attention_weights
    return x, state

### **Decoder 객체 생성**

In [74]:
# decoder = Decoder(vocab_tar_size, embedding_dim, units, BATCH_SIZE)

### **NMT Model 생성**

In [75]:
class NMT_Model():
  def __init__(self):
    super(NMT_Model, self).__init__()
    self.encoder = Encoder(vocab_inp_size, embedding_dim, units, BATCH_SIZE)
    self.decoder = Decoder(vocab_tar_size, embedding_dim, units, BATCH_SIZE)

### **Ensemble Model 생성**

In [76]:
models = []
num_models = 5
for m in range(num_models):
  m = NMT_Model()
  models.append(m)


### **Loss Function & Optimizer**

In [77]:
optimizer = tf.keras.optimizers.Adam()
loss_object = tf.keras.losses.SparseCategoricalCrossentropy(
    from_logits=True, reduction='none')

def loss_function(real, pred):
  mask = tf.math.logical_not(tf.math.equal(real, 0))
  loss_ = loss_object(real, pred)

  mask = tf.cast(mask, dtype=loss_.dtype)
  loss_ *= mask

  return tf.reduce_mean(loss_)

### **Chekcpoint**
- 여기서 학습한 매개변수를 저장, optimizer/encoder/decoder

In [78]:
checkpoint_dir = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/training_checkpoints_esb'
checkpoint_dir_test = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/training_checkpoints_esb2'
checkpoint_prefix = os.path.join(checkpoint_dir, "ckpt")
checkpoints = []

for m in range(num_models):
  checkpoint = tf.train.Checkpoint(optimizer=optimizer,
                                 encoder=models[m].encoder,
                                 decoder=models[m].decoder)
  checkpoints.append(checkpoint)


In [79]:
print(checkpoints)

[<tensorflow.python.training.tracking.util.Checkpoint object at 0x7ffb748cf7f0>, <tensorflow.python.training.tracking.util.Checkpoint object at 0x7ffb74a454a8>, <tensorflow.python.training.tracking.util.Checkpoint object at 0x7ffb74ae1a20>, <tensorflow.python.training.tracking.util.Checkpoint object at 0x7ffb74ae13c8>, <tensorflow.python.training.tracking.util.Checkpoint object at 0x7ffb74ae1b00>]


### **Train_step**

In [80]:
# @tf.function
def train_step(model, inp, targ, enc_hidden):
  loss = 0

  with tf.GradientTape() as tape:
    enc_output, enc_hidden = model.encoder(inp, enc_hidden)

    dec_hidden = enc_hidden

    dec_input = tf.expand_dims([targ_lang.word_index['<start>']] * BATCH_SIZE, 1)

    # 교사 강요(teacher forcing) - 다음 입력으로 타겟을 피딩(feeding)합니다.
    for t in range(1, targ.shape[1]):
      # enc_output를 디코더에 전달합니다.
      predictions, dec_hidden = model.decoder(dec_input, dec_hidden, enc_output)
      # print('predictions', predictions.shape)

      loss += loss_function(targ[:, t], predictions)

      # 교사 강요(teacher forcing)를 사용합니다. -> 훈련에서는 실제 값을 이용
      dec_input = tf.expand_dims(targ[:, t], 1)

  batch_loss = (loss / int(targ.shape[1]))
  variables = model.encoder.trainable_variables + model.decoder.trainable_variables
  gradients = tape.gradient(loss, variables)
  optimizer.apply_gradients(zip(gradients, variables))
  return batch_loss

### **학습**
- 학습 코드 X

### **문장 번역(스페인 -> 영어)** 

*   tf.keras.preprocessing.sequence.pad_sequences([inputs], maxlen='', padding='post') : 일정한 길이(maxlen)로 맞춰준다. (패딩은 뒤에서)
*   

  ```
  inp_lang.word_index :  {'<start>': 1, '<end>': 2, '.': 3, 'tom': 4, '?': 5...}
  ```

* tf.expand_dims: 차원을 늘려준다.




In [81]:
def evaluate(sentence):

  sentence = preprocess_sentence(sentence)

  # 문장, input 딕셔너리 출력 
  print ('sentence:', sentence)

  no_word = 'no word'
  inputs = []
  inputs2 = []
  inputs3 = []
  inputs4 = []
  inputs5 = [] 
    
  for i in sentence.split(' '):
    if i in inp_lang.word_index:
        inputs.append(inp_lang.word_index[i])
        inputs2.append(inp_lang.word_index[i])
        inputs3.append(inp_lang.word_index[i])
        inputs4.append(inp_lang.word_index[i])
        inputs5.append(inp_lang.word_index[i])
    else:
        print('no words!')
        return no_word, no_word, no_word, no_word, no_word, no_word, sentence

#   inputs = [inp_lang.word_index[i] for i in sentence.split(' ')]
  inputs = tf.keras.preprocessing.sequence.pad_sequences([inputs],
                                                         maxlen=max_length_inp,
                                                         padding='post')
#   inputs2 = [inp_lang.word_index[i] for i in sentence.split(' ')]
  inputs2 = tf.keras.preprocessing.sequence.pad_sequences([inputs2],
                                                         maxlen=max_length_inp,
                                                         padding='post')
#   inputs3 = [inp_lang.word_index[i] for i in sentence.split(' ')]
  inputs3 = tf.keras.preprocessing.sequence.pad_sequences([inputs3],
                                                         maxlen=max_length_inp,
                                                         padding='post')
#   inputs4 = [inp_lang.word_index[i] for i in sentence.split(' ')]
  inputs4 = tf.keras.preprocessing.sequence.pad_sequences([inputs4],
                                                         maxlen=max_length_inp,
                                                         padding='post')
#   inputs5 = [inp_lang.word_index[i] for i in sentence.split(' ')]
  inputs5 = tf.keras.preprocessing.sequence.pad_sequences([inputs5],
                                                         maxlen=max_length_inp,
                                                         padding='post')
    
  inputs = tf.convert_to_tensor(inputs)
  inputs2 = tf.convert_to_tensor(inputs2)
  inputs3 = tf.convert_to_tensor(inputs3)
  inputs4 = tf.convert_to_tensor(inputs2)
  inputs5 = tf.convert_to_tensor(inputs3)


  result1 = ''
  result2 = ''
  result3 = ''
  result4 = ''
  result5 = ''
  voting_result = ''

  hidden = [tf.zeros((1, units))]
  hidden2 = [tf.zeros((1, units))]
  hidden3 = [tf.zeros((1, units))]
  hidden4 = [tf.zeros((1, units))]
  hidden5 = [tf.zeros((1, units))]

  # Encoder 의 hidden 을 Decoder 의 hidden 으로 받는다.
  enc_out, enc_hidden = models[0].encoder(inputs, hidden)

  enc_out2, enc_hidden2 = models[1].encoder(inputs2, hidden2)

  enc_out3, enc_hidden3 = models[2].encoder(inputs3, hidden3)

  enc_out4, enc_hidden4 = models[3].encoder(inputs4, hidden4)

  enc_out5, enc_hidden5 = models[4].encoder(inputs5, hidden5)



  dec_hidden = enc_hidden
  dec_hidden2 = enc_hidden2
  dec_hidden3 = enc_hidden3
  dec_hidden4 = enc_hidden4
  dec_hidden5 = enc_hidden5



  # Decoder 의 시작인 '<start>' 
  dec_input = tf.expand_dims([targ_lang.word_index['<start>']], 0)
  dec_input2 = tf.expand_dims([targ_lang.word_index['<start>']], 0)
  dec_input3 = tf.expand_dims([targ_lang.word_index['<start>']], 0)
  dec_input4 = tf.expand_dims([targ_lang.word_index['<start>']], 0)
  dec_input5 = tf.expand_dims([targ_lang.word_index['<start>']], 0)

  # Target 의 최대 길이 만큼 출력
  for t in range(max_length_inp):
    predictions, dec_hidden = models[0].decoder(dec_input,
                                                         dec_hidden,
                                                         enc_out)
    predictions2, dec_hidden2 = models[1].decoder(dec_input2,
                                                         dec_hidden2,
                                                         enc_out2)
    predictions3, dec_hidden3 = models[2].decoder(dec_input3,
                                                         dec_hidden3,
                                                         enc_out3)
    predictions4, dec_hidden4 = models[3].decoder(dec_input4,
                                                         dec_hidden4,
                                                         enc_out4)
    predictions5, dec_hidden5 = models[4].decoder(dec_input5,
                                                         dec_hidden5,
                                                         enc_out5)
    
    
    predicted_id = tf.argmax(predictions[0]).numpy() 
    predicted_id2 = tf.argmax(predictions2[0]).numpy() 
    predicted_id3 = tf.argmax(predictions3[0]).numpy() 
    predicted_id4 = tf.argmax(predictions4[0]).numpy() 
    predicted_id5 = tf.argmax(predictions5[0]).numpy()
    
    # Soft Voting
    predictions_sum = tf.add(predictions[0], predictions2[0], predictions3[0])
    predictions_sum = tf.add(predictions_sum, predictions4[0], predictions5[0])
    mean = tf.divide(predictions_sum, 5)
    voting_id = tf.argmax(mean).numpy()

    # tensorflow 에서 .numpy(): Tensor -> Numpy 로 바꿔주는 역할
    # predictions[0]  = tf.Tensor([-7.6920695 -7.9410057  3.7609155 ... ])

    print('p1 : ', predicted_id, mean[predicted_id])
    print('p2 : ', predicted_id2, mean[predicted_id2])
    print('p3 : ', predicted_id3, mean[predicted_id3])
    print('p4 : ', predicted_id4, mean[predicted_id4])
    print('p5 : ', predicted_id5, mean[predicted_id5])
    print('voting : ', voting_id, mean[voting_id])
    
    result1 += targ_lang.index_word[predicted_id] + ' '
    result2 += targ_lang.index_word[predicted_id2] + ' '
    result3 += targ_lang.index_word[predicted_id3] + ' '
    result4 += targ_lang.index_word[predicted_id4] + ' '
    result5 += targ_lang.index_word[predicted_id5] + ' '
    voting_result += targ_lang.index_word[voting_id] + ' '


    if targ_lang.index_word[voting_id] == '<end>':
      return result1, result2, result3, result4, result5, voting_result, sentence

    # 예측된 ID를 모델에 다시 피드합니다. (voting_id)
    dec_input = tf.expand_dims([voting_id], 0)
    dec_input2 = tf.expand_dims([voting_id], 0)
    dec_input3 = tf.expand_dims([voting_id], 0)
    dec_input4 = tf.expand_dims([voting_id], 0)
    dec_input5 = tf.expand_dims([voting_id], 0)

  return result1, result2, result3, result4, result5, voting_result, sentence

In [82]:
def translate(sentence, start_row):
    result1, result2, result3, result4, result5, voting_result, sentence = evaluate(sentence)
    result_list = [('Model 1', result1),
                   ('Model 2', result2),
                   ('Model 3', result3),
                   ('Model 4', result4),
                   ('Model 5', result5),
                   ('SoftVoting', voting_result)]
        
    # 엑셀 파일 불러오기
    wb = openpyxl.load_workbook('Accuracy_Compare.xlsx')

    # 엑셀 파일의 시트 활성화
    sheet = wb['SoftVoting(2)']

    
    for (model, item) in enumerate(result_list):
        if item[0] != 'SoftVoting':
            sheet.cell(row = start_row + model, column = 5).value = item[1]
        else :    
            sheet.cell(row = start_row + model, column = 6).value = item[1]
        
    
    wb.save('Accuracy_Compare.xlsx')

### **Checkpoint 복원**

In [83]:
ckp_dir_m1 = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/5 Models Checkpoints_60000/training_checkpoints_esb'
ckp_dir_m2 = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/5 Models Checkpoints_60000/training_checkpoints_esb 2'
ckp_dir_m3 = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/5 Models Checkpoints_60000/training_checkpoints_esb 3'
ckp_dir_m4 = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/5 Models Checkpoints_60000/training_checkpoints_esb 4'
ckp_dir_m5 = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/5 Models Checkpoints_60000/training_checkpoints_esb 5'

In [84]:
# checkpoint_dir내에 있는 최근 체크포인트(checkpoint)를 복원
checkpoints[0].restore(tf.train.latest_checkpoint(ckp_dir_m1))
checkpoints[1].restore(tf.train.latest_checkpoint(ckp_dir_m2))
checkpoints[2].restore(tf.train.latest_checkpoint(ckp_dir_m3))
checkpoints[3].restore(tf.train.latest_checkpoint(ckp_dir_m4))
checkpoints[4].restore(tf.train.latest_checkpoint(ckp_dir_m5))

### 이 코드로 했을 때 학습 바로 돌렸을 때와 같은 결과가 나왔음.

<tensorflow.python.training.tracking.util.CheckpointLoadStatus at 0x7ffb7bb3c278>

### **번역 시작**

In [85]:
# test dataset 파일 불러오기
testdata = '/Users/ahjeong_park/Study/Attention-Ensemble-Translation/Test_Dataset/test_data.txt'
start_row = 2

f = open(testdata, 'r')
lines = f.readlines()

for sentence in lines:
    translate(sentence, start_row)
    start_row += 6
    
f.close()

sentence: <start> hace mucho frio aqui . <end>
p1 :  14 tf.Tensor(7.0809298, shape=(), dtype=float32)
p2 :  14 tf.Tensor(7.0809298, shape=(), dtype=float32)
p3 :  14 tf.Tensor(7.0809298, shape=(), dtype=float32)
p4 :  14 tf.Tensor(7.0809298, shape=(), dtype=float32)
p5 :  14 tf.Tensor(7.0809298, shape=(), dtype=float32)
voting :  14 tf.Tensor(7.0809298, shape=(), dtype=float32)
p1 :  15 tf.Tensor(8.368726, shape=(), dtype=float32)
p2 :  15 tf.Tensor(8.368726, shape=(), dtype=float32)
p3 :  15 tf.Tensor(8.368726, shape=(), dtype=float32)
p4 :  15 tf.Tensor(8.368726, shape=(), dtype=float32)
p5 :  15 tf.Tensor(8.368726, shape=(), dtype=float32)
voting :  15 tf.Tensor(8.368726, shape=(), dtype=float32)
p1 :  89 tf.Tensor(6.233055, shape=(), dtype=float32)
p2 :  9 tf.Tensor(5.656337, shape=(), dtype=float32)
p3 :  58 tf.Tensor(6.4271345, shape=(), dtype=float32)
p4 :  89 tf.Tensor(6.233055, shape=(), dtype=float32)
p5 :  58 tf.Tensor(6.4271345, shape=(), dtype=float32)
voting :  58 tf.Tens

p1 :  2 tf.Tensor(12.641177, shape=(), dtype=float32)
p2 :  2 tf.Tensor(12.641177, shape=(), dtype=float32)
p3 :  2 tf.Tensor(12.641177, shape=(), dtype=float32)
p4 :  2 tf.Tensor(12.641177, shape=(), dtype=float32)
p5 :  2 tf.Tensor(12.641177, shape=(), dtype=float32)
voting :  2 tf.Tensor(12.641177, shape=(), dtype=float32)
sentence: <start> te quiero <end>
p1 :  4 tf.Tensor(9.020082, shape=(), dtype=float32)
p2 :  4 tf.Tensor(9.020082, shape=(), dtype=float32)
p3 :  4 tf.Tensor(9.020082, shape=(), dtype=float32)
p4 :  4 tf.Tensor(9.020082, shape=(), dtype=float32)
p5 :  4 tf.Tensor(9.020082, shape=(), dtype=float32)
voting :  4 tf.Tensor(9.020082, shape=(), dtype=float32)
p1 :  155 tf.Tensor(8.645081, shape=(), dtype=float32)
p2 :  155 tf.Tensor(8.645081, shape=(), dtype=float32)
p3 :  155 tf.Tensor(8.645081, shape=(), dtype=float32)
p4 :  155 tf.Tensor(8.645081, shape=(), dtype=float32)
p5 :  155 tf.Tensor(8.645081, shape=(), dtype=float32)
voting :  155 tf.Tensor(8.645081, shape=(

p1 :  3 tf.Tensor(8.145944, shape=(), dtype=float32)
p2 :  3 tf.Tensor(8.145944, shape=(), dtype=float32)
p3 :  3 tf.Tensor(8.145944, shape=(), dtype=float32)
p4 :  3 tf.Tensor(8.145944, shape=(), dtype=float32)
p5 :  3 tf.Tensor(8.145944, shape=(), dtype=float32)
voting :  3 tf.Tensor(8.145944, shape=(), dtype=float32)
p1 :  2 tf.Tensor(11.722887, shape=(), dtype=float32)
p2 :  2 tf.Tensor(11.722887, shape=(), dtype=float32)
p3 :  2 tf.Tensor(11.722887, shape=(), dtype=float32)
p4 :  2 tf.Tensor(11.722887, shape=(), dtype=float32)
p5 :  2 tf.Tensor(11.722887, shape=(), dtype=float32)
voting :  2 tf.Tensor(11.722887, shape=(), dtype=float32)
sentence: <start> lo vi en las noticias . <end>
p1 :  4 tf.Tensor(8.511064, shape=(), dtype=float32)
p2 :  4 tf.Tensor(8.511064, shape=(), dtype=float32)
p3 :  4 tf.Tensor(8.511064, shape=(), dtype=float32)
p4 :  4 tf.Tensor(8.511064, shape=(), dtype=float32)
p5 :  4 tf.Tensor(8.511064, shape=(), dtype=float32)
voting :  4 tf.Tensor(8.511064, shape

p1 :  159 tf.Tensor(5.3457804, shape=(), dtype=float32)
p2 :  7 tf.Tensor(3.1796029, shape=(), dtype=float32)
p3 :  76 tf.Tensor(2.3185184, shape=(), dtype=float32)
p4 :  159 tf.Tensor(5.3457804, shape=(), dtype=float32)
p5 :  5 tf.Tensor(5.1104283, shape=(), dtype=float32)
voting :  159 tf.Tensor(5.3457804, shape=(), dtype=float32)
p1 :  5 tf.Tensor(7.634122, shape=(), dtype=float32)
p2 :  5 tf.Tensor(7.634122, shape=(), dtype=float32)
p3 :  5 tf.Tensor(7.634122, shape=(), dtype=float32)
p4 :  5 tf.Tensor(7.634122, shape=(), dtype=float32)
p5 :  5 tf.Tensor(7.634122, shape=(), dtype=float32)
voting :  5 tf.Tensor(7.634122, shape=(), dtype=float32)
p1 :  372 tf.Tensor(6.70055, shape=(), dtype=float32)
p2 :  372 tf.Tensor(6.70055, shape=(), dtype=float32)
p3 :  372 tf.Tensor(6.70055, shape=(), dtype=float32)
p4 :  372 tf.Tensor(6.70055, shape=(), dtype=float32)
p5 :  372 tf.Tensor(6.70055, shape=(), dtype=float32)
voting :  372 tf.Tensor(6.70055, shape=(), dtype=float32)
p1 :  3 tf.Tens

p1 :  20 tf.Tensor(4.1505136, shape=(), dtype=float32)
p2 :  11 tf.Tensor(4.914061, shape=(), dtype=float32)
p3 :  17 tf.Tensor(5.723857, shape=(), dtype=float32)
p4 :  17 tf.Tensor(5.723857, shape=(), dtype=float32)
p5 :  17 tf.Tensor(5.723857, shape=(), dtype=float32)
voting :  17 tf.Tensor(5.723857, shape=(), dtype=float32)
p1 :  5 tf.Tensor(3.5606563, shape=(), dtype=float32)
p2 :  623 tf.Tensor(3.8838334, shape=(), dtype=float32)
p3 :  623 tf.Tensor(3.8838334, shape=(), dtype=float32)
p4 :  623 tf.Tensor(3.8838334, shape=(), dtype=float32)
p5 :  11 tf.Tensor(2.7585983, shape=(), dtype=float32)
voting :  623 tf.Tensor(3.8838334, shape=(), dtype=float32)
p1 :  6 tf.Tensor(7.7008514, shape=(), dtype=float32)
p2 :  6 tf.Tensor(7.7008514, shape=(), dtype=float32)
p3 :  6 tf.Tensor(7.7008514, shape=(), dtype=float32)
p4 :  6 tf.Tensor(7.7008514, shape=(), dtype=float32)
p5 :  6 tf.Tensor(7.7008514, shape=(), dtype=float32)
voting :  6 tf.Tensor(7.7008514, shape=(), dtype=float32)
p1 :  

p1 :  5 tf.Tensor(8.686414, shape=(), dtype=float32)
p2 :  5 tf.Tensor(8.686414, shape=(), dtype=float32)
p3 :  5 tf.Tensor(8.686414, shape=(), dtype=float32)
p4 :  5 tf.Tensor(8.686414, shape=(), dtype=float32)
p5 :  5 tf.Tensor(8.686414, shape=(), dtype=float32)
voting :  5 tf.Tensor(8.686414, shape=(), dtype=float32)
p1 :  900 tf.Tensor(8.148309, shape=(), dtype=float32)
p2 :  900 tf.Tensor(8.148309, shape=(), dtype=float32)
p3 :  900 tf.Tensor(8.148309, shape=(), dtype=float32)
p4 :  900 tf.Tensor(8.148309, shape=(), dtype=float32)
p5 :  900 tf.Tensor(8.148309, shape=(), dtype=float32)
voting :  900 tf.Tensor(8.148309, shape=(), dtype=float32)
p1 :  18 tf.Tensor(8.389902, shape=(), dtype=float32)
p2 :  18 tf.Tensor(8.389902, shape=(), dtype=float32)
p3 :  18 tf.Tensor(8.389902, shape=(), dtype=float32)
p4 :  18 tf.Tensor(8.389902, shape=(), dtype=float32)
p5 :  18 tf.Tensor(8.389902, shape=(), dtype=float32)
voting :  18 tf.Tensor(8.389902, shape=(), dtype=float32)
p1 :  5 tf.Tenso

p1 :  66 tf.Tensor(3.524365, shape=(), dtype=float32)
p2 :  135 tf.Tensor(6.873769, shape=(), dtype=float32)
p3 :  9 tf.Tensor(3.7533944, shape=(), dtype=float32)
p4 :  135 tf.Tensor(6.873769, shape=(), dtype=float32)
p5 :  135 tf.Tensor(6.873769, shape=(), dtype=float32)
voting :  135 tf.Tensor(6.873769, shape=(), dtype=float32)
p1 :  1471 tf.Tensor(2.3296847, shape=(), dtype=float32)
p2 :  1834 tf.Tensor(3.7487493, shape=(), dtype=float32)
p3 :  415 tf.Tensor(0.52129894, shape=(), dtype=float32)
p4 :  1926 tf.Tensor(3.8849933, shape=(), dtype=float32)
p5 :  371 tf.Tensor(2.0971897, shape=(), dtype=float32)
voting :  18 tf.Tensor(4.3327403, shape=(), dtype=float32)
p1 :  5289 tf.Tensor(2.764978, shape=(), dtype=float32)
p2 :  1834 tf.Tensor(4.0953445, shape=(), dtype=float32)
p3 :  1844 tf.Tensor(0.27962178, shape=(), dtype=float32)
p4 :  135 tf.Tensor(3.9990926, shape=(), dtype=float32)
p5 :  654 tf.Tensor(2.6702933, shape=(), dtype=float32)
voting :  1834 tf.Tensor(4.0953445, shape=

p1 :  17 tf.Tensor(7.4892683, shape=(), dtype=float32)
p2 :  17 tf.Tensor(7.4892683, shape=(), dtype=float32)
p3 :  17 tf.Tensor(7.4892683, shape=(), dtype=float32)
p4 :  17 tf.Tensor(7.4892683, shape=(), dtype=float32)
p5 :  17 tf.Tensor(7.4892683, shape=(), dtype=float32)
voting :  17 tf.Tensor(7.4892683, shape=(), dtype=float32)
p1 :  10 tf.Tensor(7.590493, shape=(), dtype=float32)
p2 :  10 tf.Tensor(7.590493, shape=(), dtype=float32)
p3 :  10 tf.Tensor(7.590493, shape=(), dtype=float32)
p4 :  10 tf.Tensor(7.590493, shape=(), dtype=float32)
p5 :  10 tf.Tensor(7.590493, shape=(), dtype=float32)
voting :  10 tf.Tensor(7.590493, shape=(), dtype=float32)
p1 :  2 tf.Tensor(11.6076145, shape=(), dtype=float32)
p2 :  2 tf.Tensor(11.6076145, shape=(), dtype=float32)
p3 :  2 tf.Tensor(11.6076145, shape=(), dtype=float32)
p4 :  2 tf.Tensor(11.6076145, shape=(), dtype=float32)
p5 :  2 tf.Tensor(11.6076145, shape=(), dtype=float32)
voting :  2 tf.Tensor(11.6076145, shape=(), dtype=float32)
sent

p1 :  88 tf.Tensor(9.164856, shape=(), dtype=float32)
p2 :  88 tf.Tensor(9.164856, shape=(), dtype=float32)
p3 :  88 tf.Tensor(9.164856, shape=(), dtype=float32)
p4 :  88 tf.Tensor(9.164856, shape=(), dtype=float32)
p5 :  88 tf.Tensor(9.164856, shape=(), dtype=float32)
voting :  88 tf.Tensor(9.164856, shape=(), dtype=float32)
p1 :  15 tf.Tensor(10.191633, shape=(), dtype=float32)
p2 :  15 tf.Tensor(10.191633, shape=(), dtype=float32)
p3 :  15 tf.Tensor(10.191633, shape=(), dtype=float32)
p4 :  15 tf.Tensor(10.191633, shape=(), dtype=float32)
p5 :  15 tf.Tensor(10.191633, shape=(), dtype=float32)
voting :  15 tf.Tensor(10.191633, shape=(), dtype=float32)
p1 :  49 tf.Tensor(4.234207, shape=(), dtype=float32)
p2 :  399 tf.Tensor(5.19164, shape=(), dtype=float32)
p3 :  68 tf.Tensor(5.3761, shape=(), dtype=float32)
p4 :  68 tf.Tensor(5.3761, shape=(), dtype=float32)
p5 :  399 tf.Tensor(5.19164, shape=(), dtype=float32)
voting :  68 tf.Tensor(5.3761, shape=(), dtype=float32)
p1 :  505 tf.Ten

p1 :  42 tf.Tensor(8.614845, shape=(), dtype=float32)
p2 :  42 tf.Tensor(8.614845, shape=(), dtype=float32)
p3 :  42 tf.Tensor(8.614845, shape=(), dtype=float32)
p4 :  42 tf.Tensor(8.614845, shape=(), dtype=float32)
p5 :  42 tf.Tensor(8.614845, shape=(), dtype=float32)
voting :  42 tf.Tensor(8.614845, shape=(), dtype=float32)
p1 :  31 tf.Tensor(9.572119, shape=(), dtype=float32)
p2 :  31 tf.Tensor(9.572119, shape=(), dtype=float32)
p3 :  31 tf.Tensor(9.572119, shape=(), dtype=float32)
p4 :  31 tf.Tensor(9.572119, shape=(), dtype=float32)
p5 :  31 tf.Tensor(9.572119, shape=(), dtype=float32)
voting :  31 tf.Tensor(9.572119, shape=(), dtype=float32)
p1 :  77 tf.Tensor(10.221904, shape=(), dtype=float32)
p2 :  77 tf.Tensor(10.221904, shape=(), dtype=float32)
p3 :  77 tf.Tensor(10.221904, shape=(), dtype=float32)
p4 :  77 tf.Tensor(10.221904, shape=(), dtype=float32)
p5 :  77 tf.Tensor(10.221904, shape=(), dtype=float32)
voting :  77 tf.Tensor(10.221904, shape=(), dtype=float32)
p1 :  314 

p1 :  110 tf.Tensor(8.437097, shape=(), dtype=float32)
p2 :  110 tf.Tensor(8.437097, shape=(), dtype=float32)
p3 :  110 tf.Tensor(8.437097, shape=(), dtype=float32)
p4 :  110 tf.Tensor(8.437097, shape=(), dtype=float32)
p5 :  110 tf.Tensor(8.437097, shape=(), dtype=float32)
voting :  110 tf.Tensor(8.437097, shape=(), dtype=float32)
p1 :  10 tf.Tensor(8.033465, shape=(), dtype=float32)
p2 :  10 tf.Tensor(8.033465, shape=(), dtype=float32)
p3 :  10 tf.Tensor(8.033465, shape=(), dtype=float32)
p4 :  10 tf.Tensor(8.033465, shape=(), dtype=float32)
p5 :  10 tf.Tensor(8.033465, shape=(), dtype=float32)
voting :  10 tf.Tensor(8.033465, shape=(), dtype=float32)
p1 :  2 tf.Tensor(11.671351, shape=(), dtype=float32)
p2 :  2 tf.Tensor(11.671351, shape=(), dtype=float32)
p3 :  2 tf.Tensor(11.671351, shape=(), dtype=float32)
p4 :  2 tf.Tensor(11.671351, shape=(), dtype=float32)
p5 :  2 tf.Tensor(11.671351, shape=(), dtype=float32)
voting :  2 tf.Tensor(11.671351, shape=(), dtype=float32)


### 긴 문장 번역 Test ###

Le preguntó qué estaba pasando, pero ella no dijo nada.

He asked her what was going on, but she didn't say anything.


In [86]:
# long_test = u'Le preguntó qué estaba pasando, pero ella no dijo nada.'
# translate(long_test)

### 더 긴 문장 번역 Test ###

Si quieres sonar como un hablante nativo, debes estar dispuesto a practicar diciendo la misma frase una y otra vez de la misma manera en que un músico de banjo practica el mismo fraseo una y otra vez hasta que lo puedan tocar correctamente y en el tiempo esperado.

If you want to sound like a native speaker, you must be willing toq practice saying the same sentence over and over in the same way that banjo players practice the same phrase over and over until they can play it correctly and at the desired tempo.

In [87]:
# long_test2 = u'Si quieres sonar como un hablante nativo, debes estar dispuesto a practicar diciendo la misma frase una y otra vez de la misma manera en que un músico de banjo practica el mismo fraseo una y otra vez hasta que lo puedan tocar correctamente y en el tiempo esperado.'

# translate(long_test)