In [37]:
import torch
import torch.nn as nn
import torch.optim as optim
import torch.nn.functional as F
import random
import re
import numpy as np
import pandas as pd
import pickle
from torch.optim.lr_scheduler import StepLR

In [38]:
#Hyperparameter

hidden_size = 256
PAD_TOKEN = 0
SOS_TOKEN = 1
EOS_TOKEN = 2
UNK_TOKEN = 3
MAX_LENGTH = 300
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")

In [39]:
device

device(type='cuda')

In [40]:
def clean_text(text):
    if pd.isna(text): # NaN 값 처리
        return ''
    text = text.lower()
    text = re.sub(r'\d+', ' ', text) # 숫자는 공백으로 처리
    text = re.sub(r'([^\w\s])', r' \1 ', text) # 마침표 앞 뒤로 공백 추가
    text = re.sub(r'\s+', ' ', text) # 두 개 이상의 공백을 하나로 처리
    text = text.strip() # 텍스트 양 옆의 공백 제거
    
    return text

In [41]:
def indiceFromSentence(vocab, sentence):
    return [vocab.get(word, vocab['<UNK>']) for word in sentence.split(' ')]

In [42]:
def tensorFromSentence(vocab, sentence):
    indice = indiceFromSentence(vocab, sentence)
    indice.append(EOS_TOKEN)
    return torch.tensor(indice, dtype=torch.long, device=device).view(-1, 1)

In [43]:
class EncoderLSTM(nn.Module):
    def __init__(self, input_size, hidden_size):
        super(EncoderLSTM, self).__init__()
        self.hidden_size = hidden_size
        self.embedding = nn.Embedding(input_size, hidden_size)
        self.lstm = nn.LSTM(hidden_size, hidden_size, num_layers=2)
        
    def forward(self, input, hidden):
        embedded = self.embedding(input).view(1, 1, -1)
        output, hidden = self.lstm(embedded, hidden)
        return output, hidden
    
    def initHidden(self):
        return(torch.zeros(2, 1, self.hidden_size, device=device), torch.zeros(2, 1, self.hidden_size, device=device))

In [44]:
class AttentionDecoderLSTM(nn.Module):
    def __init__(self, hidden_size, output_size):
        super(AttentionDecoderLSTM, self).__init__()
        self.hidden_size = hidden_size
        self.embedding = nn.Embedding(output_size, self.hidden_size)
        self.lstm = nn.LSTM(hidden_size, hidden_size, num_layers=2)
        self.out = nn.Linear(hidden_size, output_size)
        
    def forward(self, input, hidden, encoder_outputs):
        
        embedded = self.embedding(input).view(1, 1, -1)
        attention_weights = F.softmax(torch.bmm(encoder_outputs.unsqueeze(0), hidden[0][0].unsqueeze(2)).squeeze(2), dim=1) # batch matrix multiplication
        attention_applied = torch.bmm(attention_weights.unsqueeze(0), encoder_outputs.unsqueeze(0))
        
        new_hidden = (torch.vstack([attention_applied, attention_applied]), hidden[1])
        output, hidden = self.lstm(embedded[0].unsqueeze(0), new_hidden)
        output = self.out(output[0])
        return output, hidden, attention_weights
    
    def initHidden(self):
        return(torch.zeros(2, 1, self.hidden_size, device=device), torch.zeros(2, 1, self.hidden_size, device=device))

In [68]:
def train(input_tensor, target_tensor, encoder, decoder, encoder_optimizer, decoder_optimizer, criterion, max_length=MAX_LENGTH):
    encoder_hidden = encoder.initHidden()
    
    encoder_optimizer.zero_grad()
    decoder_optimizer.zero_grad()
    
    input_length = input_tensor.size(0)
    target_length = target_tensor.size(0)
    
    encoder_outputs = torch.zeros(max_length, encoder.hidden_size, device=device)
    
    loss = 0    
    
    for ei in range(input_length):
        encoder_output, encoder_hidden = encoder(input_tensor[ei], encoder_hidden)
        encoder_outputs[ei] += encoder_output[0, 0]
        
    decoder_input = torch.tensor([[SOS_TOKEN]], device=device)
    decoder_hidden = encoder_hidden
    
    for di in range(target_length):
        decoder_output, decoder_hidden, decoder_attention = decoder(decoder_input, decoder_hidden, encoder_outputs)
        topv, topi = decoder_output.topk(1)
        decoder_input = topi.squeeze().detach()
        loss += criterion(decoder_output, target_tensor[di])
        
        if decoder_input.item() == EOS_TOKEN:
            break
        
    loss.backward() # 역전파 
    
    encoder_optimizer.step()
    decoder_optimizer.step()
    
    return loss.item() / target_length
    
    

In [73]:
def trainIters(encoder, decoder, n_iters, print_every=1000, learning_rate=0.01):
    print_loss_total = 0
    
    scheduler_encoder = StepLR(encoder_optimizer, step_size=10, gamma=0.1) # 10번마다 학습률이 10%로 줄인다.
    scheduler_decoder = StepLR(decoder_optimizer, step_size=10, gamma=0.1)
    min_loss = 1000000
    
    for iter in range(1, n_iters+1):
        training_pair = random.choice(pairs) # input - target pair
        input_tensor = tensorFromSentence(word_to_idx, training_pair[0]).to(device)
        target_tensor = tensorFromSentence(word_to_idx, training_pair[1]).to(device)
        
        loss = train(input_tensor, target_tensor, encoder, decoder, encoder_optimizer, decoder_optimizer, criterion)
        print_loss_total += loss
        
        if iter % print_every == 0:
            print_loss_avg = print_loss_total / print_every
            print(f'Iteration : {iter}, Loss : {print_loss_avg: .4f}')
            print_loss_total = 0
            
            if min_loss > print_loss_avg:
                torch.save(encoder.state_dict(), './encoder_seq2seq_attention_dot_' + str(iter) + '.pth')
                torch.save(decoder.state_dict(), '/decoder_seq2seq_attention_dot_' + str(iter) + '.pth')
                min_loss = print_loss_avg
            
            scheduler_encoder.step()
            scheduler_decoder.step()

In [77]:
def evaluate(encoder, decoder, sentence, max_length=MAX_LENGTH):
    with torch.no_grad():
        input_tensor = tensorFromSentence(word_to_idx, sentence).to(device)
        input_length = input_tensor.size(0)
        encoder_hidden = encoder.initHidden()
        encoder_outputs = torch.zeros(max_length, encoder.hidden_size, device=device)
        
        for ei in range(input_length):
            encoder_output, encoder_hidden = encoder(input_tensor[ei], encoder_hidden)
            encoder_outputs[ei] += encoder_output[0, 0]
            
        decoder_input = torch.tensor([[SOS_TOKEN]], device=device)
        decoder_hidden = encoder_hidden
        decoded_words = [] # output sentence
        
        decoder_attentions = torch.zeros(max_length, max_length)
        
        for di in range(max_length):
            decoder_output, decoder_hidden, decoder_attention = decoder(decoder_input, decoder_hidden, encoder_outputs)
            decoder_attentions[di] = decoder_attention.data
            topv, topi = decoder_output.data.topk(1)
            if topi.item() == EOS_TOKEN:
                decoded_words.append('<EOS>')
                break
            else:
                decoded_words.append(idx_to_word[topi.item()]) # 최종 아웃풋의 index
            
            decoder_input = topi.squeeze().detach()
        
        meaningful_words = [word for word in decoded_words if word not in ('<EOS>', '<UNK>')]
        final_output = ' '.join(meaningful_words)
        return final_output

In [48]:
def chat(encoder, decoder, max_length=MAX_LENGTH):
    print("Let's chat (type 'bye' to exit)")
    while True:
        input_sentence = input(">>")
        if input_sentence == 'bye':
            break
        output_sentence = evaluate(encoder, decoder, input_sentence)
        print('<', output_sentence)

In [49]:
# load data and preprocessing
df = pd.read_csv('./dementia_fix.csv', sep=',', names=['Question', 'Intention', 'Answer'], skiprows=1)
df['Encoder Inputs'] = df['Question'].apply(clean_text)
df['Decoder Inputs'] = df['Answer'].apply(clean_text)


In [50]:
df['Encoder Inputs']

0       알츠하이머병의 원인으로 매일 소주를 섭취하는 것이 언급되고 있는데 , 이에 대한 근...
1                         알츠하이머병이라는 질병은 유전적 영향을 받는 것인가요 ?
2                     알츠하이머병의 발생 원인에 대한 연구나 발견이 진행 중인가요 ?
3              알츠하이머병의 발병과 관련하여 뇌의 노화로 인한 증상과 원인을 알려주세요 .
4                   알츠하이머병의 원인과 관련된 연구 결과가 있을까요 ? 알려주세요 .
                              ...                        
6618                         치매 치료에는 어떤 운동이나 작업이 효과적일까요 ?
6619    치매 치료의 결과와 과정을 상세히 설명해주세요 . 치매 치료의 효과는 어떻게 나타날...
6620                      치매를 치료하기 위해 어떤 치료 방법들이 효과적일까요 ?
6621                        치매 치료를 위해 어떤 약물이 사용될 수 있을까요 ?
6622                         치매 치료를 위해 어떤 전문가와 협력해야 할까요 ?
Name: Encoder Inputs, Length: 6623, dtype: object

In [51]:
df['Decoder Inputs']

0       알츠하이머병의 정확한 원인은 아직 밝혀지지 않았지만 , 연구들이 알츠하이머병의 발병...
1       알츠하이머병은 현재까지 완전한 원인이 밝혀지지 않았습니다 . 알츠하이머병은 아직 완...
2       알츠하이머병은 치매를 일으키는 가장 흔한 퇴행성 뇌질환으로 , 년 독일 의사 알로이...
3       알츠하이머병은 현재까지 그 발병 원인에 대한 완벽한 해명은 아직 이루어지지 않았습니...
4       알츠하이머병은 복잡한 질환으로 , 아직도 원인이 완전히 밝혀진 것은 아닙니다 . 그...
                              ...                        
6618    치매는 노인들에게 주로 발생하는 뇌질환으로 , 원인과 치료 방법은 아직 완전히 밝혀...
6619    치매는 일상 생활을 수행하는 능력을 심각하게 손상시키는 질환으로 , 후천성 치매와 ...
6620    치매는 노화로 인해 기억력과 지능을 점차적으로 잃는 질병으로 , 알츠하이머병이 주요...
6621    알츠하이머병은 뇌에 변화가 생겨서 인지 기능에 장애가 생기는 신경퇴행성 질환입니다 ...
6622    치매는 현재까지 완전한 치료가 불가능한 치매입니다 . 치매는 다양한 원인에 의해 발...
Name: Decoder Inputs, Length: 6623, dtype: object

In [52]:
input_sentence = [sentence for sentence in df['Encoder Inputs']]
output_sentence = [sentence + "<EOS>" for sentence in df['Decoder Inputs']]

In [53]:
input_sentence[0:5]

['알츠하이머병의 원인으로 매일 소주를 섭취하는 것이 언급되고 있는데 , 이에 대한 근거가 있는지 알려주세요 .',
 '알츠하이머병이라는 질병은 유전적 영향을 받는 것인가요 ?',
 '알츠하이머병의 발생 원인에 대한 연구나 발견이 진행 중인가요 ?',
 '알츠하이머병의 발병과 관련하여 뇌의 노화로 인한 증상과 원인을 알려주세요 .',
 '알츠하이머병의 원인과 관련된 연구 결과가 있을까요 ? 알려주세요 .']

In [54]:
output_sentence[0:5]

['알츠하이머병의 정확한 원인은 아직 밝혀지지 않았지만 , 연구들이 알츠하이머병의 발병 기전에 대해 논의하고 있습니다 . 일부 연구에 따르면 , 유전적인 요소와 뇌의 기능 손상이 관련되어 있다고 알려져 있습니다 . 알츠하이머병은 아밀로이드 베타 단백질과 타우 단백질의 과도한 생성 , 뇌 세포의 비정상적인 활동 , 뇌 조직의 변화로 인해 발생하는 것으로 생각되고 있습니다 . 이러한 변화가 알츠하이머병의 발병 위험을 증가시키고 , 병의 진행을 가속화시킨다는 것입니다 . 알츠하이머병의 발병과 관련된 위험 요소에 대해서는 더 많은 연구와 조사가 필요합니다 . 더 많은 연구와 자료 수집을 통해 알츠하이머병에 대한 더 많은 이해와 예방 방법이 개발될 것으로 기대됩니다 .<EOS>',
 '알츠하이머병은 현재까지 완전한 원인이 밝혀지지 않았습니다 . 알츠하이머병은 아직 완전히 이해되지 않았지만 , 연구 결과에 따르면 유전적인 요소와 다양한 환경적인 요인이 이 질환을 일으키는 역할을 한다고 알려져 있습니다 . 특히 , 아밀로이드 베타 단백질의 비정상적인 축적이 알츠하이머병과 관련이 있는 것으로 알려져 있습니다 . 이 외에도 나이 , 노화 , 고혈압 , 당뇨병 , 그리고 흡연 등과 같은 다른 요인들도 알츠하이머병 발병과 연관성이 있을 수 있습니다 . 더 많은 연구와 조사를 통해 알츠하이머병의 원인을 파악하고 예방 방법을 개발할 필요가 있습니다 .<EOS>',
 '알츠하이머병은 치매를 일으키는 가장 흔한 퇴행성 뇌질환으로 , 년 독일 의사 알로이스 알츠하이머에 의해 처음으로 보고되었습니다 . 이 질환의 원인에 대해서는 현재까지 명확한 답은 없으나 , 치매 발생의 위험 요소와 관련하여 몇 가지 위험 요인이 알려져 있습니다 . 일반적으로 , 가장 잘 알려진 요인 중 하나는 고령입니다 . 고령은 치매의 발병 위험을 증가시키는 가장 큰 위험 요소로 알려져 있습니다 . 또한 , 가족력이 있는 경우 알츠하이머병 발생 위험이 높아집니다 . 연구에 따르면 , 조발성 가족성 알츠하이머병은 주로 

In [55]:
# 단어 사전 생성
all_word = set(' '.join(df['Encoder Inputs'].tolist() + df['Decoder Inputs'].tolist()).split())
vocab = {'<PAD>': PAD_TOKEN, '<SOS>': SOS_TOKEN, '<EOS>': EOS_TOKEN, '<UNK>': UNK_TOKEN}
vocab.update({word: i+4 for i, word in enumerate(all_word)})
vocab_size = len(vocab)

with open('vocab.pkl', 'wb') as f:
    pickle.dump(vocab, f)

In [56]:
all_word

{'실행되며',
 '줄여주고',
 '대비를',
 '물을',
 '보호제를',
 '아포지단백질',
 '빨라지면',
 '직장에서의',
 '관리하는지',
 '감소의',
 '이름으로',
 '다운증후군',
 '개선시켜',
 '시도와',
 '인지를',
 '강화하며',
 '집중하지',
 '느릴',
 '완치가',
 '플루니트라제팜',
 '보행장애',
 '청소년이나',
 '시작되면',
 '질문지를',
 '식단이',
 '주어진',
 '감퇴는',
 '체크업을',
 '움직임을',
 '차와',
 '상태임에도',
 '결핍을',
 '지원은',
 '요일이나',
 '사례를',
 '길항제는',
 '권장됩니다',
 '평상',
 '임상심리검사가',
 '이상들이',
 'c가',
 '유지하시기',
 '남용하면',
 '집중력의',
 '전두측두엽과',
 '전기경련치료',
 '저해합니다',
 '전기요법',
 '발견되었을',
 '맞춤화해야',
 '방지할',
 'vmadan',
 '떠오를',
 '빈도와',
 '말이나',
 '종양',
 '해소하기',
 '진단과정에서',
 '발생하는데에',
 '필요하다는',
 '이르기까지',
 '손상시키면',
 '부신기능부전',
 '때와',
 '감소시킴으로써',
 '전달에',
 '정신건강이',
 '징후입니다',
 '범위에',
 '의존하거나',
 '동안',
 '안전하며',
 '기억상실',
 '압력으로',
 '부적합한',
 '모델에',
 '이전과는',
 '이해하는',
 '깨지는',
 '분야이며',
 '지속하는',
 '혈류순환을',
 '보존하는',
 '신경질환의',
 '구조물입니다',
 '치료법을',
 '병용해서',
 '의료기관을',
 '뇌기능활성도검사도',
 '싸움에서',
 '존재하지',
 '공급하는데',
 '무기력증이',
 '주요우울증의',
 '연구하는',
 '호소합니다',
 '통합한',
 '공급되어야',
 '하지는',
 '도구와',
 '노인에게는',
 '바람직합니다',
 '끊었을',
 '내용까지',
 '가져오며',
 '어떤지를',
 '말할',
 '많기',
 '인격장애나',
 '불

In [57]:
vocab

{'<PAD>': 0,
 '<SOS>': 1,
 '<EOS>': 2,
 '<UNK>': 3,
 '실행되며': 4,
 '줄여주고': 5,
 '대비를': 6,
 '물을': 7,
 '보호제를': 8,
 '아포지단백질': 9,
 '빨라지면': 10,
 '직장에서의': 11,
 '관리하는지': 12,
 '감소의': 13,
 '이름으로': 14,
 '다운증후군': 15,
 '개선시켜': 16,
 '시도와': 17,
 '인지를': 18,
 '강화하며': 19,
 '집중하지': 20,
 '느릴': 21,
 '완치가': 22,
 '플루니트라제팜': 23,
 '보행장애': 24,
 '청소년이나': 25,
 '시작되면': 26,
 '질문지를': 27,
 '식단이': 28,
 '주어진': 29,
 '감퇴는': 30,
 '체크업을': 31,
 '움직임을': 32,
 '차와': 33,
 '상태임에도': 34,
 '결핍을': 35,
 '지원은': 36,
 '요일이나': 37,
 '사례를': 38,
 '길항제는': 39,
 '권장됩니다': 40,
 '평상': 41,
 '임상심리검사가': 42,
 '이상들이': 43,
 'c가': 44,
 '유지하시기': 45,
 '남용하면': 46,
 '집중력의': 47,
 '전두측두엽과': 48,
 '전기경련치료': 49,
 '저해합니다': 50,
 '전기요법': 51,
 '발견되었을': 52,
 '맞춤화해야': 53,
 '방지할': 54,
 'vmadan': 55,
 '떠오를': 56,
 '빈도와': 57,
 '말이나': 58,
 '종양': 59,
 '해소하기': 60,
 '진단과정에서': 61,
 '발생하는데에': 62,
 '필요하다는': 63,
 '이르기까지': 64,
 '손상시키면': 65,
 '부신기능부전': 66,
 '때와': 67,
 '감소시킴으로써': 68,
 '전달에': 69,
 '정신건강이': 70,
 '징후입니다': 71,
 '범위에': 72,
 '의존하거나': 73,
 '동안': 74,
 '안전하며': 75,
 '기억상실': 76,

In [58]:
word_to_idx = vocab
idx_to_word = {i: word for word, i in word_to_idx.items()}

In [59]:
word_to_idx

{'<PAD>': 0,
 '<SOS>': 1,
 '<EOS>': 2,
 '<UNK>': 3,
 '실행되며': 4,
 '줄여주고': 5,
 '대비를': 6,
 '물을': 7,
 '보호제를': 8,
 '아포지단백질': 9,
 '빨라지면': 10,
 '직장에서의': 11,
 '관리하는지': 12,
 '감소의': 13,
 '이름으로': 14,
 '다운증후군': 15,
 '개선시켜': 16,
 '시도와': 17,
 '인지를': 18,
 '강화하며': 19,
 '집중하지': 20,
 '느릴': 21,
 '완치가': 22,
 '플루니트라제팜': 23,
 '보행장애': 24,
 '청소년이나': 25,
 '시작되면': 26,
 '질문지를': 27,
 '식단이': 28,
 '주어진': 29,
 '감퇴는': 30,
 '체크업을': 31,
 '움직임을': 32,
 '차와': 33,
 '상태임에도': 34,
 '결핍을': 35,
 '지원은': 36,
 '요일이나': 37,
 '사례를': 38,
 '길항제는': 39,
 '권장됩니다': 40,
 '평상': 41,
 '임상심리검사가': 42,
 '이상들이': 43,
 'c가': 44,
 '유지하시기': 45,
 '남용하면': 46,
 '집중력의': 47,
 '전두측두엽과': 48,
 '전기경련치료': 49,
 '저해합니다': 50,
 '전기요법': 51,
 '발견되었을': 52,
 '맞춤화해야': 53,
 '방지할': 54,
 'vmadan': 55,
 '떠오를': 56,
 '빈도와': 57,
 '말이나': 58,
 '종양': 59,
 '해소하기': 60,
 '진단과정에서': 61,
 '발생하는데에': 62,
 '필요하다는': 63,
 '이르기까지': 64,
 '손상시키면': 65,
 '부신기능부전': 66,
 '때와': 67,
 '감소시킴으로써': 68,
 '전달에': 69,
 '정신건강이': 70,
 '징후입니다': 71,
 '범위에': 72,
 '의존하거나': 73,
 '동안': 74,
 '안전하며': 75,
 '기억상실': 76,

In [60]:
idx_to_word

{0: '<PAD>',
 1: '<SOS>',
 2: '<EOS>',
 3: '<UNK>',
 4: '실행되며',
 5: '줄여주고',
 6: '대비를',
 7: '물을',
 8: '보호제를',
 9: '아포지단백질',
 10: '빨라지면',
 11: '직장에서의',
 12: '관리하는지',
 13: '감소의',
 14: '이름으로',
 15: '다운증후군',
 16: '개선시켜',
 17: '시도와',
 18: '인지를',
 19: '강화하며',
 20: '집중하지',
 21: '느릴',
 22: '완치가',
 23: '플루니트라제팜',
 24: '보행장애',
 25: '청소년이나',
 26: '시작되면',
 27: '질문지를',
 28: '식단이',
 29: '주어진',
 30: '감퇴는',
 31: '체크업을',
 32: '움직임을',
 33: '차와',
 34: '상태임에도',
 35: '결핍을',
 36: '지원은',
 37: '요일이나',
 38: '사례를',
 39: '길항제는',
 40: '권장됩니다',
 41: '평상',
 42: '임상심리검사가',
 43: '이상들이',
 44: 'c가',
 45: '유지하시기',
 46: '남용하면',
 47: '집중력의',
 48: '전두측두엽과',
 49: '전기경련치료',
 50: '저해합니다',
 51: '전기요법',
 52: '발견되었을',
 53: '맞춤화해야',
 54: '방지할',
 55: 'vmadan',
 56: '떠오를',
 57: '빈도와',
 58: '말이나',
 59: '종양',
 60: '해소하기',
 61: '진단과정에서',
 62: '발생하는데에',
 63: '필요하다는',
 64: '이르기까지',
 65: '손상시키면',
 66: '부신기능부전',
 67: '때와',
 68: '감소시킴으로써',
 69: '전달에',
 70: '정신건강이',
 71: '징후입니다',
 72: '범위에',
 73: '의존하거나',
 74: '동안',
 75: '안전하며',
 76: '기억상실',

In [61]:
word_to_idx['이루고']

13333

In [62]:
idx_to_word[13333]

'이루고'

In [63]:
encoder = EncoderLSTM(vocab_size, hidden_size).to(device)
decoder = AttentionDecoderLSTM(hidden_size, vocab_size).to(device)

In [64]:
encoder_optimizer = optim.Adam(encoder.parameters(), lr=0.005)
decoder_optimizer = optim.Adam(decoder.parameters(), lr=0.005)
criterion = nn.CrossEntropyLoss()

In [65]:
pairs = [list(x) for x in zip(df['Encoder Inputs'], df['Decoder Inputs'])]

In [66]:
pairs[1]

['알츠하이머병이라는 질병은 유전적 영향을 받는 것인가요 ?',
 '알츠하이머병은 현재까지 완전한 원인이 밝혀지지 않았습니다 . 알츠하이머병은 아직 완전히 이해되지 않았지만 , 연구 결과에 따르면 유전적인 요소와 다양한 환경적인 요인이 이 질환을 일으키는 역할을 한다고 알려져 있습니다 . 특히 , 아밀로이드 베타 단백질의 비정상적인 축적이 알츠하이머병과 관련이 있는 것으로 알려져 있습니다 . 이 외에도 나이 , 노화 , 고혈압 , 당뇨병 , 그리고 흡연 등과 같은 다른 요인들도 알츠하이머병 발병과 연관성이 있을 수 있습니다 . 더 많은 연구와 조사를 통해 알츠하이머병의 원인을 파악하고 예방 방법을 개발할 필요가 있습니다 .']

In [74]:
trainIters(encoder, decoder, 1000, 100)

Iteration : 100, Loss :  6.9864
Iteration : 200, Loss :  6.8780
Iteration : 300, Loss :  6.8183
Iteration : 400, Loss :  6.8549
Iteration : 500, Loss :  6.8496
Iteration : 600, Loss :  6.8950
Iteration : 700, Loss :  6.8543
Iteration : 800, Loss :  6.8851
Iteration : 900, Loss :  6.8856
Iteration : 1000, Loss :  6.9090


In [75]:
encoder.eval()
decoder.eval()

AttentionDecoderLSTM(
  (embedding): Embedding(20954, 256)
  (lstm): LSTM(256, 256, num_layers=2)
  (out): Linear(in_features=256, out_features=20954, bias=True)
)

In [78]:
chat(encoder, decoder)

Let's chat (type 'bye' to exit)
< 알츠하이머병은 진단은 다양한 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
< 치매는 진단은 , . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 