In [None]:
from pathlib import Path
import torch
import torch.nn as nn
from config import get_config, latest_weights_file_path
from train import get_model, get_ds, run_validation
from translate import translate

In [None]:
# Define the device
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
print("Using device:", device)

## get_config: 모델과 데이터셋 구성 로드
config = get_config()
## get_ds: 훈련 및 검증 데이터 로더와 소스 및 타깃 언어의 토크나이저를 로드
train_dataloader, val_dataloader, tokenizer_src, tokenizer_tgt = get_ds(config)
## get_model 함수를 사용하여 모델을 초기화
## -> 로드된 구성을 기반으로 토크나이저의 어휘 크기를 매개변수로 전달한 다음, 모델을 설정된 장치로 이동
model = get_model(config, tokenizer_src.get_vocab_size(), tokenizer_tgt.get_vocab_size()).to(device)

# Load the pretrained weights
## latest_weights_file_path 함수로 최신 가중치 파일 경로를 가져온 후
## -> torch.load를 사용하여 가중치를 로드
## -> load_state_dict로 모델 상태를 업데이트
model_filename = latest_weights_file_path(config)
state = torch.load(model_filename)
model.load_state_dict(state['model_state_dict'])

In [None]:
run_validation(model, val_dataloader, tokenizer_src, tokenizer_tgt, config['seq_len'], device, lambda msg: print(msg), 0, None, num_examples=10)


In [None]:
t = translate("Why do I need to translate this?")

In [None]:
t = translate(34)