create sample.py

kacky24 · Nov 22, 2017 · f0efa32 · f0efa32
1 parent 69c693d
commit f0efa32
Showing 1 changed file with 64 additions and 0 deletions.
diff --git a/sample.py b/sample.py
@@ -0,0 +1,64 @@
+import os
+import pickle
+import skimage.io
+import torch
+from torch.autograd import Variable
+from torchvision import transforms
+from build_vocab import Vocab
+from data_loader import Rescale
+from models import EncoderCNN
+from models import FactoredLSTM
+
+
+def to_var(x, volatile=False):
+    # if torch.cuda.is_available():
+    #     x = x.cuda()
+    return Variable(x, volatile=volatile)
+
+
+def load_sample_images(img_dir, transform):
+    img_names = os.listdir(img_dir)
+    img_list = []
+    for img_name in img_names:
+        img_name = os.path.join(img_dir, img_name)
+        img = skimage.io.imread(img_name)
+        img = transform(img).unsqueeze(0)
+        img_list.append(img)
+    return img_names, img_list
+
+
+def main():
+    # load vocablary
+    with open('data/vocab.pkl', 'rb') as f:
+        vocab = pickle.load(f)
+
+    # build model
+    encoder = EncoderCNN(300)
+    decoder = FactoredLSTM(300, 512, 512, len(vocab))
+
+    encoder.load_state_dict(torch.load('pretrained_models/encoder-15.pkl'))
+    decoder.load_state_dict(torch.load('pretrained_models/decoder-15.pkl'))
+
+    # prepare images
+    transform = transforms.Compose([
+        Rescale((224, 224)),
+        transforms.ToTensor()
+        ])
+    img_names, img_list = load_sample_images('sample_images/', transform)
+    image = to_var(img_list[30], volatile=True)
+
+    # if torch.cuda.is_available():
+    #     encoder = encoder.cuda()
+    #     decoder = decoder.cuda()
+
+    # farward
+    features = encoder(image)
+    output = decoder.sample(features, mode="factual")
+
+    caption = [vocab.i2w[x] for x in output]
+    print(img_names[30])
+    print(caption)
+
+
+if __name__ == '__main__':
+    main()