In [1]:
import pandas as pd
import numpy as np
import torch 
from torchvision import models, transforms
from PIL import Image
import os
import matplotlib.pyplot as plt
import matplotlib.image as mpimg
import json
import tqdm

In [2]:
vgg16 = models.vgg16(pretrained=True)

Downloading: "https://download.pytorch.org/models/vgg16-397923af.pth" to C:\Users\Carlos Arbonés/.cache\torch\hub\checkpoints\vgg16-397923af.pth
100%|██████████| 528M/528M [01:03<00:00, 8.76MB/s] 


In [3]:
vgg16.classifier = vgg16.classifier[:-1]

In [4]:
vgg16.eval()

VGG(
  (features): Sequential(
    (0): Conv2d(3, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (1): ReLU(inplace=True)
    (2): Conv2d(64, 64, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (3): ReLU(inplace=True)
    (4): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (5): Conv2d(64, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (6): ReLU(inplace=True)
    (7): Conv2d(128, 128, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (8): ReLU(inplace=True)
    (9): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1, ceil_mode=False)
    (10): Conv2d(128, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (11): ReLU(inplace=True)
    (12): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (13): ReLU(inplace=True)
    (14): Conv2d(256, 256, kernel_size=(3, 3), stride=(1, 1), padding=(1, 1))
    (15): ReLU(inplace=True)
    (16): MaxPool2d(kernel_size=2, stride=2, padding=0, dilation=1

In [5]:
def load_and_preprocess_image(image_path):
    image = Image.open(image_path).convert('RGB')

    # Resize while maintaining the original aspect ratio
    aspect_ratio = image.width / image.height
    if aspect_ratio > 1:
        target_size = (int(224 * aspect_ratio), 224)
    else:
        target_size = (224, int(224 / aspect_ratio))

    transform = transforms.Compose([
        transforms.Resize(target_size),
        transforms.CenterCrop(224),
        transforms.ToTensor(),
        transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]),
    ])

    input_image = transform(image).unsqueeze(0)
    return input_image

In [6]:
preprocessed_image = load_and_preprocess_image('images/2019_41005828_05.jpg')
preprocessed_image.shape

torch.Size([1, 3, 224, 224])

In [7]:
images_folder = 'images'

In [8]:
# Iterate over the images in the folder

image_embeddings = pd.DataFrame()

for filename in tqdm.tqdm(os.listdir(images_folder)):
    if filename.endswith(".jpg") or filename.endswith(".png"):

        # Load and preprocess the image
        image_path = os.path.join(images_folder, filename)
        input_image = load_and_preprocess_image(image_path)

        # Make predictions using the VGG16 model
        with torch.no_grad():
            output = vgg16(input_image)

        output = torch.nn.functional.normalize(output, p=2, dim=1)

        #add output torch tensor and filename to dataframe, use concat
        image_embeddings = pd.concat([image_embeddings, pd.DataFrame(output.numpy())], axis=0)

  0%|          | 0/9248 [00:00<?, ?it/s]

 18%|█▊        | 1706/9248 [04:32<20:03,  6.27it/s]


KeyboardInterrupt: 

In [None]:
#show the entire output of column embedding
pd.set_option('display.max_colwidth', None)
image_embeddings

Unnamed: 0,filename,embedding
0,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
1,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
2,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
3,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
4,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
5,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
6,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
7,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
8,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"
9,2023_57045979_TO.jpg,"[[tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0012), tensor(0.), tensor(0.0283), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0240), tensor(0.), tensor(0.), tensor(0.0126), tensor(0.), tensor(0.), tensor(0.), tensor(0.0247), tensor(0.), tensor(0.), tensor(0.), tensor(0.0197), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0142), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0099), tensor(0.), tensor(0.0483), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.1257), tensor(0.), tensor(0.0015), tensor(0.), tensor(0.), tensor(0.), tensor(0.0055), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.0036), tensor(0.), tensor(0.0068), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), tensor(0.), ...]]"


In [None]:
image_embeddings[0].shape

torch.Size([1, 4096])

In [None]:
# Path: image_embedding.ipynb
embeddings = torch.cat(image_embeddings)

In [None]:
embeddings.shape

torch.Size([9248, 4096])

In [None]:
with open("imagenet-simple-labels.json", "r") as file:
    class_labels = json.load(file)
