In [1]:
# 画像クラスタリングを実装していきます

# 1. torchvision によって提供されている事前学習済みモデルMobilenetV3を用いて画像から特徴量を抽出
# 2. 抽出した特徴量を用いてX-meansによるクラスタリングを行い、画像を分類

In [2]:
import json
from pathlib import Path

import numpy as np
import torch
import torchvision
from PIL import Image
from torch.nn import functional as F
from torch.utils.data import DataLoader, Dataset
from torchvision import transforms
from torchvision.datasets.utils import download_url

In [4]:
# デバイスを作成
def get_device(use_gpu):
    if use_gpu and torch.cuda.is_available():
        # これを有効にしないと、計算した勾配が毎回異なり、再現性が担保できない。
        torch.backends.cudnn.deterministic = True
        return torch.device("cuda")
    else:
        return torch.device("cpu")


# デバイスを選択する。
device = get_device(use_gpu=True)

In [18]:
# モデルを作成
# model = torchvision.models.resnet50(pretrained=True).to(device)
model = torchvision.models.mobilenet_v3_large(pretraind=True).to(device)

In [17]:
transform = transforms.Compose(
    [
        transforms.Resize(256),  # (256, 256) で切り抜く。
        transforms.CenterCrop(224),  # 画像の中心に合わせて、(224, 224) で切り抜く
        transforms.ToTensor(),  # テンソルにする。
        transforms.Normalize(
            mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225]
        ),  # 標準化する。
    ]
)

In [None]:
img = Image.open("/image/")
inputs = transform(img)
inputs = inputs.unsqueeze(0).to(device)