In [1]:
%matplotlib inline
from matplotlib import pyplot as plt
import numpy as np
import torch

torch.set_printoptions(edgeitems=2)
torch.manual_seed(123)


<torch._C.Generator at 0x121801c70>

In [2]:
class_names = [
    "airplane",
    "automobile",
    "bird",
    "cat",
    "deer",
    "dog",
    "frog",
    "horse",
    "ship",
    "truck",
]

In [3]:
from torchvision import datasets, transforms

# CIFAR-10の訓練用データセットを読み込み、
# 以下の2つの前処理を適用する：
# 1. ToTensor(): PIL画像をPyTorchのTensor形式に変換（ピクセル値を0〜1にスケーリング）
# 2. Normalize(): 画像のRGBチャンネルごとに、訓練セット全体の平均と標準偏差を用いて正規化

data_path = "../data-unversioned/p1ch7/"

cifar10 = datasets.CIFAR10(
    data_path,  # データを保存するディレクトリ
    train=True,  # 訓練用データセットを指定
    download=False,  # 既にダウンロード済みのため再取得しない
    transform=transforms.Compose(
        [  # 複数の変換を順に適用
            transforms.ToTensor(),  # PIL → Tensor（float32, 範囲: 0〜1）
            transforms.Normalize(  # チャンネルごとの正規化
                (0.4915, 0.4823, 0.4468),  # 平均（R, G, B）
                (0.2470, 0.2435, 0.2616),  # 標準偏差（R, G, B）
            ),
        ]
    ),
)

In [4]:
cifar10_val = datasets.CIFAR10(
    data_path,
    train=False,
    download=False,
    transform=transforms.Compose(
        [
            transforms.ToTensor(),
            transforms.Normalize((0.4915, 0.4823, 0.4468), (0.2470, 0.2435, 0.2616)),
        ]
    ),
)

In [5]:
# CIFAR-10の中から "airplane" (label=0) と "bird" (label=2) のみを抽出し、
# ラベルを {0: 0, 2: 1} に変換して2クラス分類用のデータセットを作成する。

label_map = {0: 0, 2: 1}  # 元のラベルを2クラス用にマッピング
class_names = ["airplane", "bird"]  # 使用するクラス名

# 訓練データから該当クラスのみを抽出し、ラベルを変換
cifar2 = [(img, label_map[label]) for img, label in cifar10 if label in [0, 2]]

# 検証データから該当クラスのみを抽出し、ラベルを変換
cifar2_val = [(img, label_map[label]) for img, label in cifar10_val if label in [0, 2]]