In [1]:
# For tips on running notebooks in Google Colab, see
# https://pytorch.org/tutorials/beginner/colab
%matplotlib inline

[Learn the Basics](intro.html) \|\|
[Quickstart](quickstart_tutorial.html) \|\|
[Tensors](tensorqs_tutorial.html) \|\| [Datasets &
DataLoaders](data_tutorial.html) \|\| **Transforms** \|\| [Build
Model](buildmodel_tutorial.html) \|\|
[Autograd](autogradqs_tutorial.html) \|\|
[Optimization](optimization_tutorial.html) \|\| [Save & Load
Model](saveloadrun_tutorial.html)

Transforms
==========

Data does not always come in its final processed form that is required
for training machine learning algorithms. We use **transforms** to
perform some manipulation of the data and make it suitable for training.

All TorchVision datasets have two parameters -`transform` to modify the
features and `target_transform` to modify the labels - that accept
callables containing the transformation logic. The
[torchvision.transforms](https://pytorch.org/vision/stable/transforms.html)
module offers several commonly-used transforms out of the box.

The FashionMNIST features are in PIL Image format, and the labels are
integers. For training, we need the features as normalized tensors, and
the labels as one-hot encoded tensors. To make these transformations, we
use `ToTensor` and `Lambda`.


In [14]:
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda

ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(11, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

ToTensor()
==========

[ToTensor](https://pytorch.org/vision/stable/transforms.html#torchvision.transforms.ToTensor)
converts a PIL image or NumPy `ndarray` into a `FloatTensor`. and scales
the image\'s pixel intensity values in the range \[0., 1.\]


Lambda Transforms
=================

Lambda transforms apply any user-defined lambda function. Here, we
define a function to turn the integer into a one-hot encoded tensor. It
first creates a zero tensor of size 10 (the number of labels in our
dataset) and calls
[scatter\_](https://pytorch.org/docs/stable/generated/torch.Tensor.scatter_.html)
which assigns a `value=1` on the index as given by the label `y`.


In [None]:
target_transform = Lambda(lambda y: torch.zeros(
    10, dtype=torch.float).scatter_(dim=0, index=torch.tensor(y), value=1))

# 关于获取ds中各类信息的命令

当然，`ds.classes` 是 `torchvision.datasets.FashionMNIST` 数据集对象中的一个属性，用于存储类别名称。除了 `ds.classes` 之外，`FashionMNIST` 数据集对象还包含许多其他有用的属性和方法，这些属性和方法可以帮助你更有效地访问和操作数据集。以下是一些类似于 `ds.classes` 的常用属性和方法：

### 1. `ds.class_to_idx`

- **描述**：一个字典，将类别名称映射到对应的类别索引。
- **类型**：`dict`
- **用途**：快速查找类别名称对应的索引，常用于标签处理或模型输出解析。
- **示例**：

    ```python
    print(ds.class_to_idx)
    # 输出示例:
    # {'T-shirt/top': 0, 'Trouser': 1, 'Pullover': 2, 'Dress': 3, 'Coat': 4,
    #  'Sandal': 5, 'Shirt': 6, 'Sneaker': 7, 'Bag': 8, 'Ankle boot': 9}
    ```

### 2. `ds.targets`

- **描述**：存储数据集中所有样本的原始标签。
- **类型**：`torch.Tensor`
- **用途**：访问和操作数据集中的标签，通常用于训练和评估模型。
- **示例**：

    ```python
    print(ds.targets[:10])  # 输出前10个标签
    # 输出示例:
    # tensor([9, 0, 0, 0, 0, 0, 0, 0, 0, 0])
    ```

### 3. `ds.data`

- **描述**：存储数据集中所有样本的图像数据。
- **类型**：`torch.Tensor`
- **用途**：直接访问和操作图像数据，适用于需要对图像进行自定义处理的场景。
- **示例**：

    ```python
    print(ds.data.shape)  # 输出数据形状
    # 输出示例:
    # torch.Size([60000, 28, 28])
    ```

### 4. `ds.classes`

- **描述**：存储所有类别的名称列表。
- **类型**：`list`
- **用途**：获取类别名称，用于数据可视化和结果解释。
- **示例**：

    ```python
    print(ds.classes)
    # 输出示例:
    # ['T-shirt/top', 'Trouser', 'Pullover', 'Dress', 'Coat',
    #  'Sandal', 'Shirt', 'Sneaker', 'Bag', 'Ankle boot']
    ```

### 5. `ds.transform`

- **描述**：应用于数据样本的变换（`transform`）。
- **类型**：`callable` 或 `None`
- **用途**：对输入图像进行预处理，如归一化、数据增强等。
- **示例**：

    ```python
    print(ds.transform)
    # 输出示例:
    # ToTensor()
    ```

### 6. `ds.target_transform`

- **描述**：应用于标签的变换（`target_transform`）。
- **类型**：`callable` 或 `None`
- **用途**：对标签进行自定义处理，如将标签转换为 one-hot 编码。
- **示例**：

    ```python
    print(ds.target_transform)
    # 输出示例:
    # <function <lambda> at 0x7f9c2c3e0d30>
    ```

### 7. `__len__()`

- **描述**：返回数据集中的样本数量。
- **类型**：方法
- **用途**：获取数据集的大小，用于迭代和批处理。
- **示例**：

    ```python
    print(len(ds))
    # 输出示例:
    # 60000
    ```

### 8. `__getitem__(index)`

- **描述**：通过索引获取特定样本的数据和标签。
- **类型**：方法
- **用途**：访问单个样本，适用于数据探索和调试。
- **示例**：

    ```python
    image, label = ds[0]
    print(image.shape, label.shape)
    # 输出示例:
    # torch.Size([1, 28, 28]) torch.Size([10])
    ```

### 9. `ds.class_to_idx` 和 `ds.classes` 的关系

- **描述**：`ds.class_to_idx` 提供了类别名称到索引的映射，而 `ds.classes` 提供了索引到类别名称的映射。
- **用途**：在需要从类别索引获取名称或从名称获取索引时非常有用。
- **示例**：

    ```python
    # 从索引获取类别名称
    index = 3
    class_name = ds.classes[index]
    print(f"类别索引 {index} 对应的名称是 {class_name}")
    # 输出示例:
    # 类别索引 3 对应的名称是 Dress

    # 从类别名称获取索引
    name = "Sandal"
    class_index = ds.class_to_idx[name]
    print(f"类别名称 {name} 对应的索引是 {class_index}")
    # 输出示例:
    # 类别名称 Sandal 对应的索引是 5
    ```

### 10. `ds.get_class_name(index)`

虽然 `FashionMNIST` 数据集类本身没有 `get_class_name` 方法，但你可以自定义一个辅助函数来根据索引获取类别名称：

```python
def get_class_name(dataset, index):
    return dataset.classes[index]

# 使用示例
index = 7
class_name = get_class_name(ds, index)
print(f"类别索引 {index} 对应的名称是 {class_name}")
# 输出示例:
# 类别索引 7 对应的名称是 Sneaker
```

### 11. `ds.class_to_idx` 的反向映射

如果你需要根据类别索引获取类别名称，可以使用 `ds.classes` 或创建反向映射：

```python
# 使用 ds.classes
index = 2
class_name = ds.classes[index]
print(f"类别索引 {index} 对应的名称是 {class_name}")

# 创建反向映射
idx_to_class = {v: k for k, v in ds.class_to_idx.items()}
print(idx_to_class[2])  # 输出: Pullover
```

### 12. 其他有用的方法和属性

- **`ds.extra_repr()`**

    - **描述**：返回数据集的额外字符串表示，通常用于打印数据集的详细信息。
    - **用途**：快速查看数据集的配置信息。
    - **示例**：

        ```python
        print(ds.extra_repr())
        # 输出示例:
        # train=True, transform=<ToTensor()>, target_transform=<function <lambda> at 0x7f9c2c3e0d30>
        ```

- **`ds.download`**

    - **描述**：指示数据集是否需要下载。
    - **类型**：`bool`
    - **用途**：了解数据集是否已经下载。
    - **示例**：

        ```python
        print(ds.download)
        # 输出示例:
        # True
        ```

- **`ds.root`**

    - **描述**：数据集存储的根目录路径。
    - **类型**：`str`
    - **用途**：了解数据集文件的位置，便于数据管理。
    - **示例**：

        ```python
        print(ds.root)
        # 输出示例:
        # data
        ```

### 13. 完整示例代码

以下是一个综合示例，展示如何使用上述属性和方法：

```python
import torch
from torchvision import datasets
from torchvision.transforms import ToTensor, Lambda
import matplotlib.pyplot as plt

# 定义类别名称
class_names = [
    "T恤/上衣", "裤子", "套头衫", "连衣裙", "外套",
    "凉鞋", "衬衫", "运动鞋", "包", "靴子"
]

# 加载数据集
ds = datasets.FashionMNIST(
    root="data",
    train=True,
    download=True,
    transform=ToTensor(),
    target_transform=Lambda(lambda y: torch.zeros(10, dtype=torch.float).scatter_(0, torch.tensor(y), value=1))
)

# 打印类别数量和类别名称
print(f"类别数量: {len(ds.classes)}")
print("类别名称:", ds.classes)
print("类别到索引的映射:", ds.class_to_idx)

# 查看第一个样本
index = 0
image, one_hot_label = ds[index]
original_label = ds.targets[index].item()
class_name = ds.classes[original_label]

print(f"\n样本 {index}:")
print(f"  原始标签: {original_label} ({class_name})")
print(f"  转换后标签 (one-hot 编码): {one_hot_label}")

# 显示图像
plt.imshow(image.squeeze(), cmap='gray')
plt.title(f"样本 {index} 类别: {class_name}")
plt.axis('off')
plt.show()

# 使用 DataLoader 批量加载数据
from torch.utils.data import DataLoader

dataloader = DataLoader(ds, batch_size=5, shuffle=True)

# 获取一个批次的数据
images, labels = next(iter(dataloader))

# 输出批次信息
for i in range(len(images)):
    # 由于 DataLoader 打乱了数据，无法直接使用 ds.targets[i]
    # 需要反向查找类别索引
    one_hot_label = labels[i]
    original_label = torch.argmax(one_hot_label).item()
    class_name = ds.classes[original_label]
    
    print(f"批次样本 {i}:")
    print(f"  原始标签: {original_label} ({class_name})")
    print(f"  转换后标签 (one-hot 编码): {labels[i]}\n")
    
    # 显示图像
    img = images[i].squeeze().numpy()
    plt.imshow(img, cmap='gray')
    plt.title(f"批次样本 {i} 类别: {class_name}")
    plt.axis('off')
    plt.show()
```

### 14. 总结

`torchvision.datasets.FashionMNIST` 提供了多种属性和方法，使你能够轻松访问和操作数据集中的数据和标签。了解这些属性和方法可以帮助你更高效地进行数据预处理、探索和模型训练。以下是主要属性和方法的快速回顾：

- **属性**：
  - `ds.classes`：类别名称列表。
  - `ds.class_to_idx`：类别名称到索引的映射。
  - `ds.targets`：原始标签的张量。
  - `ds.data`：图像数据的张量。
  - `ds.transform`：应用于图像的变换。
  - `ds.target_transform`：应用于标签的变换。
  - `ds.root`：数据集存储的根目录。
  - `ds.download`：是否需要下载数据集。

- **方法**：
  - `__len__()`：获取数据集的样本数量。
  - `__getitem__(index)`：通过索引获取特定样本的数据和标签。
  - `extra_repr()`：获取数据集的额外字符串表示。

通过充分利用这些属性和方法，你可以更好地管理和使用 FashionMNIST 数据集。如果你有更多问题或需要进一步的帮助，请随时提问！

------------------------------------------------------------------------


Further Reading
===============

-   [torchvision.transforms
    API](https://pytorch.org/vision/stable/transforms.html)
