# torchvision中的Transforms


transforms.py是一个用于图片变换的工具箱。包含了PIL、ndarray、Tensor等多种格式的互相转换、正则化等功能。


**数据类型Tensor**

通过Transforms.ToTensor()，看待两个问题：

1. Transforms如何使用？
2. 为什么需要Tensor数据类型？


In [14]:
from torchvision import transforms
from PIL import Image


## Transforms的使用

使用Transforms的一般步骤：

1. 创建对应的子类，如`ToTensor`，注意是类，不是函数，因此需要先创建一个对应的实例；
2. 通过`实例(参数)`的方法转换图片格式。


In [15]:
img_path_bee = '../dataset/hymenoptera_data/train/bees/16838648_415acd9e3f.jpg'

img_pil = Image.open(img_path_bee)
print(type(img_pil))  # <class 'PIL.JpegImagePlugin.JpegImageFile'>

tensor_trans = transforms.ToTensor()  # 创建一个对象
tensor_img = tensor_trans(img_pil)
print(type(tensor_img))  # <class 'torch.Tensor'>


<class 'PIL.JpegImagePlugin.JpegImageFile'>
<class 'torch.Tensor'>


## 为什么需要Tensor数据类型？

Tensor类型包装了神经网络执行中的一些必要参数，是为神经网络量身打造的数据类型。在神经网络中基本上都使用到Tensor数据类型。


In [16]:
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
import cv2

In [17]:
img_path_ant = '../dataset/hymenoptera_data/train/ants/0013035.jpg'

cv_img_ant = cv2.imread(img_path_ant)  # opencv读取图片
img_ant = cv2.cvtColor(cv_img_ant, cv2.COLOR_BGR2RGB)

tensor_trans = transforms.ToTensor()  # 创建转换器
tensor_img_ant = tensor_trans(img_ant)  # 转换图片为tensor格式

writer = SummaryWriter(log_dir='../logs/test')  # 创建SummaryWriter
writer.add_image(tag='ant_image', img_tensor=tensor_img_ant, global_step=0)
