In [2]:
import cv2
from networkx import write_edgelist
from torch import tensor
from torch.utils.tensorboard import SummaryWriter
from torchvision import transforms
from PIL import Image

In [3]:
img_path = 'dataset/cat-dog/train/dogs/dog.3.jpg'
img = Image.open(img_path)  # img是PIL.Image.Image（PIL）格式的

### 1. tensor的基本使用

In [4]:
trans_totensor = transforms.ToTensor()
img_tensor = trans_totensor(img) # img：PIL -> tensor    将PIL格式的img 转换成 tensor格式的img

writer = SummaryWriter('logs')  # 这是用于可视化的tensorborard设置, SummaryWriter会根据当前工作目录来查找或创建 logs 文件夹（如果不存在）
writer.add_image("ToTensor", img_tensor, global_step=1)
writer.close()  # 最后使用完成一定要关闭

### 2. normalize的使用(归一化)

- 对输入的图像张量的每个通道(channel)应用以下公式  
    `output[channel] = (input[channel] - mean[channel]) / std[channel]`
- Normalize 的核心作用是对图像张量（Tensor）进行归一化。
- 归一化是一种将数据按比例缩放，使其落入一个小的特定区间的过程。在深度学习中，这通常意味着将输入数据调整为均值为 0，标准差为 1 的分布。(标准正态)
- 为什么需要归一化？
    - 加速模型收敛：归一化后的数据可以帮助梯度下降算法更快地找到最优解。如果不同特征（在图像中就是不同的颜色通道）的数值范围差异很大，可能会导致训练过程变慢或不稳定。
    - 提高模型泛化能力：通过将数据转换到同一尺度，可以防止模型过于依赖某些数值范围较大的特征。

In [None]:
trans_norms = transforms.ToTensor()
writer = SummaryWriter('logs')

print(img_tensor[0][0][0])

trans_norms = transforms.Normalize([0.9,0.3,0.5],[2,2,2])
img_norm = trans_norms(img_tensor)

print(img_norm[0][0][0])

writer.add_image("Normalize", img_norm, global_step=2)

writer.close()

### 3. Resize的使用

In [14]:
from PIL import Image
from torchvision import transforms
from torch.utils.tensorboard import SummaryWriter

writer = SummaryWriter('logs')

img_path = "/root/autodl-tmp/pytorch_DeepLearning/dataset/cat-dog/train/cats/cat.16.jpg"
img = Image.open(img_path) # PIL

print(img.size)

trans_resize = transforms.Resize((200,400)) # 这里的宽和高 ，和img_size的宽和高是反的
img_resize = trans_resize(img) # PIL

print(img_resize.size, type(img_resize))

trans_totensor = transforms.ToTensor()
img_resize_tensor = trans_totensor(img_resize)

writer.add_image('Image_resize', img_resize_tensor, global_step=0)

writer.close()


(448, 258)
(400, 200) <class 'PIL.Image.Image'>


### 4. Compose的使用

In [None]:
writer = SummaryWriter('logs')

trans_compose = transforms.Compose([
    transforms.Resize(256),              # 步骤1: 调整图像大小到 256x256
    transforms.CenterCrop(224),          # 步骤2: 从中心裁剪出 224x224 的区域
    transforms.ToTensor(),               # 步骤3: 将图像转换为 Tensor
    transforms.Normalize(                # 步骤4: 对 Tensor 进行归一化
        mean=[0.485, 0.456, 0.406], 
        std=[0.229, 0.224, 0.225]
    )
])
img_compose = trans_compose(img) # PIL->tensor
print(type(img_compose))
writer.add_image('Image_Compose',img_compose, global_step=1)
writer.close()

# # 4. compose的使用
# trans_resize_2 = transforms.Resize(512)
# # PIL -> PIL -> tensor(一定要注意输入输出的数据类型)
# trans_compose = transforms.Compose([trans_resize_2, trans_totensor])
# img_resize_2 = trans_compose(img)
# writer.add_image("img_resize_2",img_resize_2,global_step=4)

<class 'torch.Tensor'>


### 5. RandomCrop的使用

In [25]:
writer = SummaryWriter('logs')

trans_random = transforms.RandomCrop((80,100))
trans_totensor = transforms.ToTensor()
trans_compose_2 = transforms.Compose([trans_random, trans_totensor])
for i in range(10):
    img_crop = trans_compose_2(img)
    writer.add_image("RandomCrop", img_crop, i)

writer.close()