# Tensor
다차원 배열을 나타내는 자료형. numpy의 ndarray와 유사한 api 제공. GPU 이용한 연산도 지원한다.

tensor는 list, numpy를 Pytorch텐서로 변환해준다.

In [6]:
import torch

data = [[1,2,3], [4,5,6]]
x = torch.tensor(data, dtype=torch.float32)
print(x)


tensor([[1., 2., 3.],
        [4., 5., 6.]])


In [7]:
x = torch.tensor([1,2,3])
print(x)

tensor([1, 2, 3])


In [9]:
y = torch.tensor([[1,2,3], [4,5,6]])
print(y)

tensor([[1, 2, 3],
        [4, 5, 6]])


In [13]:
z = torch.zeros((2, 3, 4))
z

tensor([[[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]],

        [[0., 0., 0., 0.],
         [0., 0., 0., 0.],
         [0., 0., 0., 0.]]])

In [15]:
w = torch.ones((2, 2, 2, 2))
w

tensor([[[[1., 1.],
          [1., 1.]],

         [[1., 1.],
          [1., 1.]]],


        [[[1., 1.],
          [1., 1.]],

         [[1., 1.],
          [1., 1.]]]])

In [16]:
r = torch.rand((3, 3))
r

tensor([[0.6082, 0.2480, 0.1190],
        [0.4936, 0.1134, 0.2126],
        [0.9540, 0.4451, 0.3943]])

In [17]:
x = torch.rand((2, 3))
x

tensor([[0.9670, 0.8581, 0.9777],
        [0.3440, 0.7561, 0.4889]])

In [18]:
y = torch.randn(2, 3)
y

tensor([[-1.7180, -0.1126,  1.8470],
        [-0.3899, -2.4246, -0.5761]])

In [21]:
a = torch.Tensor([1, 2, 3])
a

tensor([1., 2., 3.])

In [22]:
b = torch.empty(2, 3)
b

tensor([[0., 0., 0.],
        [0., 0., 0.]])

In [24]:
c = torch.Tensor(2, 3)
c

tensor([[0., 0., 0.],
        [0., 0., 0.]])

# from_numpy와 tensor의 차이
from_numpy는 numpy 배열을 tensor로 변환한다. 기존 numpy 배열과 메모리를 공유하며, 반환된 tensor를 수정하면 numpy배열도 수정된다.
- tensor를 numpy로 변환할 때 numpy로 변환하면 데이터를 공유한다.
즉, 동일한 위치를 참조한다.

tensor는 numpy와 유사한 tensor를 생성한다. numpy와 메모리를 공유하지 않고, tensor를 수정해도 numpy는 변경되지 않는다.
- array로 변환하면 데이터를 공유하지 않는다.

In [33]:
import torch 
import numpy as np

a_np = np.array([1,2,3])
print(a_np)
a_tensor = torch.from_numpy(a_np)
a_tensor[0] = -1
print(a_np)

[1 2 3]
[-1  2  3]


In [34]:
a_np = np.array([1,2,3])
a_tensor = torch.tensor(a_np)
a_tensor[0] = -1
print(a_tensor)

tensor([-1,  2,  3])


# Dataset
데이터 로딩과 전처리를 담당하는 클래스. 

- len(): 데이터셋의 전체 샘플 개수를 반환하는 메서드. 정수값을 반환한다.
- getitem(idx): idx에 해당하는 샘플을 가져오는 메서드. 인덱스에 따라 샘플데이터와 레이블을 반환한다.

In [35]:
import torch
from torch.utils.data import Dataset

class CustomImageDataset(Dataset):
    def __init__(self, file_path, labels, transform=None):
        self.file_path = file_path # 이미지 파일 경로
        self.labels = labels # 이미지 레이블 리스트
        self.transform = transform # 이미지에 적용한 전처리 함수
    
    def __len__(self):
        return len(self.file_path)
    
    def __getitem__(self, idx):
        image = Image.open(self.file_path[idx])
        if self.transform is not None:
            image = self.transform(image)
        label = torch.tensor(self.labels[idx])
        
        return image, label

In [41]:
import torchvision.transforms as T

img_T = T.Compose([
    T.Resize((256, 256)),
    T.RandomHorizontalFlip(), # 이미지를 랜덤으로 좌우반전
    T.ToTensor(), # Tensor로 변환, 픽셀 값을 [0, 1]범위로 정규화
    T.Normalize((0.5), (0.5)) # 각 채널 정규화
])

클래스 정의 후 이미지에 transform적용하는 예시

In [42]:
from torch.utils.data import Dataset
from PIL import Image

class CustomImageDataset(Dataset):
    def __init__(self, file_list, label_list, img_T=None):
        self.file_list = file_list
        self.label_list = label_list 
        self.img_T = img_T
        
    def __getitem(self, idx):
        image = Image.open(self.file_list[idx])
        label = self.label_list[idx]
        
        if self.img_T is not None:
            image = self.img_T(image)
        
        return image, label
    
    def __len__(self):
        return len(self.file_list)

In [45]:
# 적용하기
# dataset = CustomImageDataset(file_list, label_list, img_T=img_T)

# torchvision.transforms
함수와 주요 기능
- Resize: 이미지의 크기를 조절합니다.
- RandomResizedCrop: 이미지를 무작위로 자르고 크기를 조절합니다.
- RandomHorizontalFlip: 이미지를 무작위로 수평으로 뒤집습니다.
- RandomVerticalFlip: 이미지를 무작위로 수직으로 뒤집습니다.
- ToTensor: 이미지를 텐서로 변환합니다.
- Normalize: 이미지를 정규화합니다.
- ColorJitter: 이미지의 색상을 무작위로 조정합니다.
- RandomRotation: 이미지를 무작위로 회전합니다.
- RandomCrop: 이미지를 무작위로 자릅니다.
- Grayscale: 이미지를 흑백으로 변환합니다.
- RandomSizedCrop: 이미지를 무작위로 자르고 크기를 조절합니다.

In [47]:
import torchvision.transforms as T

preprocess = T.Compose([
    T.Resize((256, 256)),
    T.RandomHorizontalFlip(),
    T.ToTensor(),
    T.Normalize((0.5), (0.5))
])
image = Image.open('image.jpg') # 예시로 image.jpg가 들어간것.
img = preprocess(image)

FileNotFoundError: [Errno 2] No such file or directory: '/Users/SaintKim/Python/Artificial_Intelligence/Deep_Learning/image.jpg'

# torchvison.utils.save_image
딥러닝 모델이 생성한 이미지를 저장할 때 사용

`torchvision.utils.save_image(tensor, filename, nrow=8, padding=2, normalize=False, range=None,
scale_each=False, pad_value=0`
- tensor : (Tensor) - 저장할 이미지 텐서. shape는 (batch_size, channels, height, width) 이어야 합니다.
- filename : (str) - 저장할 파일의 경로와 이름입니다.
- nrow : (int, optional) - 저장할 이미지들을 한 줄에 몇 개씩 보여줄 것인지 결정하는 인자입니다. 기본값은 8입니다.
- padding : (int, optional) - 이미지들 사이의 간격을 몇 개의 픽셀로 할 것인지 결정하는 인자입니다. 기본값은 2입니다.
- normalize : (bool, optional) - 이미지의 값을 [0, 1]로 정규화할 것인지 결정하는 인자입니다. 기본값은 True입니다.
- range : (tuple, optional) - 이미지를 정규화할 때 사용할 범위를 결정하는 인자입니다. 기본값은 None으로, 입력된 텐서의 값 범위를 그대로 사용합니다.
- scale_each : (bool, optional) - 이미지를 정규화할 때 각 이미지마다 다른 범위를 사용할지 여부를 결정하는 인자입니다. 기본값은 False입니다.
- pad_value : (float, optional) - 이미지의 테두리를 채우는 값입니다. 기본값은 0입니다.

In [51]:
import torch
import torchvision.utils as vutils

img = torch.randn(3, 64, 64)
vutils.save_image(img, "img.png") # RGB의 값으로 무작위로 나오는거 같다.

# DataLoader
데이터를 batch단위로 로드해서 효율적인 학습을 가능하게 해주는 클래스

인자와 기능

- dataset: 데이터를 로드할 데이터셋 객체를 지정합니다. 이는 torch.utils.data.Dataset 클래스를 상속받은 사용자 정의 데이터셋 클래스를 사용하거나, torchvision의 내장 데이터셋 클래스를 사용할 수 있습니다. (기본값: None)

- batch_size: 한 번에 로드할 배치(batch)의 크기를 지정합니다. 작은 배치 크기는 더 많은 메모리를 사용하지만 더 자주 모델이 업데이트되고 더 높은 학습 속도를 제공합니다. (기본값: 1)

- shuffle: 데이터를 섞을지 여부를 지정합니다. True로 설정할 경우, 데이터가 매 에폭(epoch)마다 섞여서 모델이 각 배치에서 다양한 데이터를 학습하도록 도와줍니다.(기본값: False)

- num_workers: 데이터 로딩에 사용할 워커(worker)의 수를 지정합니다. 병렬 처리를 통해 데이터 로딩 속도를 향상시키는 데 사용됩니다.(기본값: 0)

- pin_memory: GPU 메모리에 데이터를 고정할지 여부를 지정합니다. GPU를 사용하는 경우 True로 설정하면 데이터가 CPU와 GPU 간에 더 빠르게 복사되어 학습 속도를 향상시킬 수 있습니다. (기본값: False)

- collate_fn: 배치를 생성하기 전에 데이터를 결합하는 함수를 지정합니다. 기본값은 None이며, 데이터셋이 출력하는 원시 데이터의 리스트를 배치로 결합합니다. 필요에 따라 사용자 정의 결합 함수를 지정하여 배치를 구성할 수 있습니다.(기본값: None)

- drop_last: 마지막 배치의 크기가 batch_size보다 작을 경우, 해당 배치를 무시할지 여부를 지정합니다. True로 설정할 경우 마지막 배치를 무시합니다.(기본값: False)

```
dataset = CustomImageDataset(file_list, label_list, transform=transform)

dataloader = DataLoader(dataset, batch_size=32, shuffle=True, num_workers=4)

for images, labels in dataloader:
    # 학습 수행
    pass
```