<a href="https://colab.research.google.com/github/studian/study_pytorch/blob/main/3%EA%B0%95_%ED%8C%8C%EC%9D%B4%ED%86%A0%EC%B9%98_%EC%9E%85%EB%AC%B8_%ED%95%84%EC%88%98_%EC%98%81%EC%83%81(%EB%8D%B0%EC%9D%B4%ED%84%B0_%EB%B6%88%EB%9F%AC%EC%98%A4%EA%B8%B0)%EC%BB%A4%EC%8A%A4%ED%84%B0%EB%A7%88%EC%9D%B4%EC%A7%95.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**1. 파이토치 제공 데이터 사용**

**2. 같은 클래스 별 폴더 이미지 데이터 이용**

**3. 개인 데이터 사용 (2types)**

In [1]:
import torch
import torchvision

In [2]:
# 데이터 불러와서 전처리 바로 할때 사용
import torchvision.transforms as tr 
# DataLoader: 학습시 batch 크기만큼 데이터를 불러와주는 역할을해줌
# Dataset: 
from torch.utils.data import DataLoader, Dataset 
import numpy as np

**1. 파이토치 제공 데이터 사용**

In [3]:
# 전처리는 tr.Compose()를 사용하고, 전처리 순서는 # tr.Compose()안의 [함수1, 함수2, ... 함수3]의 순서로 진행됨
# All transformations accept PIL Image: PIL Image 형태만 됨, numpy 나 다른 데이터 형태, 즉. PIL Image 아니면 에러
# Pad, Grayscale, RandomCrop, Normalize, ..
# Transforms on torch.*Tensor - tensor image
# torchvision.transform.ToPILImage(mode=Nome)...
# ...
transf = tr.Compose([tr.Resize(8), tr.ToTensor()]) # 8x8로 리사이즈 -> tensor 데이터로 바꿔줌

In [4]:
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transf)
len(trainset) # 학습 데이터 셋 개수


Files already downloaded and verified


50000

In [5]:
testset = torchvision.datasets.CIFAR10(root='./data', train=False, download=True, transform=transf)
len(testset) # 테스트 데이터 셋 개수

Files already downloaded and verified


10000

In [6]:
# trainset의 크기 보기: [이미지 채널, 이미지 가로, 이미지 세로] = [3, 8, 8]: pytorch는 채널수가 앞쪽에 있음
trainset[0][0].size()

torch.Size([3, 8, 8])

In [7]:
trainLoader = DataLoader(trainset, batch_size=50, shuffle=True, num_workers=2) # num_worker: 데이터 로드 시 가용 스레드? 여튼 작업자 개수, 에러뜨면 0으로 세팅하면됨
testLoader = DataLoader(testset, batch_size=50, shuffle=True, num_workers=2) # num_worker: 데이터 로드 시 가용 스레드? 여튼 작업자 개수, 에러뜨면 0으로 세팅하면됨

In [8]:
# 학습데이터: 5만개(50000), 배치크기: 50 -> 50000/50 = 1000 --> 즉, 1000번 데이터 로드 해야함: len(trainLoader) = 1000 
len(trainLoader) # 1000: 

1000

In [9]:
data_iter = iter(trainLoader)
images, labels = data_iter.next()

In [10]:
images.size() # torch.Size([50, 3, 8, 8]): 배치사이즈 50개, 3채널, 이미지 가로 8, 이미지 세로 8

torch.Size([50, 3, 8, 8])

**2. 같은 클래스 별 폴더 이미지 데이터 이용**

```python
# 데이터가 ./class/tiger  ./class/lion <- 이렇게 2개 폴더 내에 이미지가 있다고 가정

transf = tr.Compose([tr.Resize(16), tr.ToTensor()]) # 전처리 함수들 등록
trainset = torchvision.datasets.ImageFolder(root='./class', train=True, transform=transf) # ./class 폴더의 하위 폴더들이 자동으로 라벨링 되면서 데이터셋이 만들어짐
trainLoader = DataLoader(trainset, batch_size=10, shuffle=False, num_workers=2) # num_worker: 데이터 로드 시 가용 스레드? 여튼 작업자 개수, 에러뜨면 0으로 세팅하면됨
print(len(trainLoader))
trainset[0][0].size()
```

**3. 개인 데이터 사용 (2types)**

**종류1 ==> torchvision.datasets.ImageFolder 사용 안함**
왜? 

1. 폴더 정리를 못하는 경우
1) 다른 작업과 공용으로 사용해서 하위폴더 정리를 못한다던가, 이름을 못바꾼다던가 할때
2) 폴더가 아닌 SQL 같은곳에서 데이터가 넘어오는 경우

2. tr.Compose() 함수에서 제공하는 전처리 함수들의 개수가 너무 작다.
1) OpenCV 가 훨씬 많고, 아니면, 
2) 내가 직접 preprocessing() 만들어서 사용하는 경우.



In [11]:
#import preprocessing
# 이미지가 32x32 크기의 3채널 이미지, 20개, 그에 따른 라벨 20개가 numpy형태로 로드 됐다고 가정하자.

train_images = np.random.randint(256, size=(20,32,32,3))    # 0~255의 정수 값을 랜덤으로 가짐
train_labels = np.random.randint(2, size=(20,1))            # 0~1의 정수 값을 랜덤으로 가짐

# preprocessing ....
# train_images, train_labels = preprocessing(train_imges, train_labels)

print(train_images.shape, train_labels.shape)
# 이미지: (20, 32, 32, 3)
#  index:   0   1   2  3
#         개수, 가로, 세로, 채널

(20, 32, 32, 3) (20, 1)


In [12]:
class TensorData(Dataset):
  def __init__(self, x_data, y_data):
    self.x_data = torch.FloatTensor(x_data)
    self.x_data = self.x_data.permute(0,3,1,2) ## 이미지 개수, 채널수, 이미지 가로, 이미지 세로: permute() 함수로 순서 바꿔줌
    self.y_data = torch.LongTensor(y_data)
    self.len = self.y_data.shape[0]

  def __getitem__(self, index): # tuple 형태로 바꿔줌
    return self.x_data[index], self.y_data[index]

  def __len__(self):
    return self.len

In [13]:
train_data = TensorData(train_images, train_labels)
train_loader = DataLoader(train_data, batch_size=10, shuffle=True)

In [14]:
train_data[0][0].size()

torch.Size([3, 32, 32])

In [15]:
data_iter = iter(train_loader)
images, labels = data_iter.next()

In [16]:
images.size() # torch.Size([10, 3, 32, 32]): 배치사이즈 10개, 3채널, 이미지 가로 32, 이미지 세로 32

torch.Size([10, 3, 32, 32])

**개 꿀팁 방출**

기본 틀
```python
from torch.utils.data import Dataset

class MyDataset(Dataset):

  def __init__(self):

  def __getitem__(self, index): # tuple 형태로 바꿔줌

  def __len__(self):  
```


**1. ToTensor 조차도 내가 만들자. 즉 PIL image 형태로 값을 받게 바꾸는거 귀찮다.**

In [17]:
class MyDataset(Dataset):

  def __init__(self, x_data, y_data, transform=None):
    # 텐서 변환 안함
    self.x_data = x_data
    self.y_data = y_data
    self.transform = transform
    self.len = len(y_data)
    
  def __getitem__(self, index): 
    # 튜플 형태로 내보내기 전에 전처리 작업 실행
    sample = self.x_data[index], self.y_data[index]
    if self.transform:
      sample = self.transform(sample)

    return sample   # 넘파이로 출력됨

  def __len__(self):
    return self.len

class MyToTensor:
  def __call__(self, sample):
    inputs, labels = sample
    inputs = torch.FloatTensor(inputs)
    inputs = inputs.permute(2,0,1)
    return inputs, torch.LongTensor(labels)

# 들어온 데이터를 연산
class MyLinearTensor:
  def __init__(self, slope=1, bias=0):
    self.slope = slope
    self.bias = bias

  def __call__(self, sample):
    inputs, labels = sample
    inputs = self.slope * inputs + self.bias
    return inputs, labels


**사용법**

In [18]:
trans = tr.Compose([MyToTensor(),MyLinearTensor(2,5)]) # tr.Compose 지정: 전처리 할것 순서대로 나열

ds1 = MyDataset(train_images, train_labels, transform=trans)

train_loader1 = DataLoader(ds1, batch_size=10, shuffle=True)

In [19]:
first_data = ds1[0]

features, labels = first_data

print(type(features), type(labels))

<class 'torch.Tensor'> <class 'torch.Tensor'>


In [20]:
dataiter1 = iter(train_loader1)
images1, labels1 = dataiter1.next()

In [21]:
# 원래는 이미지가 # 0~255의 정수 값을 가졌으나, 
# LinearTensor(2,5) 연산으로 인해 inputs = self.slope * inputs + self.bias
# 즉 2*(0~255) + 5의 값으로 변했음. -> (5~515) 값으로 변함
images1

tensor([[[[ 25., 503.,  75.,  ..., 409., 305., 147.],
          [375.,  21., 403.,  ...,  45., 263.,  97.],
          [275., 203., 297.,  ..., 351.,  87., 129.],
          ...,
          [235., 303., 451.,  ..., 219., 157., 109.],
          [157., 293.,  61.,  ..., 109., 337., 265.],
          [449., 513.,  89.,  ..., 221., 423., 411.]],

         [[413., 301.,  57.,  ..., 279., 419., 211.],
          [195., 225., 239.,  ..., 369., 469., 439.],
          [ 51.,  49., 121.,  ..., 119., 107., 259.],
          ...,
          [191., 485., 429.,  ..., 441., 215., 119.],
          [307., 299., 347.,  ..., 183., 481., 201.],
          [277., 265., 393.,  ..., 165.,  47., 167.]],

         [[215., 333.,   9.,  ..., 263., 265., 417.],
          [ 99., 171., 275.,  ..., 341., 123., 127.],
          [413., 225., 349.,  ..., 127., 193., 333.],
          ...,
          [417., 165.,  41.,  ...,  53., 283., 245.],
          [ 91.,  27., 237.,  ...,  85.,  71., 451.],
          [123., 285., 129.,  ...

**2.ToTensor 를 사용하는 방향으로 가자. 즉 MyTransform()함수를 만들어서 PIL image 형태로 값을 받게 바꾸고, pytorch 지원함수들을 사용하자**
** ***이 방법은 잘 안됨 ㅜㅜ*** **

In [22]:
class MyDataset(Dataset):

  def __init__(self, x_data, y_data, transform=None):
    # 텐서 변환 안함
    self.x_data = x_data
    self.y_data = y_data
    self.transform = transform
    self.len = len(y_data)
    
  def __getitem__(self, index): 
    # 튜플 형태로 내보내기 전에 전처리 작업 실행
    sample = self.x_data[index], self.y_data[index]

    if self.transform:
      sample = self.transform(sample)

    return sample   # 넘파이로 출력됨

  def __len__(self):
    return self.len

class MyTransform:

  def __call__(self, sample):
    inputs, labels = sample
    inputs = torch.FloatTensor(inputs)
    inputs = inputs.permute(2,0,1)
    labels = torch.LongTensor(labels)

    #transf = tr.Compose([tr.ToPILImage(), tr.Resize(128), tr.ToTensor(), tr.Normalize((0.5,0.5,0.5), (0.5,0.5,0.5), (0.5,0.5,0.5))])
    transf = tr.Compose([tr.ToPILImage(), tr.Resize(128), tr.ToTensor()])
    final_output = transf(input)
    
    return final_output, labels

In [23]:
ds2 = MyDataset(train_images, train_labels, transform=MyTransform())
train_loader2 = DataLoader(ds2, batch_size=10, shuffle=True)

In [24]:
first_data = ds2[0]

features, labels = first_data

print(type(features), type(labels))

TypeError: ignored

In [None]:
dataiter2 = iter(train_loader2)
images2, labels2 = dataiter2.next()