# Lab 01. Custom Dataset 구현 복습
---

In [1]:
import torch
import os
import glob

from PIL import Image
from torch.utils.data import Dataset, DataLoader
from torchvision import transforms

In [2]:
def is_grayscale(img) : 
    # 그레이 스케일로 변환 
    return img.mode == 'L'

# image_paths => ./dataset/폴더/*.jpg
# image_paths => ./dataset/
class CustomImageDataset(Dataset) :
    
    def __init__(self, image_paths, transform=None) :      # CustomImageDataset 클래스 초기화 담당
        """
        일반적으로 데이터셋 경로 지정, 라벨 파일 경로 지정, transform 정의, 라벨 지정 작업을 수행한다.
        """
        ############ 기본 구성 #############
        # 데이터셋 경로 지정 = ["....png, "....png"] 
        self.image_paths = glob.glob(os.path.join(image_paths, "*", "*.jpg" ))
        
        # transform 정의
        self.transform = transform

        ########## 추가 구성 ##############
        # 라벨 지정 
        self.label_dict = {'dew' : 0, 'fogsmog' : 1, 'frost' : 2, 'glaze' : 3, 'hail' : 4, 'lightning' : 5, 
                            'rain': 6, 'rainbow' : 7, 'rime' : 8, 'sandstorm' : 9, 'snow' : 10}
    
    
    # 흑백 학습 / RGB 학습
    def __getitem__(self, index) :
        ############ 기본 구성 #############
        # 1. 이미지 처리 
        image_path = self.image_paths[index]
        image = Image.open(image_path).convert('RGB')
        
        if not is_grayscale(image) : 

            # 2. 라벨 매칭 
            # print(image_path)     # ./dataset/lightning/1831.jpg -> split('/') -> ['.', 'dataset', 'lightning', '1831.jpg']
            foloder_name = image_path.split("/")
            # windows === > foloder_name = image_path.split("\\")
            foloder_name = foloder_name[2]
            label = self.label_dict[foloder_name]
            #  print(image_path, label)    # ['.', 'dataset', 'lightning', '1831.jpg']

            # 3. transform
            if self.transform : 
                image = self.transform(image)

            return image, label
        
        else : 
            print("흑백 이미지 >> " , image_path)
            
    
    def __len__(self) : 
        return len(self.image_paths)
    

transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor()
])
    
dataset = CustomImageDataset("./dataset/", transform=transform)

print(len(dataset))
# for i in dataset : 
#    print(i)
dataloader = DataLoader(dataset, batch_size=5, shuffle=True, drop_last=False)

# 모델 선언, 로스 함수 선언, 옵티마이저 선언 , 러닝 레이트 선언 

# 학습 코드 생성
# for images, labels in dataloader : 
#     print(images, labels)
"""
기본 구조
train_dataset = CustomImageDataset("./dataset/train/", transform=transform)
val_dataset   = CustomImageDataset("./dataset/val/", transform=transform)
train_loader  = DataLoader(train_dataset, batch_size = 32, shuffle=True, drop_last=False)
val_loader    = DataLoader(val_dataset, batch_size = 32, shuffle=False, drop_last=False)
"""


55


'\n기본 구조\ntrain_dataset = CustomImageDataset("./dataset/train/", transform=transform)\nval_dataset   = CustomImageDataset("./dataset/val/", transform=transform)\ntrain_loader  = DataLoader(train_dataset, batch_size = 32, shuffle=True, drop_last=False)\nval_loader    = DataLoader(val_dataset, batch_size = 32, shuffle=False, drop_last=False)\n'