# custom dataset with albumentations

In [14]:
import os 
import glob
import cv2

from torch.utils.data import Dataset, DataLoader

import albumentations as A
from albumentations.pytorch.transforms import ToTensorV2

In [15]:
class mycustomdataset(Dataset):
    
    def __init__(self, image_path, transform):
    
        # 이미지 경로 정의
        self.image_paths = glob.glob(os.path.join(image_path, "*","*","*.png"))
        
        # 이미지 변환 aug 정의
        self.transform = transform
        
        # 라벨 dict
        self.label_dict = {"Stealing_Courier" : 0}
    
    def __getitem__(self,index):
        
        # 이미지 경로 지정하고 이미지 열기 
        image_path = self.image_paths[index]
        
        image = cv2.imread(image_path)
        image = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
        
        # 라벨 지정
        label_temp = image_path.split("\\")[1]
#         print(label_temp)
        label = self.label_dict[label_temp]
#         print(label)
        
        
#       albumentations trasform
        if self.transform:
            augmented = self.transform(image=image)
            image= augmented['image']
        
        
        # pytorch의 transform  처리
#         if self.transform :
#             image = self.transform(image)
            
        return image, label
    
    
    def __len__(self):
        
        # 전체 길이 변환
        # 데이터셋을 반복 가능한(iterable) 객체로 만들기 위해 필요합니다.
        return len(self.image_paths)
    

##### albumentations 라이브러리 적용 
albumentations_transform = A.Compose([
    A.Resize(224,224),
    A.HorizontalFlip(),
    A.Normalize(
        mean=[0.485, 0.456, 0.406],
        std=[0.229, 0.224, 0.225],
    ),
    ToTensorV2()
])
    

# init 테스트    
test = mycustomdataset("./AI_hub_dataset", transform=None)


# getitem 테스트
for i in test : 
    pass