In [1]:
import os
import pandas as pd
import torch
import torch.nn as nn
import torch.optim as optim
from torchvision import transforms, models
from torch.utils.data import DataLoader, Dataset
from PIL import Image

In [2]:
dataframe = pd.read_csv("D:\minkwan\졸업작품\coordikitty-ML-DL\dataframe_bottoms.csv")
dataframe

Unnamed: 0,image_file,label_file,large_category,medium_category,small_category,핏,촉감,신축성,비침,두께,계절,major_style,minor_style
0,BOTTOMS_LONG_COTTON_image_1005_0.jpg,1005_label_BOTTOMS_LONG_COTTON.json,BOTTOMS,LONG,COTTON,루즈,약간 뻣뻣함,없음,없음,,"봄, 가을",미니멀,캐주얼
1,BOTTOMS_LONG_COTTON_image_1010_1.jpg,1010_label_BOTTOMS_LONG_COTTON.json,BOTTOMS,LONG,COTTON,레귤러,보통,보통,보통,보통,"봄, 여름, 가을",미니멀,캐주얼
2,BOTTOMS_LONG_COTTON_image_1012_3.jpg,1012_label_BOTTOMS_LONG_COTTON.json,BOTTOMS,LONG,COTTON,루즈,보통,없음,없음,보통,여름,미니멀,캐주얼
3,BOTTOMS_LONG_COTTON_image_1014_1.jpg,1014_label_BOTTOMS_LONG_COTTON.json,BOTTOMS,LONG,COTTON,레귤러,보통,약간 있음,없음,보통,"봄, 여름, 가을",미니멀,캐주얼
4,BOTTOMS_LONG_COTTON_image_1016_1.jpg,1016_label_BOTTOMS_LONG_COTTON.json,BOTTOMS,LONG,COTTON,루즈,보통,없음,없음,보통,"봄, 여름, 가을, 겨울",미니멀,캐주얼
...,...,...,...,...,...,...,...,...,...,...,...,...,...
5537,BOTTOMS_SHORT_SWEAT_image_992_0.jpg,992_label_BOTTOMS_SHORT_SWEAT.json,BOTTOMS,SHORT,SWEAT,루즈,보통,보통,보통,보통,여름,캐주얼,스트릿
5538,BOTTOMS_SHORT_SWEAT_image_993_0.jpg,993_label_BOTTOMS_SHORT_SWEAT.json,BOTTOMS,SHORT,SWEAT,슬림,부드러움,있음,없음,얇음,"봄, 여름, 가을",캐주얼,스트릿
5539,BOTTOMS_SHORT_SWEAT_image_994_0.jpg,994_label_BOTTOMS_SHORT_SWEAT.json,BOTTOMS,SHORT,SWEAT,"레귤러, 루즈",부드러움,보통,없음,보통,"봄, 여름",캐주얼,스트릿
5540,BOTTOMS_SHORT_SWEAT_image_995_0.jpg,995_label_BOTTOMS_SHORT_SWEAT.json,BOTTOMS,SHORT,SWEAT,오버 사이즈,부드러움,있음,없음,얇음,여름,캐주얼,스트릿


In [3]:
# 라벨 인코딩을 위한 사전 생성
label_mapping = {label: idx for idx, label in enumerate(dataframe['minor_style'].unique())}
dataframe['label'] = dataframe['minor_style'].map(label_mapping)  # 새로운 숫자형 라벨 컬럼 추가

In [4]:
# 라벨 매핑 출력
print("라벨 매핑:")
for label, idx in label_mapping.items():
    print(f"'{label}': {idx}")

라벨 매핑:
'캐주얼': 0
'스트릿': 1
'미니멀': 2
'nan': 3


In [5]:
# CustomDataset 클래스 정의
class CustomDataset(Dataset):
    def __init__(self, dataframe, image_dir, label_column, transform=None):
        self.dataframe = dataframe
        self.image_dir = image_dir
        self.label_column = label_column
        self.transform = transform

    def __len__(self):
        return len(self.dataframe)

    def __getitem__(self, idx):
        # 이미지 파일 이름을 데이터프레임의 'image_file' 컬럼에서 가져옴
        img_name = os.path.join(self.image_dir, self.dataframe.iloc[idx]['image_file'])
        
        # 이미지 열기
        image = Image.open(img_name).convert('RGB')
        label = self.dataframe.iloc[idx]['label']  # 숫자형 라벨 사용

        if self.transform:
            image = self.transform(image)

        # 라벨을 Tensor로 변환
        label = torch.tensor(label, dtype=torch.long)

        return image, label  # (image, label) 튜플 반환

In [6]:
image_dir = "D:\minkwan\졸업작품\coordikitty-ML-DL\image_root_dir"
label_column = 'minor_style'  # 사용할 라벨 컬럼

In [7]:
# 이미지 전처리 변환
transform = transforms.Compose([
    transforms.Resize((224, 224)),
    transforms.ToTensor(),
])

In [8]:
# 데이터셋 및 데이터로더 초기화
dataset = CustomDataset(dataframe, image_dir, label_column, transform)
dataloader = DataLoader(dataset, batch_size=32, shuffle=True)

In [9]:
# ResNeXt 모델 정의
model = models.resnext50_32x4d(pretrained=True)  # ResNeXt50 모델
num_classes = len(dataframe[label_column].unique())
model.fc = nn.Linear(model.fc.in_features, num_classes)



In [10]:
# 모델을 GPU 또는 CPU로 이동
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = model.to(device)
criterion = nn.CrossEntropyLoss()  # 다중 클래스 분류
optimizer = optim.Adam(model.parameters(), lr=0.001)
print(device)

cuda


In [11]:
# 학습 루프
num_epochs = 10
for epoch in range(num_epochs):
    model.train()
    for batch in dataloader:
        images, labels = batch  # 배치를 언팩킹
        images, labels = images.to(device), labels.to(device)  # 이미지와 라벨을 device로 이동

        optimizer.zero_grad()
        outputs = model(images)
        loss = criterion(outputs, labels)
        loss.backward()
        optimizer.step()

    print(f'Epoch [{epoch+1}/{num_epochs}], Loss: {loss.item():.4f}')

print("학습 완료!")

Epoch [1/10], Loss: 0.8220
Epoch [2/10], Loss: 0.4658
Epoch [3/10], Loss: 0.0836
Epoch [4/10], Loss: 1.2248
Epoch [5/10], Loss: 0.9545
Epoch [6/10], Loss: 0.4184
Epoch [7/10], Loss: 0.1420
Epoch [8/10], Loss: 0.7839
Epoch [9/10], Loss: 0.5688
Epoch [10/10], Loss: 0.4800
학습 완료!


In [12]:
# 학습된 모델 가중치 저장
model_save_path = 'resnext_model_bottoms_minor_style.pth'  # 저장할 파일 경로
torch.save(model.state_dict(), model_save_path)

print("학습 완료 및 모델 가중치 저장!")

학습 완료 및 모델 가중치 저장!
