- 데이터 증강을 train data에만 적용하려 했으나, test data에도 적용됨  
    => 이를 해결하면 성능 개선 가능
- 데이터 파일도 한 번 다시 살펴보고 성능을 저하시킬만한 퀄리티가 안좋은 이미지 데이터 제거해야 함
- 하이퍼파라미터튜닝도 추후에 진행
- label 불균형 해소  
=> 데이터 증강 활용
- label 선택하기
- label: [TV 받침, 거울, 빨래건조대, 서랍장, 쇼파, 시계, 안마의자, 의자, 자전거, 장롱, 장식장, 진열대, 책꽂이, 책상, 책장, 침대, 테이블, 피아노, 화장대]
- 설계서에 이미지 중복된 데이터 제거한 거 담기

In [3]:
import torch
from torch.utils.data import DataLoader, random_split
from torchvision import datasets, transforms
from torchvision.transforms import functional as F
import random
import numpy as np
random.seed(42)
np.random.seed(42)
torch.manual_seed(42)



# 데이터셋 경로
data_dir = r'C:/Users/lej55/ssdamssdam/data/duplicate_data/merged_data'

# 전처리 및 데이터 증강 함수 정의
class CustomTransform:
    def __init__(self, augment=False):
        self.augment = augment

    def __call__(self, img):
        # 기본적인 이미지 전처리 (크기 조정, 텐서 변환, 정규화)
        img = transforms.Resize((224, 224))(img)  # 이미지 크기 조정
        img = transforms.ToTensor()(img)  # 텐서로 변환
        img = transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])(img)  # 정규화
        
        # 데이터 증강 (훈련 데이터에서만 적용)
        if self.augment:
            # 랜덤 좌우 반전
            if random.random() > 0.5:
                img = F.hflip(img)
            
            # 랜덤 회전
            angle = random.randint(-30, 30)
            img = F.rotate(img, angle)

            # 랜덤 밝기 조정
            brightness = random.uniform(0.5, 1.5)
            img = F.adjust_brightness(img, brightness)
            
            # 랜덤 크롭
            i, j, h, w = transforms.RandomCrop.get_params(img, output_size=(224, 224))
            img = F.crop(img, i, j, h, w)
        
        return img


# 데이터셋 로딩 (전체 데이터 로딩)
transform = CustomTransform(augment=False)  # 증강 없이 전처리만 적용
dataset = datasets.ImageFolder(root=data_dir, transform=transform)

# 데이터셋을 훈련, 검증, 테스트 데이터로 분할
train_size = int(0.8 * len(dataset))  # 80% 훈련 데이터
val_size = int(0.1 * len(dataset))    # 10% 검증 데이터
test_size = len(dataset) - train_size - val_size  # 나머지 10% 테스트 데이터

# 랜덤하게 데이터셋을 나눕니다
train_dataset, val_dataset, test_dataset = random_split(dataset, [train_size, val_size, test_size])

# 훈련 데이터에 데이터 증강을 적용
train_transform = CustomTransform(augment=True)  # 훈련 데이터는 데이터 증강
train_dataset.dataset.transform = train_transform  # 훈련 데이터셋에 증강을 적용

# 검증 및 테스트 데이터는 증강 없이 전처리만 적용
val_transform = CustomTransform(augment=False)  # 검증 데이터셋에는 전처리만 적용
test_transform = CustomTransform(augment=False)  # 테스트 데이터셋에는 전처리만 적용

val_dataset.dataset.transform = val_transform  # 검증 데이터셋에 전처리만 적용
test_dataset.dataset.transform = test_transform  # 테스트 데이터셋에 전처리만 적용

# 데이터 로더 설정
train_loader = DataLoader(train_dataset, batch_size=32, shuffle=True)
val_loader = DataLoader(val_dataset, batch_size=32, shuffle=False)
test_loader = DataLoader(test_dataset, batch_size=32, shuffle=False)

# 훈련, 검증, 테스트 데이터셋 크기 확인
print(f"Train dataset size: {len(train_loader.dataset)}")
print(f"Validation dataset size: {len(val_loader.dataset)}")
print(f"Test dataset size: {len(test_loader.dataset)}")

Train dataset size: 5479
Validation dataset size: 684
Test dataset size: 686


In [4]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.optim import lr_scheduler
from torch.utils.data import DataLoader
import timm
from sklearn.metrics import accuracy_score

# 모델 불러오기 (EfficientNet-B0)
model = timm.create_model('efficientnet_b0', pretrained=True)

# 마지막 Fully Connected Layer (FC) 수정 (Fine-tuning)
num_ftrs = model.classifier.in_features  # 기존 FC layer의 입력 차원
model.classifier = nn.Sequential(
    nn.Linear(num_ftrs, 512),  # 첫 번째 FC layer
    nn.ReLU(),  # ReLU 활성화 함수
    nn.Dropout(0.5),  # Dropout 추가
    nn.Linear(512, len(dataset.classes))  # 클래스 개수만큼 출력
)

# 모델 파라미터 freeze (classifier 제외)
for param in model.parameters():
    param.requires_grad = False  # 모든 파라미터 freeze

# classifier 파라미터만 학습하도록 설정
for param in model.classifier.parameters():
    param.requires_grad = True

# GPU 사용 설정
device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
model.to(device)

# 손실 함수와 옵티마이저 설정
criterion = nn.CrossEntropyLoss()
optimizer = optim.Adam(model.classifier.parameters(), lr=0.0001)  # optimizer는 classifier 파라미터만 사용
scheduler = lr_scheduler.StepLR(optimizer, step_size=7, gamma=0.1)  # 학습률 스케줄러

# 훈련 함수
def train_model(model, train_loader, val_loader, criterion, optimizer, scheduler, num_epochs=10):
    best_model_wts = model.state_dict()
    best_acc = 0.0

    for epoch in range(num_epochs):
        print(f"Epoch {epoch+1}/{num_epochs}")
        print("-" * 10)

        # 훈련 단계
        model.train()
        running_loss = 0.0
        corrects = 0
        total = 0
        for inputs, labels in train_loader:
            inputs, labels = inputs.to(device), labels.to(device)

            optimizer.zero_grad()

            outputs = model(inputs)
            loss = criterion(outputs, labels)
            loss.backward()
            optimizer.step()

            # 통계 계산
            running_loss += loss.item() * inputs.size(0)
            _, preds = torch.max(outputs, 1)
            corrects += torch.sum(preds == labels.data)
            total += labels.size(0)

        epoch_loss = running_loss / len(train_loader.dataset)
        epoch_acc = corrects.double() / total

        print(f"Train Loss: {epoch_loss:.4f} \n \t Acc: {epoch_acc:.4f}")

        # 검증 단계
        model.eval()
        val_loss = 0.0
        val_corrects = 0
        val_total = 0
        all_preds = []
        all_labels = []

        with torch.no_grad():
            for inputs, labels in val_loader:
                inputs, labels = inputs.to(device), labels.to(device)

                outputs = model(inputs)
                loss = criterion(outputs, labels)

                # 통계 계산
                val_loss += loss.item() * inputs.size(0)
                _, preds = torch.max(outputs, 1)
                val_corrects += torch.sum(preds == labels.data)
                val_total += labels.size(0)

                all_preds.extend(preds.cpu().numpy())
                all_labels.extend(labels.cpu().numpy())

        val_loss = val_loss / len(val_loader.dataset)
        val_acc = val_corrects.double() / val_total

        print(f"Validation Loss: {val_loss:.4f} \n \t Acc: {val_acc:.4f}\n")

        # 학습률 스케줄러 변경 (검증 성능 개선시만 적용)
        # 모델이 개선되면 모델 가중치를 저장
        if val_acc > best_acc:
            best_acc = val_acc
            best_model_wts = model.state_dict()
            scheduler.step()  # 성능 개선이 있을 때만 학습률을 변경


    # 최종적으로 학습한 가장 좋은 모델 가중치 로드
    model.load_state_dict(best_model_wts)
    return model

# 모델 학습
trained_model = train_model(model, train_loader, val_loader, criterion, optimizer, scheduler, num_epochs=10)

# 테스트 데이터셋 평가
def evaluate_model(model, test_loader):
    model.eval()
    all_preds = []
    all_labels = []

    with torch.no_grad():
        for inputs, labels in test_loader:
            inputs, labels = inputs.to(device), labels.to(device)

            outputs = model(inputs)
            _, preds = torch.max(outputs, 1)

            all_preds.extend(preds.cpu().numpy())
            all_labels.extend(labels.cpu().numpy())

    acc = accuracy_score(all_labels, all_preds)
    print(f"\nTest Accuracy: {acc:.4f}")
    
# 테스트 데이터 평가
evaluate_model(trained_model, test_loader)



Epoch 1/10
----------
Train Loss: 2.4348 
 	 Acc: 0.3913
Validation Loss: 1.8752 
 	 Acc: 0.6711

Epoch 2/10
----------
Train Loss: 1.5351 
 	 Acc: 0.6474
Validation Loss: 1.2443 
 	 Acc: 0.7661

Epoch 3/10
----------
Train Loss: 1.1282 
 	 Acc: 0.7290
Validation Loss: 0.9697 
 	 Acc: 0.7836

Epoch 4/10
----------
Train Loss: 0.9370 
 	 Acc: 0.7629
Validation Loss: 0.8479 
 	 Acc: 0.7939

Epoch 5/10
----------
Train Loss: 0.8109 
 	 Acc: 0.7868
Validation Loss: 0.7748 
 	 Acc: 0.7909

Epoch 6/10
----------
Train Loss: 0.7402 
 	 Acc: 0.8012
Validation Loss: 0.7196 
 	 Acc: 0.8158

Epoch 7/10
----------
Train Loss: 0.6847 
 	 Acc: 0.8085
Validation Loss: 0.6784 
 	 Acc: 0.8129

Epoch 8/10
----------
Train Loss: 0.6248 
 	 Acc: 0.8288
Validation Loss: 0.6376 
 	 Acc: 0.8202

Epoch 9/10
----------
Train Loss: 0.5861 
 	 Acc: 0.8341
Validation Loss: 0.6387 
 	 Acc: 0.8187

Epoch 10/10
----------
Train Loss: 0.5608 
 	 Acc: 0.8387
Validation Loss: 0.5954 
 	 Acc: 0.8363


Test Accuracy: 0.8

In [9]:
# 모델 저장
torch.save(trained_model.state_dict(), "best_trained_model_v1.pth")
print("Model saved as best_trained_model_v1.pth")

Model saved as efficientnet_b0_best_model.pth


In [44]:
from PIL import Image
import torch

# 이미지 예측 함수
def predict_image(image_path, model, transform, class_names):
    """
    한 장의 이미지를 모델에 입력해 예측
    :param image_path: 예측할 이미지 경로
    :param model: 학습된 모델
    :param transform: 이미지 전처리 함수
    :param class_names: 클래스 이름 리스트
    """
    # 이미지를 열고 전처리 적용
    img = Image.open(image_path).convert('RGB')
    img = transform(img)
    
    # 배치 차원 추가
    img = img.unsqueeze(0)

    # 모델을 평가 모드로 전환
    model.eval()

    # GPU 사용 설정
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)
    img = img.to(device)

    # 모델에 이미지 입력
    with torch.no_grad():
        output = model(img)
        _, predicted_class = torch.max(output, 1)

    # 예측 결과 반환
    predicted_label = class_names[predicted_class.item()]
    return predicted_label


# 이미지 경로 설정
image_path = r"C:/Users/lej55/Downloads/새 폴더/의자.jpg"  # 예측할 이미지 경로

# 전처리 함수 (훈련 시 사용했던 전처리 함수와 동일하게 설정)
transform = CustomTransform(augment=False)

# 클래스 이름 리스트
class_names = dataset.classes

# 예측 실행
predicted_label = predict_image(image_path, trained_model, transform, class_names)
print(f"Predicted Label: {predicted_label}")


Predicted Label: 침대


In [50]:
import os
from PIL import Image
import torch

# 이미지 예측 함수
def predict_image(image_path, model, transform, class_names):
    """
    한 장의 이미지를 모델에 입력해 예측
    :param image_path: 예측할 이미지 경로
    :param model: 학습된 모델
    :param transform: 이미지 전처리 함수
    :param class_names: 클래스 이름 리스트
    """
    # 이미지를 열고 전처리 적용
    img = Image.open(image_path).convert('RGB')
    img = transform(img)
    
    # 배치 차원 추가
    img = img.unsqueeze(0)

    # 모델을 평가 모드로 전환
    model.eval()

    # GPU 사용 설정
    device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    model.to(device)
    img = img.to(device)

    # 모델에 이미지 입력
    with torch.no_grad():
        output = model(img)
        _, predicted_class = torch.max(output, 1)

    # 예측 결과 반환
    predicted_label = class_names[predicted_class.item()]
    return predicted_label

# 이미지 폴더 경로 설정
image_folder = r"C:/Users/lej55/Downloads/새 폴더"  # 예측할 이미지가 있는 폴더 경로

# 전처리 함수 (훈련 시 사용했던 전처리 함수와 동일하게 설정)
transform = CustomTransform(augment=False)

# 클래스 이름 리스트
class_names = dataset.classes

# 이미지 폴더 내 모든 이미지 파일을 순차적으로 예측
for image_name in os.listdir(image_folder):
    # 이미지 파일 경로 생성
    image_path = os.path.join(image_folder, image_name)
    
    # 파일이 이미지 파일인지 확인 (확장자 필터링)
    if image_path.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.gif')):
        # 예측 실행
        predicted_label = predict_image(image_path, trained_model, transform, class_names)
        print(f"Image: {image_name}, Predicted Label: {predicted_label}")


Image: TV 받침대.jpg, Predicted Label: 서랍장
Image: 서랍장.jpg, Predicted Label: 진열대
Image: 쇼파.jpg, Predicted Label: 침대
Image: 의자.jpg, Predicted Label: 침대
Image: 의자2.jpg, Predicted Label: 의자
Image: 장롱.jpg, Predicted Label: 장롱
Image: 진열대.jpg, Predicted Label: 책꽂이
Image: 책상.jpg, Predicted Label: 책상
Image: 화장대.jpg, Predicted Label: 화장대
