In [1]:
import torch
import torch.nn as nn
import torch.optim as optim
from torch.utils.data import DataLoader
from torchvision import datasets, transforms

# MNIST 데이터셋 로드
transform = transforms.Compose([
    transforms.ToTensor(),
    transforms.Normalize((0.5,), (0.5,))  # 데이터를 정규화
])

train_dataset = datasets.MNIST('../data', train=True, download=True, transform=transform)
test_dataset = datasets.MNIST('../data', train=False, download=True, transform=transform)

train_loader = DataLoader(train_dataset, batch_size=64, shuffle=True) # 매 epoch마다 섞음. 
test_loader = DataLoader(test_dataset, batch_size=64, shuffle=False)

# 모델 클래스 정의
class ImageClassifier(nn.Module):
    def __init__(self, input_size, output_size):
        super(ImageClassifier, self).__init__()
        self.input_size = input_size
        self.output_size = output_size

        self.layers = nn.Sequential(
            nn.Linear(input_size, 500),
            nn.LeakyReLU(),
            nn.BatchNorm1d(500),
            nn.Linear(500, 400),
            nn.LeakyReLU(),
            nn.BatchNorm1d(400),
            nn.Linear(400, 300),
            nn.LeakyReLU(),
            nn.BatchNorm1d(300),
            nn.Linear(300, 200),
            nn.LeakyReLU(),
            nn.BatchNorm1d(200),
            nn.Linear(200, 100),
            nn.LeakyReLU(),
            nn.BatchNorm1d(100),
            nn.Linear(100, 50),
            nn.LeakyReLU(),
            nn.BatchNorm1d(50),
            nn.Linear(50, output_size),
            nn.LogSoftmax(dim=1)
        )

    def forward(self, x):
        x = x.view(-1, self.input_size)  # Flatten the image
        return self.layers(x)

# 모델, 손실 함수, 최적화 방법 설정
model = ImageClassifier(28*28, 10)  # MNIST 이미지의 크기는 28x28, 클래스는 10개
criterion = nn.NLLLoss()  # Negative Log Likelihood Loss
optimizer = optim.Adam(model.parameters(), lr=0.003)


### dataloader를 사용하려면? -> Dataset을 먼저 구현해줘야함 . 

In [6]:
import torch
from torch.utils.data import Dataset, DataLoader

In [8]:
# 1. Dataset 클래스 정의
class CustomDataset(Dataset):
    def __init__(self):
        # 데이터셋 초기화
        # 임의의 데이터와 레이블을 생성
        self.data = torch.randn(100, 2)  # 100개의 데이터 포인트, 각 포인트는 2차원
        self.labels = torch.randint(0, 2, (100,))  # 0 또는 1의 레이블을 가진 100개의 데이터 포인트

    def __len__(self):
        # 데이터셋의 총 데이터 수
        return len(self.data)

    def __getitem__(self, idx):
        # 인덱스(idx)에 해당하는 데이터와 레이블을 반환
        return self.data[idx], self.labels[idx]

# 2. 데이터셋 인스턴스 생성
custom_dataset = CustomDataset()

In [10]:
len(custom_dataset)

100

In [9]:
custom_dataset[0]

(tensor([-0.1338,  0.1037]), tensor(1))

In [None]:
# 학습 루프
def train(model, train_loader, criterion, optimizer, epochs=10):
    model.train()
    for epoch in range(epochs):
        total_loss = 0
        for images, labels in train_loader:
            optimizer.zero_grad()
            output = model(images)
            loss = criterion(output, labels)
            loss.backward()
            optimizer.step()
            total_loss += loss.item()
        print(f'Epoch {epoch+1}, Loss: {total_loss/len(train_loader)}')

# 모델 학습 실행
train(model, train_loader, criterion, optimizer)

# 테스트 함수 (필요 시 사용)
def test(model, test_loader):
    model.eval()
    correct = 0
    with torch.no_grad():
        for images, labels in test_loader:
            output = model(images)
            pred = output.argmax(dim=1, keepdim=True)
            correct += pred.eq(labels.view_as(pred)).sum().item()
    print(f'Accuracy: {correct / len(test_loader.dataset) * 100:.2f}%')

# 모델 테스트 실행
test(model, test_loader)