In [1]:
import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms

transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(64 * 8 * 8, 512)
        self.fc2 = nn.Linear(512, 10)

    def forward(self, x):
        x = nn.functional.relu(self.conv1(x))
        x = nn.functional.max_pool2d(x, 2)
        x = nn.functional.relu(self.conv2(x))
        x = nn.functional.max_pool2d(x, 2)
        x = x.view(-1, 64 * 8 * 8)
        x = nn.functional.relu(self.fc1(x))
        return self.fc2(x)


Downloading https://www.cs.toronto.edu/~kriz/cifar-10-python.tar.gz to ./data\cifar-10-python.tar.gz


100.0%


Extracting ./data\cifar-10-python.tar.gz to ./data


In [2]:
import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms

transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, padding=1)
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        self.fc1 = nn.Linear(64 * 8 * 8, 512)
        self.fc2 = nn.Linear(512, 10)

    def forward(self, x):
        x = nn.functional.relu(self.conv1(x))
        x = nn.functional.max_pool2d(x, 2)
        x = nn.functional.relu(self.conv2(x))
        x = nn.functional.max_pool2d(x, 2)
        x = x.view(-1, 64 * 8 * 8)
        x = nn.functional.relu(self.fc1(x))
        return self.fc2(x)

# 모델 초기화
model = CNN()

# 손실 함수와 옵티마이저 정의
criterion = nn.CrossEntropyLoss()  # 분류 문제이므로 CrossEntropyLoss 사용
optimizer = optim.Adam(model.parameters(), lr=0.001)  # Adam 옵티마이저

# 학습 루프
num_epochs = 10  # 학습 반복 횟수

for epoch in range(num_epochs):
    running_loss = 0.0
    for inputs, labels in trainloader:
        # 옵티마이저 초기화
        optimizer.zero_grad()

        # 순전파 (Forward pass)
        outputs = model(inputs)

        # 손실 계산
        loss = criterion(outputs, labels)

        # 역전파 (Backward pass) 및 최적화
        loss.backward()
        optimizer.step()

        # 손실 누적
        running_loss += loss.item()

    # 에포크마다 평균 손실 출력
    print(f"Epoch {epoch+1}, Loss: {running_loss / len(trainloader)}")

print('Finished Training')

# 모델 저장 (옵션)
torch.save(model.state_dict(), 'cnn_model.pth')

Files already downloaded and verified
Epoch 1, Loss: 1.2806533791854149
Epoch 2, Loss: 0.8887319237241665
Epoch 3, Loss: 0.6971527811471118
Epoch 4, Loss: 0.5296784670915042
Epoch 5, Loss: 0.37058740129702683
Epoch 6, Loss: 0.2421346521618766
Epoch 7, Loss: 0.1536829249804657
Epoch 8, Loss: 0.11462043292262733
Epoch 9, Loss: 0.10082796327555248
Epoch 10, Loss: 0.08420125113711385
Finished Training


In [3]:
import torch
import torchvision
import torch.nn as nn
import torch.optim as optim
import torchvision.transforms as transforms

# 이미지 데이터를 텐서로 변환하고 정규화하는 변환 정의
transform = transforms.Compose([transforms.ToTensor(), transforms.Normalize((0.5,), (0.5,))])

# CIFAR-10 데이터셋을 불러와서 학습용으로 사용, 다운로드 여부 확인 후 변환 적용
trainset = torchvision.datasets.CIFAR10(root='./data', train=True, download=True, transform=transform)

# 데이터셋을 DataLoader로 변환하여 배치 단위로 학습할 수 있도록 함
trainloader = torch.utils.data.DataLoader(trainset, batch_size=32, shuffle=True)

# CNN 모델 클래스 정의
class CNN(nn.Module):
    def __init__(self):
        super(CNN, self).__init__()
        # 첫 번째 합성곱 레이어 정의: 입력 채널 3, 출력 채널 32, 커널 크기 3x3, 패딩 1
        self.conv1 = nn.Conv2d(3, 32, kernel_size=3, padding=1)
        # 두 번째 합성곱 레이어 정의: 입력 채널 32, 출력 채널 64, 커널 크기 3x3, 패딩 1
        self.conv2 = nn.Conv2d(32, 64, kernel_size=3, padding=1)
        # 첫 번째 전결합 레이어 정의: 입력 뉴런 수 64 * 8 * 8 (합성곱 결과의 펼친 크기), 출력 뉴런 512
        self.fc1 = nn.Linear(64 * 8 * 8, 512)
        # 두 번째 전결합 레이어 정의: 입력 뉴런 512, 출력 뉴런 10 (CIFAR-10 클래스 수)
        self.fc2 = nn.Linear(512, 10)

    # 순전파 함수 정의
    def forward(self, x):
        # 첫 번째 합성곱 -> ReLU 활성화 함수 적용
        x = nn.functional.relu(self.conv1(x))
        # Max pooling (2x2) 적용하여 차원 축소
        x = nn.functional.max_pool2d(x, 2)
        # 두 번째 합성곱 -> ReLU 활성화 함수 적용
        x = nn.functional.relu(self.conv2(x))
        # Max pooling (2x2) 적용하여 차원 축소
        x = nn.functional.max_pool2d(x, 2)
        # 차원 축소된 데이터를 1차원으로 펼치기 (batch size 제외)
        x = x.view(-1, 64 * 8 * 8)
        # 첫 번째 전결합 레이어 -> ReLU 활성화 함수 적용
        x = nn.functional.relu(self.fc1(x))
        # 두 번째 전결합 레이어 (최종 출력)
        return self.fc2(x)

# CNN 모델 객체 생성
model = CNN()

# 손실 함수 정의: Cross Entropy Loss (다중 클래스 분류에 적합)
criterion = nn.CrossEntropyLoss()

# Adam 옵티마이저 정의: 모델의 파라미터와 학습률 설정
optimizer = optim.Adam(model.parameters(), lr=0.001)

# 학습 에포크 수 설정
num_epochs = 10

# 학습 루프
for epoch in range(num_epochs):
    running_loss = 0.0  # 현재 에포크의 손실을 누적할 변수 초기화
    for inputs, labels in trainloader:  # 배치 단위로 데이터를 불러옴
        optimizer.zero_grad()  # 옵티마이저의 이전 배치에서 계산된 그래디언트 초기화

        outputs = model(inputs)  # 입력 데이터를 모델에 통과시켜 출력 계산 (순전파)
        
        loss = criterion(outputs, labels)  # 출력값과 정답(label) 간의 손실 계산

        loss.backward()  # 손실을 기반으로 역전파 수행하여 그래디언트 계산

        optimizer.step()  # 옵티마이저가 계산된 그래디언트를 사용하여 가중치 업데이트

        running_loss += loss.item()  # 배치의 손실 값을 누적

    # 에포크 완료 후 평균 손실 출력
    print(f"Epoch {epoch+1}, Loss: {running_loss / len(trainloader)}")

# 학습 완료 메시지 출력
print('Finished Training')

# 학습된 모델의 파라미터 저장
torch.save(model.state_dict(), 'cnn_model.pth')


Files already downloaded and verified
Epoch 1, Loss: 1.2508139729271008
Epoch 2, Loss: 0.858227761697098
Epoch 3, Loss: 0.6571506361929331
Epoch 4, Loss: 0.47599641548771165
Epoch 5, Loss: 0.307143199032915
Epoch 6, Loss: 0.1857088731008362
Epoch 7, Loss: 0.13086319744398653
Epoch 8, Loss: 0.1021900220407067
Epoch 9, Loss: 0.08317620774529343
Epoch 10, Loss: 0.07451604821990195
Finished Training


주석 설명

데이터셋 로드 및 전처리:

transforms.Compose를 통해 이미지를 텐서로 변환하고 정규화(평균 0.5, 표준편차 0.5)를 적용합니다.
trainloader는 배치 크기 32로 CIFAR-10 데이터를 로드하고, 학습에 사용할 수 있도록 제공합니다.

모델 정의:
두 개의 합성곱 레이어와 두 개의 전결합 레이어로 구성된 CNN 모델입니다.
각 합성곱 레이어 이후에 ReLU 활성화 함수와 MaxPooling을 사용하여 차원을 축소하고 비선형성을 추가합니다.
마지막에 펼친 벡터 형태의 출력을 전결합 레이어로 전달하여 CIFAR-10의 10개 클래스에 대해 예측합니다.

학습 루프:
손실 함수는 Cross Entropy Loss로, 다중 클래스 분류에서 자주 사용되는 손실 함수입니다.
Adam 옵티마이저를 사용해 모델의 가중치를 업데이트합니다.
매 에포크가 끝날 때마다 평균 손실 값을 출력하여 학습 진행 상황을 확인합니다.

모델 저장:
학습이 완료되면 model.state_dict()를 사용하여 모델의 파라미터를 저장합니다. 이 파일을 나중에 로드하여 모델을 재사용할 수 있습니다.