In [6]:
# 논리 회귀(단층 퍼셉트론)로 XOR 문제 풀기

X = torch.FloatTensor([[0, 0], [0, 1], [1, 0], [1, 1]])
y = torch.FloatTensor([[0], [1], [1], [0]])

model = nn.Sequential(
    nn.Linear(2, 1),   # 입력 2차원 → 출력 1차원
    nn.Sigmoid()      #  출력층 활성화 함수
)

optimizer = optim.SGD(model.parameters(), lr=1)

epochs = 1000

for epoch in range(epochs + 1):
    y_pred = model(X)
    loss = nn.BCELoss()(y_pred, y)
    optimizer.zero_grad()
    loss.backward()
    optimizer.step()

    if epoch % 100 == 0:
        y_bool = (y_pred >= 0.5).float()
        accuracy = (y == y_bool).float().sum() / len(y) * 100
        print(f'Epoch {epoch:4d}/{epochs} Loss: {loss:.6f} Accuracy: {accuracy:.2f}%')

Epoch    0/1000 Loss: 0.714461 Accuracy: 25.00%
Epoch  100/1000 Loss: 0.693148 Accuracy: 50.00%
Epoch  200/1000 Loss: 0.693147 Accuracy: 75.00%
Epoch  300/1000 Loss: 0.693147 Accuracy: 75.00%
Epoch  400/1000 Loss: 0.693147 Accuracy: 50.00%
Epoch  500/1000 Loss: 0.693147 Accuracy: 50.00%
Epoch  600/1000 Loss: 0.693147 Accuracy: 50.00%
Epoch  700/1000 Loss: 0.693147 Accuracy: 50.00%
Epoch  800/1000 Loss: 0.693147 Accuracy: 50.00%
Epoch  900/1000 Loss: 0.693147 Accuracy: 50.00%
Epoch 1000/1000 Loss: 0.693147 Accuracy: 50.00%


은닉층
:  입력 데이터를 비선형적으로 변환해, 출력층이 올바른 판단을 내릴 수 있도록 돕는 중간 계산 층으로, 은닉층이 생기면 선형 변환 + 비선형 함수를 반복하면서 복잡한 함수도 학습 가능하고, 뇌처럼 여러 층을 거치며 점점 더 추상적인 특징을 학습할 수 있다.

In [4]:
import torch
import torch.nn as nn
import torch.optim as optim

model = nn.Sequential(
    nn.Linear(2, 2),   # 입력 2차원 → 은닉층 2노드
    nn.Sigmoid(),      # 은닉층 활성화 함수 (은닉층에 비선형형 부여)
    nn.Linear(2, 1),   # 은닉층 2노드 → 출력 1노드
    nn.Sigmoid()       # 출력층 활성화 함수 (0~1 사이의 범위로 확률화)
)

model

Sequential(
  (0): Linear(in_features=2, out_features=2, bias=True)
  (1): Sigmoid()
  (2): Linear(in_features=2, out_features=1, bias=True)
  (3): Sigmoid()
)

In [5]:
# 논리 회귀(다층 퍼셉트론)로 XOR 문제 풀기

X = torch.FloatTensor([[0, 0], [0, 1], [1, 0], [1, 1]])
y = torch.FloatTensor([[0], [1], [1], [0]])

optimizer = optim.SGD(model.parameters(), lr=1)

epochs = 1000

for epoch in range(epochs + 1):
    y_pred = model(X)  # 순전파 (예측값 계산. X를 모델에 넣어서 예측값 y_pred 계산.)
    loss = nn.BCELoss()(y_pred, y)

    optimizer.zero_grad()  # 기존 기울기 초기화
    loss.backward()            # 역전파: 기울기 계산
    optimizer.step()            # 가중치 업데이트

    if epoch % 100 == 0:      # 매 100번마다 중간 결과를 확인
        y_bool = (y_pred >= 0.5).float()  # 확률값이 0.5 이상이면 1.0, 아니면 0.0. # float()로 변환: True/False → 1.0/0.0
        accuracy = (y == y_bool).float().sum() / len(y) * 100
        print(f'Epoch {epoch:4d}/{epochs} Loss: {loss:.6f} Accuracy: {accuracy:.2f}%')

Epoch    0/1000 Loss: 0.854845 Accuracy: 50.00%
Epoch  100/1000 Loss: 0.693393 Accuracy: 50.00%
Epoch  200/1000 Loss: 0.692602 Accuracy: 50.00%
Epoch  300/1000 Loss: 0.689451 Accuracy: 50.00%
Epoch  400/1000 Loss: 0.659536 Accuracy: 75.00%
Epoch  500/1000 Loss: 0.556877 Accuracy: 75.00%
Epoch  600/1000 Loss: 0.456332 Accuracy: 75.00%
Epoch  700/1000 Loss: 0.214393 Accuracy: 100.00%
Epoch  800/1000 Loss: 0.087342 Accuracy: 100.00%
Epoch  900/1000 Loss: 0.049904 Accuracy: 100.00%
Epoch 1000/1000 Loss: 0.034142 Accuracy: 100.00%


**옵티마이저의 핵심 역할**

순전파: 예측값 계산 (계산만 함)

손실 계산: 예측값 vs 정답의 차이 (오차)

역전파: 오차를 미분해서 각 가중치가 얼마나 잘못됐는지 계산

✅ 옵티마이저:
→ 이 미분값(그래디언트)을 사용해서 가중치를 실제로 업데이트!

# **비선형 활성화 함수**

- 시그모이드
- 하이퍼볼릭 탄젠트
- 렐루
- 소프트맥스