# 01. 딥러닝 기초: 퍼셉트론 (Perceptron)

## 개요
퍼셉트론은 신경망의 가장 기본적인 단위로, 입력을 받아 가중치를 곱하고 합산한 후 출력을 내보냅니다.
이 실습에서는 퍼셉트론의 구조와 동작 원리를 코드로 구현해봅니다.

## 학습 목표
1. 퍼셉트론의 구조와 수식 이해
2. AND, OR 논리 게이트 구현
3. XOR 문제와 단일 퍼셉트론의 한계 이해
4. 퍼셉트론 학습 알고리즘 구현

## 핵심 단계
- Step 1: 퍼셉트론 클래스 구현
- Step 2: AND 게이트 구현
- Step 3: OR 게이트 구현
- Step 4: XOR 문제 확인
- Step 5: 퍼셉트론 학습 구현

## 라이브러리 임포트

In [1]:
import numpy as np
import matplotlib.pyplot as plt

# 한글 폰트 설정 (선택사항)
plt.rcParams['font.family'] = 'DejaVu Sans'
plt.rcParams['axes.unicode_minus'] = False

## Step 1: 퍼셉트론 구조 이해

퍼셉트론의 계산 과정:
1. **가중합 계산**: $z = w_1 x_1 + w_2 x_2 + b$
2. **활성화 함수 적용**: $y = 1$ if $z \geq 0$ else $0$

In [None]:
class Perceptron:
    """단순 퍼셉트론 구현"""
    
    def __init__(self, weights, bias):
        """
        Args:
            weights: 가중치 리스트
            bias: 편향
        """
        self.weights = np.array(weights)
        self.bias = bias
    
    def forward(self, x):
        """
        순전파: 입력을 받아 출력 계산
        
        Args:
            x: 입력 배열
        Returns:
            0 또는 1
        """
        x = np.array(x)
        # 가중합 계산
        z = np.dot(self.weights, x) + self.bias
        # 계단 함수 (Step function)
        return 1 if z >= 0 else 0
    
    def __call__(self, x):
        return self.forward(x)

## Step 2: AND 게이트 구현

AND 게이트 진리표:
| $x_1$ | $x_2$ | AND |
|-------|-------|-----|
| 0 | 0 | 0 |
| 0 | 1 | 0 |
| 1 | 0 | 0 |
| 1 | 1 | 1 |

In [None]:
# AND 게이트: w1=0.5, w2=0.5, b=-0.7
and_gate = Perceptron(weights=[0.5, 0.5], bias=-0.7)

# 모든 입력 조합 테스트
print("AND 게이트 테스트:")
print(f"AND(0, 0) = {and_gate([0, 0])}")  # 0
print(f"AND(0, 1) = {and_gate([0, 1])}")  # 0
print(f"AND(1, 0) = {and_gate([1, 0])}")  # 0
print(f"AND(1, 1) = {and_gate([1, 1])}")  # 1

In [None]:
# AND 게이트 계산 과정 자세히 보기
print("\nAND 게이트 계산 과정:")
inputs = [[0, 0], [0, 1], [1, 0], [1, 1]]

for x in inputs:
    z = 0.5 * x[0] + 0.5 * x[1] - 0.7
    y = 1 if z >= 0 else 0
    print(f"x={x}: z = 0.5*{x[0]} + 0.5*{x[1]} - 0.7 = {z:.1f} -> y = {y}")

## Step 3: OR 게이트 구현

OR 게이트 진리표:
| $x_1$ | $x_2$ | OR |
|-------|-------|----|
| 0 | 0 | 0 |
| 0 | 1 | 1 |
| 1 | 0 | 1 |
| 1 | 1 | 1 |

In [None]:
# OR 게이트: w1=0.5, w2=0.5, b=-0.2
or_gate = Perceptron(weights=[0.5, 0.5], bias=-0.2)

print("OR 게이트 테스트:")
print(f"OR(0, 0) = {or_gate([0, 0])}")  # 0
print(f"OR(0, 1) = {or_gate([0, 1])}")  # 1
print(f"OR(1, 0) = {or_gate([1, 0])}")  # 1
print(f"OR(1, 1) = {or_gate([1, 1])}")  # 1

In [None]:
# NAND 게이트도 구현해보기
nand_gate = Perceptron(weights=[-0.5, -0.5], bias=0.7)

print("NAND 게이트 테스트:")
print(f"NAND(0, 0) = {nand_gate([0, 0])}")  # 1
print(f"NAND(0, 1) = {nand_gate([0, 1])}")  # 1
print(f"NAND(1, 0) = {nand_gate([1, 0])}")  # 1
print(f"NAND(1, 1) = {nand_gate([1, 1])}")  # 0

## Step 4: XOR 문제 - 퍼셉트론의 한계

XOR 게이트 진리표:
| $x_1$ | $x_2$ | XOR |
|-------|-------|-----|
| 0 | 0 | 0 |
| 0 | 1 | 1 |
| 1 | 0 | 1 |
| 1 | 1 | 0 |

XOR은 **선형 분리가 불가능**합니다. 단일 퍼셉트론으로는 해결할 수 없습니다.

In [None]:
# XOR 시각화
fig, axes = plt.subplots(1, 3, figsize=(15, 4))

# AND 시각화
ax1 = axes[0]
ax1.scatter([0, 0, 1], [0, 1, 0], c='blue', s=100, label='0')
ax1.scatter([1], [1], c='red', s=100, label='1')
ax1.plot([-0.5, 1.5], [1.4, -0.4], 'g--', linewidth=2, label='Decision Boundary')
ax1.set_xlim(-0.5, 1.5)
ax1.set_ylim(-0.5, 1.5)
ax1.set_xlabel('x1')
ax1.set_ylabel('x2')
ax1.set_title('AND Gate (Linear Separable)')
ax1.legend()
ax1.grid(True)

# OR 시각화
ax2 = axes[1]
ax2.scatter([0], [0], c='blue', s=100, label='0')
ax2.scatter([0, 1, 1], [1, 0, 1], c='red', s=100, label='1')
ax2.plot([-0.5, 1.5], [0.4, -0.6], 'g--', linewidth=2, label='Decision Boundary')
ax2.set_xlim(-0.5, 1.5)
ax2.set_ylim(-0.5, 1.5)
ax2.set_xlabel('x1')
ax2.set_ylabel('x2')
ax2.set_title('OR Gate (Linear Separable)')
ax2.legend()
ax2.grid(True)

# XOR 시각화
ax3 = axes[2]
ax3.scatter([0, 1], [0, 1], c='blue', s=100, label='0')
ax3.scatter([0, 1], [1, 0], c='red', s=100, label='1')
ax3.set_xlim(-0.5, 1.5)
ax3.set_ylim(-0.5, 1.5)
ax3.set_xlabel('x1')
ax3.set_ylabel('x2')
ax3.set_title('XOR Gate (NOT Linear Separable!)')
ax3.legend()
ax3.grid(True)

plt.tight_layout()
plt.show()

## Step 5: 다층 퍼셉트론으로 XOR 해결

XOR 문제는 여러 퍼셉트론을 조합하여 해결할 수 있습니다:
- **XOR = AND(NAND(x1, x2), OR(x1, x2))**

In [None]:
def xor_gate(x1, x2):
    """다층 퍼셉트론으로 XOR 구현"""
    # 첫 번째 층
    s1 = nand_gate([x1, x2])  # NAND
    s2 = or_gate([x1, x2])    # OR
    
    # 두 번째 층
    y = and_gate([s1, s2])    # AND
    
    return y

print("XOR 게이트 테스트 (다층 퍼셉트론):")
print(f"XOR(0, 0) = {xor_gate(0, 0)}")  # 0
print(f"XOR(0, 1) = {xor_gate(0, 1)}")  # 1
print(f"XOR(1, 0) = {xor_gate(1, 0)}")  # 1
print(f"XOR(1, 1) = {xor_gate(1, 1)}")  # 0

## Step 6: 퍼셉트론 학습 알고리즘

퍼셉트론 학습 규칙:
$$w_{new} = w_{old} + \eta \cdot (y_{true} - y_{pred}) \cdot x$$

- $\eta$: 학습률
- $y_{true}$: 실제 정답
- $y_{pred}$: 예측값

In [None]:
class LearnablePerceptron:
    """학습 가능한 퍼셉트론"""
    
    def __init__(self, n_features, learning_rate=0.1):
        # 가중치를 랜덤하게 초기화
        self.weights = np.random.randn(n_features) * 0.1
        self.bias = 0.0
        self.lr = learning_rate
        self.errors = []  # 학습 과정 기록
    
    def forward(self, x):
        z = np.dot(x, self.weights) + self.bias
        return 1 if z >= 0 else 0
    
    def train(self, X, y, epochs=10):
        """
        퍼셉트론 학습
        
        Args:
            X: 입력 데이터 (n_samples, n_features)
            y: 라벨 (n_samples,)
            epochs: 학습 횟수
        """
        X = np.array(X)
        y = np.array(y)
        
        for epoch in range(epochs):
            errors = 0
            for xi, yi in zip(X, y):
                # 예측
                y_pred = self.forward(xi)
                
                # 오차 계산
                error = yi - y_pred
                
                if error != 0:
                    errors += 1
                    # 가중치 업데이트
                    self.weights += self.lr * error * xi
                    self.bias += self.lr * error
            
            self.errors.append(errors)
            
            if errors == 0:
                print(f"Epoch {epoch + 1}: Converged!")
                break
            else:
                print(f"Epoch {epoch + 1}: {errors} errors")

In [None]:
# AND 게이트 학습
print("AND 게이트 학습:")
X_and = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y_and = np.array([0, 0, 0, 1])

and_perceptron = LearnablePerceptron(n_features=2, learning_rate=0.1)
and_perceptron.train(X_and, y_and, epochs=20)

print(f"\n학습된 가중치: {and_perceptron.weights}")
print(f"학습된 편향: {and_perceptron.bias}")

# 테스트
print("\n학습 후 테스트:")
for x, label in zip(X_and, y_and):
    pred = and_perceptron.forward(x)
    print(f"입력: {x}, 정답: {label}, 예측: {pred}")

In [None]:
# 학습 과정 시각화
plt.figure(figsize=(8, 4))
plt.plot(range(1, len(and_perceptron.errors) + 1), and_perceptron.errors, 'bo-')
plt.xlabel('Epoch')
plt.ylabel('Number of Errors')
plt.title('Perceptron Learning Curve (AND Gate)')
plt.grid(True)
plt.show()

## 헬스케어 예제: 간단한 당뇨병 위험도 예측

입력 특성:
- $x_1$: 공복 혈당 (정상=0, 높음=1)
- $x_2$: BMI (정상=0, 과체중=1)
- $x_3$: 가족력 (없음=0, 있음=1)

In [None]:
# 헬스케어 예제: 당뇨병 위험도 예측
# 가중치: 혈당이 가장 중요, BMI 다음, 가족력 순
diabetes_predictor = Perceptron(weights=[0.6, 0.3, 0.2], bias=-0.5)

# 환자 데이터 테스트
patients = [
    ([0, 0, 0], "정상 혈당, 정상 체중, 가족력 없음"),
    ([1, 0, 0], "높은 혈당, 정상 체중, 가족력 없음"),
    ([0, 1, 1], "정상 혈당, 과체중, 가족력 있음"),
    ([1, 1, 0], "높은 혈당, 과체중, 가족력 없음"),
    ([1, 1, 1], "높은 혈당, 과체중, 가족력 있음"),
]

print("당뇨병 위험도 예측:")
print("=" * 50)
for features, description in patients:
    risk = diabetes_predictor(features)
    risk_label = "위험군" if risk == 1 else "정상군"
    print(f"{description}")
    print(f"  -> 예측: {risk_label}")
    print()

## 정리

이번 실습에서 배운 내용:

1. **퍼셉트론의 구조**: 입력 x 가중치 -> 합산 -> 활성화 -> 출력
2. **가중치와 편향**: 각 입력의 중요도와 기준점 조절
3. **선형 분리 가능 문제**: AND, OR 게이트는 단일 퍼셉트론으로 해결
4. **XOR 문제**: 단일 퍼셉트론으로는 불가능, 다층 퍼셉트론 필요
5. **퍼셉트론 학습**: 오차에 따라 가중치를 점진적으로 수정