<a href="https://colab.research.google.com/github/parksuejin1026/2025-ANN/blob/main/Weeks6/MLP.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
# XOR 문제 해결 실습

In [1]:
import numpy as np

w11 = np.array([-2, -2])
w12 = np.array([2, 2])
w2 = np.array([1, 1])
b1 = 3
b2 = -1
b3 = -1

In [2]:
def MLP(x, w, b):
  y = np.sum(w * x) + b
  if y <= 0:
    return 0
  else:
    return 1

In [8]:
# NAND 게이트
def NAND(x1, x2):
  return MLP(np.array([x1, x2]), w11, b1)

# OR 게이트
def OR(x1, x2):
  return MLP(np.array([x1, x2]), w12, b2)

# AND 게이트
def AND(x1, x2):
  return MLP(np.array([x1, x2]), w2, b3)

# XOR 게이트
def XOR(x1, x2):
  return AND(NAND(x1, x2), OR(x1, x2))

In [9]:
for x in [(0,0), (1,0), (0,1), (1,1)]:
  y = XOR(x[0], x[1])
  print("입력 값 : " + str(x) + "출력 값 : " + str(y))

입력 값 : (0, 0)출력 값 : 0
입력 값 : (1, 0)출력 값 : 1
입력 값 : (0, 1)출력 값 : 1
입력 값 : (1, 1)출력 값 : 0


In [10]:
import numpy as np
from tensorflow import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# ## 1. 데이터 준비 (XOR 진리표) ##
# 입력 데이터 (X)와 정답 레이블 (Y)를 정의합니다.
# XOR는 두 입력이 다를 때만 1을 출력하고, 같을 때는 0을 출력합니다.
# 입력 X: [0, 0], [0, 1], [1, 0], [1, 1]
# 정답 Y:    [0],    [1],    [1],    [0]
X = np.array([
    [0, 0],
    [0, 1],
    [1, 0],
    [1, 1]
], dtype=np.float32)

Y = np.array([
    [0],
    [1],
    [1],
    [0]
], dtype=np.float32)

# ## 2. Keras 모델 구축 (다층 퍼셉트론) ##
# Sequential 모델은 층을 순서대로 쌓아 올리는 가장 간단한 방법입니다.
model = Sequential()

# 첫 번째 층 (은닉층):
# - Dense: 일반적인 완전 연결(Fully Connected) 층을 의미합니다.
# - units=8: 은닉층의 뉴런(노드) 개수를 8개로 설정합니다. (임의의 값, 보통 2의 n승)
# - input_dim=2: 입력 데이터의 특성(피처) 개수가 2개임을 지정합니다. (XOR의 입력은 2개)
# - activation='relu': 활성화 함수로 'ReLU' (Rectified Linear Unit)를 사용합니다.
#                    ReLU는 비선형성을 추가하여 XOR 같은 복잡한 문제를 해결할 수 있게 합니다.
model.add(Dense(units=8, input_dim=2, activation='relu'))

# 두 번째 층 (출력층):
# - units=1: 출력층의 뉴런 개수를 1개로 설정합니다. (XOR의 출력은 0 또는 1)
# - activation='sigmoid': 활성화 함수로 'sigmoid'를 사용합니다.
#                       시그모이드는 출력을 0과 1 사이의 값으로 압축하여 이진 분류에 적합합니다.
model.add(Dense(units=1, activation='sigmoid'))

# ## 3. 모델 설정 (컴파일) ##
# 모델이 학습을 할 수 있도록 설정을 해줍니다.
# - optimizer='adam': 가중치를 어떻게 업데이트할지 결정하는 최적화 알고리즘입니다. (가장 흔하게 사용됨)
# - loss='binary_crossentropy': 이진 분류 문제에 사용되는 손실(오차) 함수입니다. (모델의 예측이 정답과 얼마나 다른지 측정)
# - metrics=['accuracy']: 학습하는 동안과 학습 후에 평가할 기준(성능 지표)입니다. 여기서는 정확도(accuracy)를 사용합니다.
model.compile(optimizer='adam', loss='binary_crossentropy', metrics=['accuracy'])

# ## 4. 모델 학습 (훈련) ##
# 모델에 데이터(X)를 넣어 정답(Y)을 맞히도록 훈련시킵니다.
# - epochs=10000: 전체 데이터셋을 몇 번 반복해서 학습시킬지 결정합니다. XOR는 간단하여 많이 반복해야 잘 학습됩니다.
# - verbose=0: 학습 진행 상황을 화면에 출력하지 않도록 설정합니다. (1로 설정하면 과정 출력)
print("모델 학습 시작...")
model.fit(X, Y, epochs=10000, verbose=0)
print("모델 학습 완료!")

# ## 5. 모델 평가 및 예측 ##
# 훈련된 모델이 실제로 XOR 문제를 해결하는지 확인합니다.

# 5.1. 모델 평가
# 모델의 성능을 최종적으로 평가합니다.
loss, accuracy = model.evaluate(X, Y, verbose=0)
print(f"\n모델 평가 결과 - 손실(Loss): {loss:.4f}, 정확도(Accuracy): {accuracy*100:.2f}%")

# 5.2. 예측
# 학습에 사용된 입력 X를 다시 넣어 모델의 예측값을 확인합니다.
predictions = model.predict(X)

print("\n--- 예측 결과 (Predicted Output) ---")
for i in range(len(X)):
    # 예측값을 0 또는 1로 명확히 하기 위해 0.5를 기준으로 반올림합니다.
    predicted_class = np.round(predictions[i])[0]

    # 출력 포맷: 입력 -> 예측값 (실제값) [정답 여부]
    # 예를 들어: [0.0, 0.0] -> 0.0 (0.0) [O]
    print(f"입력: {X[i]} -> 예측값: {predictions[i][0]:.4f} (클래스: {predicted_class}) [정답: {Y[i][0]}]")

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


모델 학습 시작...
모델 학습 완료!

모델 평가 결과 - 손실(Loss): 0.0005, 정확도(Accuracy): 100.00%
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 67ms/step

--- 예측 결과 (Predicted Output) ---
입력: [0. 0.] -> 예측값: 0.0017 (클래스: 0.0) [정답: 0.0]
입력: [0. 1.] -> 예측값: 0.9999 (클래스: 1.0) [정답: 1.0]
입력: [1. 0.] -> 예측값: 0.9999 (클래스: 1.0) [정답: 1.0]
입력: [1. 1.] -> 예측값: 0.0000 (클래스: 0.0) [정답: 0.0]
