In [1]:
import numpy as np

def perceptron(x1, x2, weights, bias):
    x = np.array([x1, x2]) # 입력값 x1, x2를 하나의 벡터로 묶음
    w = np.array(weights)  # 가중치 리스트를 벡터로 변환

    # 퍼셉트론 계산식 : (입력벡터 x 가중치벡터 내적) + 편향
    return int(np.dot(x, w) + bias > 0)
    # return 1 if (w1*x1 + w2*x2 + b) > 0 else 0

# AND Gate : 두 입력이 모두 1일 때만 1이 되도록 가중치와 편향 설정
print("AND:", perceptron(1, 1, [0.5, 0.5], -0.7))

# NAND Gate : AND 결과를 반대로 만들기 위해 가중치를 음수로 설정
print("NAND:", perceptron(1, 1, [-0.5, -0.5], 0.7))

# OR Gate : 하나라도 1이면 기준값을 넘도록 편향을 작게 설정
print("OR:", perceptron(1, 0, [0.5, 0.5], -0.2))

AND: 1
NAND: 0
OR: 1


펴셉트론은 가중합 + 편향이 기준(0)을 넘는지로 0/1을 결정 

In [2]:
def weighted_sum(inputs, weights, bias):
    # 입력 벡터와 가중치 벡터의 내적 + 편향
    return np.dot(inputs, weights) + bias

inputs = [1, 0]  # 입력값
weights = [0.8, -0.5]  # 각 입력에 대한 중요도
bias = 0.2  # 판단 기준을 조정하는 편향
output = weighted_sum(inputs, weights, bias)
print("Weighted Sum:", output)

Weighted Sum: 1.0


In [4]:
from sklearn.neural_network import MLPClassifier

# XOR 문제 해결
X = [[0, 0], [0, 1], [1, 0], [1, 1]]  # 입력값 shape (4, 2)
y = [0, 1, 1, 0]  # 출력값

# 다층 퍼셉트론 모델
mlp = MLPClassifier(
    hidden_layer_sizes=(2,), # 은닉층 구조: 은닉층 1개, 뉴런 2개
    activation='relu',       # 은닉층 활성화 함수 (relu : 비선형성 부여)
    max_iter=1000            # 최대 학습 반복 횟수
)
mlp.fit(X, y)

print("Prediction:", mlp.predict(X))

ModuleNotFoundError: No module named 'sklearn'

hidden_layer_sizes=(2,), # 은닉층 구조 : 은닉층 1개, 뉴런 2개   
hidden_layer_sizes=(4,), # 은닉층 1개, 뉴런 4개   
hidden_layer_sizes=(3, 2), # 은닉층 2개 (첫 층 3개, 두번째 층 2개)

### 은닉층의 activation (활성화함수)      
- 주요 사용하는 함수
    - relu 계열   
    - relu : 가장 많이 사용 (음수에서 기울기가 죽음),   
    - Leaky Relu : relu에서 발생하는 죽은 기울기 문제를 해결 (음수 영역에서도 사용가능)   
    - ELU, GELU : 딥러닝 Transformer에서 자주 사용한다.   

------------------------------------------------------------

### tanh : -1~1 범위. 비선형 문제에 적합   
- 출력 범위가 -1 ~ 1인 것이 의미가 있을 때 사용한다.   
- 입력 / 출력이 0을 중심으로 대칭을 이룰 떄
- 내부 표현에서 부호 정보가 중요할 때
- RNN 계열 (통적인 RNN, LSTM)

logistic : 시그모이드 함수 (초기 신경망에서 사용)   

------------------------------------------------------------
### 출력층의 activation (활성화함수)   
- 이진분류 : sigmoid(출력 범위 0 ~ 1. 결과를 확률로 해석 가능)   
- 다중분류 : softmax(출력 범위 0 ~ 1. 각 클래스에 대한 확률 분포. 모든 출력값의 합 = 1)  
- 회귀 : 예측값 그대로 사용 

In [1]:
import numpy as np
# 행렬의 내적
A = np.array([[1, 2], [3, 4]])
B = np.array([[5, 6], [7, 8]])

# 행렬의 내적 계산
C = np.dot(A, B)
print(C)
print("=============================")
# 또는
C = A @ B
print(C)

[[19 22]
 [43 50]]
[[19 22]
 [43 50]]


In [2]:
X = np.array([1.0, 2.0, 3.0])
W = np.array([[0.1, 0.2, 0.3], [0.4, 0.5, 0.6]])

# 신경망의 내적 계산
Y = np.dot(W, X)
print(Y)

[1.4 3.2]
