In [1]:
import numpy as np

# 🔢 1. 입력 벡터 만들기 (3개의 단어를 4차원 벡터로 표현했다고 가정)
Q = np.array([[1, 0, 1, 0]])         # Query: 집중하려는 대상 (1x4)
K = np.array([
    [1, 0, 1, 0],                   # 단어 A
    [0, 1, 0, 1],                   # 단어 B
    [1, 1, 1, 1]                    # 단어 C
])                                  # Key: 전체 입력들 (3x4)
V = np.array([
    [1, 0],                         # Value for A
    [10, 0],                        # Value for B
    [5, 5]                          # Value for C
])                                  # Value: 각 입력의 정보 (3x2)

# 🔍 2. 유사도 점수 계산 (QK^T)
scores = np.dot(Q, K.T)  # (1x4) · (4x3) = (1x3)

# ⚖️ 3. 스케일링 (루트 d_k)
dk = Q.shape[1]  # d_k = 4
scaled_scores = scores / np.sqrt(dk)

# 🔥 4. 소프트맥스
def softmax(x):
    e_x = np.exp(x - np.max(x))  # 안정적인 softmax
    return e_x / e_x.sum(axis=-1, keepdims=True)

attention_weights = softmax(scaled_scores)

# 🎯 5. 가중합 (attention 결과)
output = np.dot(attention_weights, V)  # (1x3) · (3x2) = (1x2)

print("Attention Weights:", attention_weights)
print("Output:", output)


Attention Weights: [[0.4223188 0.1553624 0.4223188]]
Output: [[4.08753682 2.11159399]]
