In [18]:
import numpy as np

def softmax(x):
    e_x = np.exp(x - np.max(x, axis=-1, keepdims=True))
    return e_x / np.sum(e_x, axis=-1, keepdims=True)

def cross_entropy_loss(y_true, y_pred, epsilon=1e-10):
    y_pred = np.clip(y_pred, epsilon, 1. - epsilon)
    loss = -np.sum(y_true * np.log(y_pred), axis=-1)
    return np.mean(loss)

# 임의의 값을 입력하여 Softmax 및 Cross-Entropy 계산
print("--- Softmax 및 Cross-Entropy 테스트 시작 ---")

N_CLASSES = 10 # 5개의 서로 다른 레이블

# 임의의 로짓 값 생성-
random_logits_single_sample = np.random.randn(N_CLASSES) * 2 # N_CLASSES 개만큼 임의의 숫자 생성, 스케일 조절
print(f"\n[A] 단일 샘플 - 임의의 로짓 값 (N={N_CLASSES}개):")
print(random_logits_single_sample)

# Softmax 함수
predicted_probabilities_single_sample = softmax(random_logits_single_sample)
print(f"\n[B] Softmax 적용 후 예측 확률:")
print(predicted_probabilities_single_sample)
print(f"  -> 확률 총합: {np.sum(predicted_probabilities_single_sample):.6f}")

# 임의의 실제 레이블 생성
random_true_label_index = np.random.randint(0, N_CLASSES) # 0부터 N_CLASSES-1 중 임의의 인덱스 선택
true_label_one_hot_single_sample = np.zeros(N_CLASSES)
true_label_one_hot_single_sample[random_true_label_index] = 1

print(f"\n[C] 임의의 실제 레이블 (원-핫 인코딩, 정답 인덱스: {random_true_label_index}):")
print(true_label_one_hot_single_sample)

# Cross-Entropy Loss 계산
# 예측 확률과 실제 레이블을 비교하여 손실 값을 계산.
loss_single_sample = cross_entropy_loss(true_label_one_hot_single_sample,
                                        predicted_probabilities_single_sample)
print(f"\n[D] Cross-Entropy Loss (단일 샘플): {loss_single_sample:.4f}")

BATCH_SIZE = 3 # 3개의 샘플 

# 임의의 로짓 값 생성
# (BATCH_SIZE, N_CLASSES) 2차원 배열 생성
random_logits_batch = np.random.randn(BATCH_SIZE, N_CLASSES) * 2
print(f"\n\n[E] 배치 샘플 - 임의의 로짓 값 (배치 크기={BATCH_SIZE}, N={N_CLASSES}개):")
print(random_logits_batch)

# Softmax 함수
predicted_probabilities_batch = softmax(random_logits_batch)
print(f"\n[F] Softmax 적용 후 배치 예측 확률:")
print(predicted_probabilities_batch)

print(f"  -> 각 샘플별 확률 총합:")
for s in np.sum(predicted_probabilities_batch, axis=-1):
    print(f"     {s:.6f}")

# 임의의 실제 레이블 생성
true_label_one_hot_batch = np.zeros((BATCH_SIZE, N_CLASSES))
for i in range(BATCH_SIZE):
    random_true_label_index_batch = np.random.randint(0, N_CLASSES)
    true_label_one_hot_batch[i, random_true_label_index_batch] = 1

print(f"\n[G] 임의의 실제 레이블 (배치, 원-핫 인코딩):")
print(true_label_one_hot_batch)

# Cross-Entropy Loss 계산
# 배치 전체에 대한 평균 손실 값을 반환
loss_batch = cross_entropy_loss(true_label_one_hot_batch,
                                predicted_probabilities_batch)
print(f"\n[H] Cross-Entropy Loss (배치 평균): {loss_batch:.4f}")

print("\n--- Softmax 및 Cross-Entropy 테스트 종료 ---")

--- Softmax 및 Cross-Entropy 테스트 시작 ---

[A] 단일 샘플 - 임의의 로짓 값 (N=10개):
[-2.26826365 -1.31458828 -0.94452616  0.36868699 -3.54080815 -1.07896917
  0.50863966 -2.74328722  0.57502042  0.71216002]

[B] Softmax 적용 후 예측 확률:
[0.0127474  0.03308244 0.04789757 0.17808803 0.00357078 0.04187219
 0.2048403  0.00792723 0.21889922 0.25107483]
  -> 확률 총합: 1.000000

[C] 임의의 실제 레이블 (원-핫 인코딩, 정답 인덱스: 5):
[0. 0. 0. 0. 0. 1. 0. 0. 0. 0.]

[D] Cross-Entropy Loss (단일 샘플): 3.1731


[E] 배치 샘플 - 임의의 로짓 값 (배치 크기=3, N=10개):
[[ 0.95792839 -1.31409677 -0.04024454  1.80978701 -2.41117589  3.12260054
  -0.88754015 -0.51732438 -1.32175446  3.03246013]
 [-0.29307763 -1.03498871 -0.45127952 -1.89080292 -2.610542    0.33407947
   1.66096753 -0.76285332 -2.07362181  2.79620595]
 [-2.26587027 -5.67007325  1.81360715  1.57158608  2.33259709 -1.21994164
   0.65464761 -0.79344399  0.12301685  0.48866863]]

[F] Softmax 적용 후 배치 예측 확률:
[[4.75926967e-02 4.90695781e-03 1.75403929e-02 1.11557253e-01
  1.63816225e-03 4.14615451e-01