### 쿨백-라이블러 발산(Kullback-Leibler Divergence, KL 발산)과 교차 엔트로피(Cross-Entropy)

In [None]:
# 1. 교차 엔트로피 (Cross-Entropy)
# 교차 엔트로피는 두 확률 분포 𝑃와 𝑄 간의 차이를 측정하는 방법 중 하나
# 원래 분포 𝑃를 기반으로 하는 데이터의 엔트로피와 분포 𝑄를 사용하여 데이터의 엔트로피를 계산하는 것

In [None]:
# 2. KL 발산과의 관계
# KL 발산은 교차 엔트로피와 자기 엔트로피(Self-Entropy) 간의 차이로 정의
# 즉, 두 분포 간의 KL 발산은 𝑃와 𝑄간의 교차 엔트로피에서 𝑃의 자기 엔트로피를 뺀 값과 같다.

In [1]:
#  Entropy Function: entropy 함수는 단일 분포 
# 𝑃:P의 자기 엔트로피를 계산합니다.
# Cross-Entropy Function: cross_entropy 함수는 두 분포 
# p와 Q 간의 교차 엔트로피를 계산합니다.
# KL Divergence Function: kl_divergence 함수는 교차 엔트로피와 자기 엔트로피를 사용하여 KL 발산을 계산.
# Example Usage: 예시로 
# 𝑃=[0.2,0.5,0.3]와 𝑄=[0.1,0.6,0.3]에 대한 엔트로피, 교차 엔트로피, 그리고 KL 발산을 계산하고 출력

import numpy as np

def entropy(P):
    """
    Calculate the self-entropy of a distribution P.

    Parameters:
    P (np.array): True distribution.

    Returns:
    float: Entropy value.
    """
    P = np.asarray(P, dtype=np.float64)
    P = P / P.sum()  # Ensure P is a probability distribution

    epsilon = 1e-10
    P = np.clip(P, epsilon, 1)

    return -np.sum(P * np.log(P))

def cross_entropy(P, Q):
    """
    Calculate the cross-entropy between two distributions P and Q.

    Parameters:
    P (np.array): True distribution.
    Q (np.array): Approximate distribution.

    Returns:
    float: Cross-entropy value.
    """
    P = np.asarray(P, dtype=np.float64)
    Q = np.asarray(Q, dtype=np.float64)

    P = P / P.sum()  # Ensure P is a probability distribution
    Q = Q / Q.sum()  # Ensure Q is a probability distribution

    epsilon = 1e-10
    P = np.clip(P, epsilon, 1)
    Q = np.clip(Q, epsilon, 1)

    return -np.sum(P * np.log(Q))

def kl_divergence(P, Q):
    """
    Calculate the Kullback-Leibler divergence between two distributions P and Q.

    Parameters:
    P (np.array): True distribution.
    Q (np.array): Approximate distribution.

    Returns:
    float: KL divergence value.
    """
    return cross_entropy(P, Q) - entropy(P)

# Example usage
P = np.array([0.2, 0.5, 0.3])
Q = np.array([0.1, 0.6, 0.3])

entropy_value = entropy(P)
cross_entropy_value = cross_entropy(P, Q)
kl_divergence_value = kl_divergence(P, Q)

print(f"Entropy: {entropy_value:.4f}")
print(f"Cross-Entropy: {cross_entropy_value:.4f}")
print(f"KL Divergence: {kl_divergence_value:.4f}")


Entropy: 1.0297
Cross-Entropy: 1.0771
KL Divergence: 0.0475


In [None]:
# 교차 엔트로피는 실제 분포 𝑃와 근사 분포 𝑄간의 엔트로피를 측정하며, 두 분포 간의 차이를 나타낸다.
# KL 발산은 두 분포 간의 차이를 정량화하는 비대칭적 지표로, 교차 엔트로피와 자기 엔트로피의 차이로 정의됩니다.
# 