In [None]:
import numpy as np
import matplotlib.pyplot as plt
from sklearn.cluster import KMeans
from scipy.spatial.distance import cdist

# Euclidean 거리 계산 함수
def euclidean_distance(color1, color2):
    return np.sqrt(np.sum((color1 - color2) ** 2))

# 변형된 하우스도르프 거리 (MHD) 계산 함수
def modified_hausdorff_distance(cluster1, cluster2):
    distances = cdist(cluster1, cluster2, 'euclidean')
    mhd = np.mean(np.min(distances, axis=1))
    return mhd

# 가중치 기반 클러스터 중심 계산 함수
def weighted_centroid(cluster, weights):
    weighted_sum = np.sum(cluster * weights[:, np.newaxis], axis=0)
    centroid = weighted_sum / np.sum(weights)
    return centroid

# 군집 기반 하우스도르프 거리 (CHD) 계산 함수 - 가중치 필수
def cluster_based_hausdorff_distance(palette1, palette2, weights1, weights2, k=2):
    # 팔레트 1 클러스터링 및 가중치 기반 중심 계산
    kmeans1 = KMeans(n_clusters=k, random_state=0).fit(palette1)
    clusters1 = [palette1[kmeans1.labels_ == i] for i in range(k)]
    weights1_split = [weights1[kmeans1.labels_ == i] for i in range(k)]
    centroids1 = [weighted_centroid(cluster, weights) for cluster, weights in zip(clusters1, weights1_split)]

    # 팔레트 2 클러스터링 및 가중치 기반 중심 계산
    kmeans2 = KMeans(n_clusters=k, random_state=0).fit(palette2)
    clusters2 = [palette2[kmeans2.labels_ == i] for i in range(k)]
    weights2_split = [weights2[kmeans2.labels_ == i] for i in range(k)]
    centroids2 = [weighted_centroid(cluster, weights) for cluster, weights in zip(clusters2, weights2_split)]
    
    # 각 클러스터 중심 간의 MHD 계산
    mhd_values = []
    for centroid1 in centroids1:
        mhd_cluster = []
        for centroid2 in centroids2:
            mhd = euclidean_distance(centroid1, centroid2)
            mhd_cluster.append(mhd)
        mhd_values.append(np.min(mhd_cluster))
    
    # CHD는 mhd_values 중 가장 큰 값
    chd = max(mhd_values)
    return chd

# 색상 팔레트를 가중치 기반으로 시각화하는 함수
def visualize_palette(palette, weights, title="Color Palette"):
    total_weight = np.sum(weights)
    
    fig, ax = plt.subplots(1, 1, figsize=(6, 2))
    current_x = 0
    
    for i, color in enumerate(palette):
        width = weights[i] / total_weight  # 가중치에 비례한 너비
        ax.add_patch(plt.Rectangle((current_x, 0), width, 1, color=color / 255.0))
        current_x += width
    
    ax.set_xlim(0, 1)
    ax.set_ylim(0, 1)
    ax.axis('off')
    ax.set_title(title)
    plt.show()

# 예제 팔레트 데이터와 가중치
palette1 = np.array([
    [206, 183, 157], [112, 92, 77], [155, 50, 20], [172, 132, 101], [66, 44, 28]
])
weights1 = np.array([1, 3, 2, 5, 2])  # Palette 1의 가중치

palette2 = np.array([
    [111, 106, 88], [67, 59, 47], [157, 146, 128], [242, 239, 234], [81, 72, 58]
])
weights2 = np.array([4, 2, 1, 5, 3])  # Palette 2의 가중치

# 가중치를 반영한 CHD 값 계산
chd_value_with_weights = cluster_based_hausdorff_distance(palette1, palette2, weights1=weights1, weights2=weights2)
print(f"가중치를 반영한 CHD(Palette1, Palette2) = {chd_value_with_weights}")

# 팔레트 시각화
visualize_palette(palette1, weights1, title="Palette 1 (With Weights)")
visualize_palette(palette2, weights2, title="Palette 2 (With Weights)")
