In [4]:
import numpy as np

def mean_shift(X, epsilon, max_iter=100):
    """
    Mean Shift 알고리즘 구현
    
    Parameters:
    - X: 입력 데이터 포인트 (numpy array, shape: (n, d))
    - epsilon: 커널 반경 (float)
    - max_iter: 최대 반복 횟수 (int)
    
    Returns:
    - V: 각 데이터 포인트에 해당하는 클러스터 중심 (numpy array, shape: (n, d))
    """
    n, d = X.shape  # 데이터 포인트 개수 n, 차원 d
    V = np.zeros((n, d))  # 클러스터 중심을 저장할 배열

    # 각 데이터 포인트에 대해 클러스터 중심 계산
    for i in range(n):
        y0 = X[i, :]  # 초기 중심 설정
        t = 0  # 반복 횟수 초기화

        # 수렴할 때까지 반복
        while True:
            # 현재 중심 y0에서 반경 epsilon 내의 포인트들을 이용해 평균 계산
            distances = np.linalg.norm(X - y0, axis=1)  # 모든 포인트와 y0 간의 거리
            points_in_radius = X[distances <= epsilon]  # 반경 내의 포인트들

            if len(points_in_radius) == 0:  # 반경 내에 포인트가 없으면 현재 위치를 중심으로 사용
                break

            # 평균 계산 (식 5-19)
            y_next = np.mean(points_in_radius, axis=0)

            # 수렴 조건: ||y_{t+1} - y_t|| <= epsilon (식 5-20)
            if np.linalg.norm(y_next - y0) <= epsilon:
                break

            y0 = y_next  # 중심 업데이트
            t += 1

            # 최대 반복 횟수 초과 시 종료
            if t >= max_iter:
                break

        V[i, :] = y0  # 수렴한 중심을 저장

    return V

# 테스트 코드
if __name__ == "__main__":
    # 예시 데이터 (2차원 데이터 포인트)
    np.random.seed(42)
    X = np.random.randn(10, 2)  # 10개의 2차원 데이터 포인트
    epsilon = 1.0  # 커널 반경

    print("입력 데이터 포인트:\n", X)

    # Mean Shift 알고리즘 실행
    cluster_centers = mean_shift(X, epsilon)

    print("\n클러스터 중심:\n", cluster_centers)

입력 데이터 포인트:
 [[ 0.49671415 -0.1382643 ]
 [ 0.64768854  1.52302986]
 [-0.23415337 -0.23413696]
 [ 1.57921282  0.76743473]
 [-0.46947439  0.54256004]
 [-0.46341769 -0.46572975]
 [ 0.24196227 -1.91328024]
 [-1.72491783 -0.56228753]
 [-1.01283112  0.31424733]
 [-0.90802408 -1.4123037 ]]

클러스터 중심:
 [[ 0.49671415 -0.1382643 ]
 [ 0.64768854  1.52302986]
 [-0.23415337 -0.23413696]
 [ 1.57921282  0.76743473]
 [-0.46947439  0.54256004]
 [-0.46341769 -0.46572975]
 [ 0.24196227 -1.91328024]
 [-1.72491783 -0.56228753]
 [-1.01283112  0.31424733]
 [-0.90802408 -1.4123037 ]]
