### [Kendall Tau Coefficient]
- 데이터와 데이터의 순서/순위 일치 검사
- Spearman보다 더 정확하고 신뢰성 높음

In [5]:
# ================================================
# 모듈 로딩
# ================================================
import numpy as np
from scipy.stats import kendalltau


In [6]:
# ================================================
# 예시 데이터
# ================================================
# 예: 5명 학생에 대해
# X = 수학 성적 순위
# Y = 프로그래밍 과제 평가 순위 (또는 다른 교사 평가 순위)
x = np.array([1, 2, 3, 4, 5])   # 교사 A가 준 순위 (1등 ~ 5등)
y = np.array([2, 1, 3, 5, 4])   # 교사 B가 준 순위

In [9]:
# 계산 : +1 : 순위 완전 일치, 0: 순위 무작위.       -1 : 순위 반대로
tau, _ = kendalltau(x, y)

print("Kendall's tau : ", tau)

Kendall's tau :  0.6


In [11]:
# python 내장 모듈 : 반복자틀
from itertools import combinations
# ------------------------------------------
# 함수이름 : kendall_tau_manual
# 매개변수 : x, y 2개 데이터
# 결과반환 : 2개 데이터의 순위 일치정도
# ------------------------------------------
def kendall_tau_manual(x, y):
    x = np.asarray(x)
    y = np.asarray(y)
    n = len(x)

    # 모든 쌍(i, j), i < j 조합
    C = 0 # 일치하는 쌍(concordant)
    D = 0 # 불일치 쌍(discordant)

    for i, j in combinations(range(n), 2):
        print(f'i = {i}, j = {j}')
        # x, y의 순서 비교
        s1 = np.sign(x[i] - x[j])
        s2 = np.sign(y[i] - y[j])
        v = s1 * s2

        if v > 0: C += 1    # 같은 방향 -> 일치
        elif v < 0: D += 1  # 반대 방향 -> 불일치

        # v == 0이면 동점(tie) -> 여기서는 무시(단순 버전)

    tau = (C - D) / (0.5 * n * (n - 1))
    return tau, C, D

# 예시 데이터 (위와 동일)

In [12]:
# -------------------------------------------
tau_manual, C, D = kendall_tau_manual(x, y)

print("Concordant pairs (C) :", C)
print("Discordant pairs (D) :", D)
print("Kendall's tau (manual) : ", tau_manual)

i = 0, j = 1
i = 0, j = 2
i = 0, j = 3
i = 0, j = 4
i = 1, j = 2
i = 1, j = 3
i = 1, j = 4
i = 2, j = 3
i = 2, j = 4
i = 3, j = 4
Concordant pairs (C) : 8
Discordant pairs (D) : 2
Kendall's tau (manual) :  0.6
