### Fisher의 Z 변환 (Fisher's Z transformation)

In [None]:
# Fisher의 Z 변환을 사용하여 상관계수의 통계적 유의성을 검정 
# 변수 간의 상관계수(r)를 계산하고
# Fisher의 Z 변환을 사용하여 이 상관계수가 통계적으로 유의미한지 검정

In [1]:
import numpy as np
from scipy.stats import norm


In [None]:
# 두 변수 x와 y 사이의 상관계수를 계산하고, 
# 이를 Fisher의 Z 변환을 통해 정규 분포에 가깝게 변환
# 변환된 값에 대한 표준 오차를 계산하고, 
# 이를 사용하여 Z 점수와 p-값을 계산. 
# p-값이 통계적 유의수준(예: 0.05)보다 작으면, 두 변수 간의 상관관계가 통계적으로 유의미하다고 해석할 수 있다.

In [None]:
# 데이터 생성 및 상관계수 계산

In [5]:
# 가상의 데이터 생성
np.random.seed(0)
x = np.random.normal(size=100)
y = 2*x + np.random.normal(size=100)

# 상관계수 계산
r = np.corrcoef(x, y)[0, 1]


In [6]:
r

0.9006752160894267

In [None]:
# Fisher의 Z 변환 및 통계적 유의성 검정

In [3]:
# Fisher의 Z 변환
Z = np.arctanh(r)

# 표준 오차 계산
n = len(x)  # 표본 크기
SE = 1 / np.sqrt(n - 3)

# Z 점수 계산
Z_score = Z / SE

# p-값 계산
p_value = 2 * (1 - norm.cdf(np.abs(Z_score)))

print(f"상관계수: {r}")
print(f"Fisher의 Z 변환값: {Z}")
print(f"Z 점수: {Z_score}")
print(f"p-값: {p_value}")


상관계수: 0.9006752160894267
Fisher의 Z 변환값: 1.4757846763967128
Z 점수: 14.534793423900902
p-값: 0.0


In [None]:
# p-값이 0.0으로 유의수준(0.05)보다 작아, 두 변수 간의 상관관계가 통계적으로 유의미하다고 해석