# 설명
일반화 추정 방정식(GEE)은 <font color="blue">일반화선형모형(GLM)</font>을 패널, 군집 또는 반복 측정 데이터에 대해 추정한다. 이 모형은 하나의 __군집 내에선 상관되었을__ 가능성을 가정하지만, __군집 간에선 관련이 없음을__ 가정한다. 또한 이 모형은 GLM과 같은 <font color="red">일모수 지수족 분포</font>의 추정을 지원한다.

# 예제
간질 발작 데이터에 대한 포아송 회귀<br>
데이터 군집 간에 교환 가능한 상관관계를 가정한다.

In [4]:
import statsmodels.api as sm
import statsmodels.formula.api as smf

data = sm.datasets.get_rdataset("epil", package="MASS").data

fam = sm.families.Poisson()

ind = sm.cov_struct.Exchangeable()

mod = smf.gee("y ~ age + trt + base", "subject", data, cov_struct=ind, family=fam)
res = mod.fit()

res.summary()

0,1,2,3
Dep. Variable:,y,No. Observations:,236
Model:,GEE,No. clusters:,59
Method:,Generalized,Min. cluster size:,4
,Estimating Equations,Max. cluster size:,4
Family:,Poisson,Mean cluster size:,4.0
Dependence structure:,Exchangeable,Num. iterations:,2
Date:,"Sun, 12 May 2024",Scale:,1.000
Covariance type:,robust,Time:,12:17:23

0,1,2,3,4,5,6
,coef,std err,z,P>|z|,[0.025,0.975]
Intercept,0.5730,0.361,1.589,0.112,-0.134,1.280
trt[T.progabide],-0.1519,0.171,-0.888,0.375,-0.487,0.183
age,0.0223,0.011,1.960,0.050,2.11e-06,0.045
base,0.0226,0.001,18.451,0.000,0.020,0.025

0,1,2,3
Skew:,3.7823,Kurtosis:,28.6672
Centered skew:,2.7597,Centered kurtosis:,21.9865


# 모듈 설명

## 모델 클래스
|코드|설명|
|-------------|------------------|
|<font color="blue">GEE</font>(endog, exog, groups[,time, family...])|GEE를 활용한 회귀모형|
|<font color="blue">NominalGEE</font>(endog, exog, groups[,time, ...])|GEE를 활용한 명목형 반응변수에 대한 회귀모형|
|<font color="blue">OrdinalGEE</font>(endog, exog, groups[, time, ...])|GEE를 활용한 순서형 반응변수에 대한 회귀모형|
|<font color="blue">QIF</font>(endog, exog, gorups[, family, ...])|이차 추론 함수를 활용한 회귀모형 적합(소표본에서 유리)|

## 결과 클래스
|코드|설명|
|----|----|
|<font color = "blue">GEEResults</font>(model, params, cov_params, scale)|GEE를 활용한 회귀모형의 적합 결과를 요약하는 클래스|
|<font color="blue">GEEMargins</font>(results, args[,kwargs])|GEE로 적합된 회귀모형의 추정 한계 효과|
|<font color="blue">QIFResults</font>(model, params, cov_params, scale)|이차 추론 함수 회귀의 결과 클래스|

## 분포족
|코드|설명|
|---|---|
|<font color="blue">Family</font>(link, variance[, check_link])|일모수 지수족 분포의 부모 클래스|
|<font color="blue">Binomial</font>([link, check_link])|이항 지수족 분포|
|<font color="blue">Gamma</font>([link, chech_link])|감마 지수족 분포|
|<font color="blue">Gaussian</font>([link, check_link])|가우스 지수족 분포|
|<font color="blue">InverseGaussian</font>([link, check_linl])|역 가우스 지수족 분포|
|<font color="blue">NegativeBinomial</font>([link, alpha, chech_link])|음이항 지수족 분포|
|<font color="blue">Poisson</font>([link, check_link])|포아송 지수족 분포|
|<font color="blue">Tweedie</font>([link, var_power, eql, check_linl])|트위디 분포|

## 연결함수
연결함수들은 GLM의 것과 동일하다. 하지만 모든 연결함수가 모든 분포족에 적용 가능하지 않음에 주의해야 한다. 분포별 가능한 연결함수는 아래의 코드로 확인할 수 있다.

In [6]:
sm.families.family.Binomial.links

[statsmodels.genmod.families.links.Logit,
 statsmodels.genmod.families.links.Probit,
 statsmodels.genmod.families.links.Cauchy,
 statsmodels.genmod.families.links.Log,
 statsmodels.genmod.families.links.LogC,
 statsmodels.genmod.families.links.CLogLog,
 statsmodels.genmod.families.links.LogLog,
 statsmodels.genmod.families.links.Identity]

In [7]:
sm.families.family.Gamma.links

[statsmodels.genmod.families.links.Log,
 statsmodels.genmod.families.links.Identity,
 statsmodels.genmod.families.links.InversePower]

In [8]:
sm.families.family.Gaussian.links

[statsmodels.genmod.families.links.Log,
 statsmodels.genmod.families.links.Identity,
 statsmodels.genmod.families.links.InversePower]

In [9]:
sm.families.family.InverseGaussian.links

[statsmodels.genmod.families.links.InverseSquared,
 statsmodels.genmod.families.links.InversePower,
 statsmodels.genmod.families.links.Identity,
 statsmodels.genmod.families.links.Log]

In [10]:
sm.families.family.NegativeBinomial.links

[statsmodels.genmod.families.links.Log,
 statsmodels.genmod.families.links.CLogLog,
 statsmodels.genmod.families.links.Identity,
 statsmodels.genmod.families.links.NegativeBinomial,
 statsmodels.genmod.families.links.Power]

In [11]:
sm.families.family.Poisson.links

[statsmodels.genmod.families.links.Log,
 statsmodels.genmod.families.links.Identity,
 statsmodels.genmod.families.links.Sqrt]

In [12]:
sm.families.family.Tweedie.links

[statsmodels.genmod.families.links.Log,
 statsmodels.genmod.families.links.Power]