# "생존 분석(survival or time-to-event outcomes)에서 경향 점수 방법 사용: 무작위 실험과 유사한 효과 측정 보고"

`-` 이 글에서는 두 가지 다른 경향성 점수 방법(매칭, IPTW)이 무작위 대조 임상시험에서 자주 보고되는 효과 측정치를 추정하는 데 사용될 수 있다고 설명합니다
- 효과 측정치
> (i) 주변 생존 곡선 : 모든 대상에게 치료가 적용되었을 때 또는 모든 대상에게 치료가 적용되지 않았을 때 인구 내에서의 생존을 설명  
> (ii) 주변 위험 비율

*경향성 점수 방법을 사용하면 시간-사건 결과가 있는 무작위 대조 임상시험에서 보고되는 효과 측정치를 재현할 수 있습니다: 사건 발생 확률의 절대 및 상대적 감소 모두를 결정할 수 있습니다*

### 1. Introduction

The Consolidated Standards of Reporting Trials (CONSORT)은 임상시험 보고에 대한 권장 사항을 제공합니다.[[1]](https://doi.org/10.1136/bmj.c332)  
`-` 임상시험에서 생존에 대해 치료 효과의 철저한 분석은 치료 효과의 상대적 및 절대적 측정치를 추정.

##### 1. 무작위 배정인 경우
> 절대적 추정치 : Kaplan-Meier Curve  
> 상대적 추정치 : Cox proportional hazards model

##### 2. 관측 연구
- 치료를 받은 그룹과 치료를 받지 않은 그룹 간에 기준선 특성의 분포에 시스템적인 존재 (bias from Counfounding)
- 이러한 이유로 결과를 직접적으로 치료 그룹 간에 비교할 수 없습니다.
- 따라서 관측 연구의 설계는 무작위 실험의 모습을 모방.

`-` 경향성 점수 방법 (Propensity score methods (PSM))
- 치료 그룹(exposure) 간에 측정된 기준선 특성의 분포 차이로 인해 발생할 수 있는 혼동 효과를 감소시킬 수 있습니다.
- 무작위 배정과 유사하게, 측정된 기준선 공변량의 유사한 분포를 가진 치료된 그룹과 비치료된 그룹 간의 결과를 비교함으로써 혼동 효과를 제거합니다

마치 CONSORT 문장이 RCT(임의 대조 실험)의 보고를 개선한 것처럼
[[11]](https://jamanetwork.com/journals/jama/fullarticle/193739), 우리의 목표는 관측 데이터를 사용하여 치료가 시간-사건 결과에 미치는 효과를 추정하는데 경향성 점수 방법을 사용하는 연구의 진행과 보고를 개선하는 방법을 설명하는 것이었습니다. 특히 절대적 및 상대적 치료 효과를 모두 추정하는 방법에 대해 설명하고 있습니다.

### 2. Background
> 잠재 결과 프레임워크(potential outcomes framework)  
> 평균 치료 효과(average treatment effects, ATEs)  
> 주변(marginal) vs 조건부(conditional) 치료 효과  

##### 2.1. The potential outcomes framework
- 두가지 치료 옵션이 있는 상황에서 각 개체가 두 개의 잠재결과를 가진다고 가정 Yi(0) 및 Yi(1).
- Yi(1) 은 outcome 발생, Yi(0)은 발생 X
- 그러나 각 개체는 오직 두 가지 중 하나의 Yi만 선택 가능.
- 생존 분석에서 잠재 결과는 치료 하에서 생존 또는 사건 발생 시간

##### 2.2. Average treatment effects (ATE)

- 각 개체에 대해 치료의 효과는 Yi(1)-Yi(0)로 정의.
- E[Yi(1)-Yi(0)]로, 치료되지 않은 상태에서 치료된 상태로 전체 모집단을 이동시킬 때의 평균 효과를 나타냅니다 [[13]](https://scholar.harvard.edu/imbens/publications/nonparametric-estimation-average-treatment-effects-under-exogeneity-review).
- 관련된 효과 측정값으로는 치료 대상자에 대한 평균 치료 효과 (ATT), E[Yi(1)-Yi(0) | 𝑍 = 1], 즉 궁극적으로 해당 치료를 받은 대상들에 대한 치료의 평균 효과.
- 무작위 배정 하에 따르면 ATE는 E[Yi(1)] - E[Yi(0)] [[14]](https://doi.org/10.1002/sim.1903)
- 따라서 E[Yi(1)-Yi(0)] = E[Yi(1)] - E[Yi(0)] 이므로, 무작위 대조 임상시험(RCT)에서 unadjusted analysis은 모집단 수준에서 평균 치료 효과를 편향되지 않게 추정할 수 있습니다.
- 관측 연구에서는 ATT와 ATE가 항상 일치하는 것은 아님.

- 전통적인 생존 분석에서, 주어진 대상에 대한 치료의 효과는 두 가지 잠재적 결과 간의 차이입니다. 따라서 평균 치료 효과는 치료로 인한 생존 시간의 평균 차이임. Yi(1)-Yi(0)

`-` 그러나 의학 연구자들은 종종 결과 발생의 위험에 대한 치료의 상대적 효과와 추적 기간 내 결과 발생 확률의 절대적 차이에 더 관심이 있습니다. 이러한 선호도를 반영하기 위해 현재 연구에서 ATE와 ATT의 정의를 수정합니다

- 두 가지 잠재적으로 관측 가능한 생존 곡선을 개념화할 수 있습니다. 각 곡선은 잠재적 결과의 함수로, 첫 번째 모집단에서는 모든 대상이 치료를 받지 않았지만, 두 번째 모집단에서는 모든 대상이 치료를 받은 것을 나타냅니다. 이러한 잠재적으로 관측 가능한 생존 곡선을 비교하고 치료의 생존에 미치는 효과를 양적으로 평가하기 위해 두 가지 다른 지표를 사용할 수 있습니다.
> 첫째, 잠재적으로 관측 가능한 두 개의 생존 곡선 간 결과 발생의 확률적 절대 차이를 추정  
> 둘째, 두 가지 잠재 결과를 통합하여 결과 발생의 위험을 치료 상태를 나타내는 지표 변수에 회귀

- 우리는 용어를 약간 수정하여 이러한 측정치를 ATE의 측정치로 참조합니다. 그런 다음 위의 분석을 최종적으로 치료받은 대상의 잠재 결과 집합으로 제한할 수 있습니다. 우리는 이러한 결과 측정치를 ATT의 측정치로 참조합니다
- 평균 치료 효과의 개념은 중요합니다. 왜냐하면 일부 경향성 점수 방법은 ATE를 추정할 수 있도록 하고, 다른 방법은 ATT를 추정할 수 있도록 합니다. 

##### 2.3. Marginal versus conditional treatment effects and collapsibility
`-` 조건부 치료 효과
- 개별 수준에서 치료 상태를 미치료에서 치료된 상태로 변경하는 것의 평균 효과
- 개별 수준에서의 평균 효과의 추정치는 종종 표본 내의 모든 대상에 대해 효과를 '스무딩' 되어짐
- 치료 상태를 나타내는 지표 변수 및 기준선 공변량 집합에 의해 결과변수가 회귀되는 회귀 모델을 사용하여 수행됨.
- 이러한 모델이 적합되면 치료 상태 지표 변수에 대한 회귀 계수는 (적절한 변환 후에) 조건부 치료 효과를 나타냄.
- 예를 들어, 조정된 Cox 비례 위험 회귀 모델에서 유도된 회귀 계수를 지수화한 후에는 조건부 위험 비율을 나타냅니다: 치료로 인한 시간-사건 결과의 위험 변화 비율
- 따라서 회귀 모델에서 유도된 치료 효과의 추정치는 조건부 효과입니다: 개별 수준에서의 평균 효과, 즉 대상의 상태가 미치료에서 치료된 상태로 변경될 경우의 효과를 의미합니다.

`-` 주변부 치료 효과
- 인구 수준에서의 효과
- 치료 여부를 제외한 모든 기준선 공변량이 동일한 두개의 모집단 간의 결과 변수 차이 효과
- 이 정의에서 보듯이, 무작위 대조 실험은 주변 치료 효과를 추정하고 있습니다.

- 특정 모집단에서는 회귀 모델에 포함된 각 공변량 집합마다 여러 조건부 효과가 있습니다.  
- 이와 대조적으로 특정 모집단에서는 하나의 주변 효과만 있습니다. 그러나 서로 다른 모집단을 고려할 때 각각의 모집단마다 자체적인 주변 효과가 있을 수 있습니다.  
- 여러 조건부 효과가 있지만, 우리는 실제 결과 회귀 모델에서 유도된 효과(주변효과)가 주요 관심 대상임을 주장할 수 있습니다

### Collapsible
- 치료 효과의 측정치는 혼동이 없는 경우 조건부 및 주변 효과 측정치가 일치할 경우 collapsible 이라고 함 [[15]](https://doi.org/10.1093/oxfordjournals.aje.a114593)
- 평균 차이와 위험 차이는 축소 가능하지만, 오즈와 위험 비율은 축소 가능하지 않습니다 [[16]](https://doi.org/10.1093/oxfordjournals.aje.a113225)[[17]](https://doi.org/10.1093/biomet/71.3.431).
- 따라서 일반적으로 RCT(임의 대조 실험)에서 평균 차이의 crude 값은 조정된 평균 차이와 일치할 것입니다. 그러나 이는 오즈 비나 위험 비율에는 적용되지 않습니다.
- 이항 결과 및 로지스틱 회귀 모델의 경우, 조정된 오즈 비는 주변 오즈 비보다 체계적으로 영향을 받아 널뛰는 것을 보여주었습니다[[18]](https://doi.org/10.2307/1403572)
- 치료 효과의 주변 및 조건부 추정치 개념을 이해하는 것은 중요합니다. 왜냐하면 경향성 점수 방법은 주변 효과를 추정하는 반면, 전통적인 회귀 조정은 조건부 효과를 추정합니다.
- 어떤 효과 측정치가 축소 가능한지 알면 회귀 조정 및 경향성 점수 방법이 치료 효과의 추정치가 같게 나올 것으로 기대되는 상황을 이해하는 데 도움이 됩니다.

### 3. Propensity score methods and survival outcomes
- 경향 점수(Propensity score)는 관측된 기준 (baseline) 공변량 (X) : ei = Pr(Zi =1 | Xi)에 조건을 둔 상태에서 치료 (exposure) (Z = 1 vs. Z = 0)를 받을 확률
- 균형 점수에 대한 조건부로, 측정된 기저 공변량의 분포는 치료를 받은 집단과 치료를 받지 않은 집단 간에 동일할 것으로 기대.
- 랜덤화 임상시험(RCT)과 유사하게, 편향 점수 방법을 통해 조건부가 아닌 주변적인 치료 효과를 추정할 수 있습니다[[22]](https://doi.org/10.1177/0962280216658920). 이는 매칭, 계층화, 가중치 적용에서 명확히 확인할 수 있습니다: 동일한 관측된 기저 공변량 분포를 가진 치료 및 비치료 대상자 집단 간의 평균 결과를 비교하고 있는 것입니다.

`-` 3.1. Propensity score matching (PSM)
- 경향 점수 값을 공유하는 치료 및 비치료 대상자의 매칭된 집합을 형성하는 것을 의미.
- 매칭된 샘플이 형성되면, 매칭된 샘플 내에서 치료 및 비치료 대상자 간의 결과를 직접 비교함으로써 치료 효과를 추정할 수 있습니다.
- 일반적인 경향 점수 매칭은 ATT(치료 효과 평균)를 추정하는 데 도움이 됩니다(쌍 (paired) 매칭은 ATT(처치의 평균 효과)를 추정). 이는 치료 대상 집단과의 유일한 체계적 차이점이 치료의 부재인 치료되지 않은 대상자의 샘플을 구성했기 때문에 알 수 있습니다. 따라서, 치료된 샘플과 기저선에서 치료된 대상과 동일해 보이는 치료되지 않은 대상자의 샘플 간의 결과를 비교할 수 있습니다. 치료된 대상(exposure)과 유사한 특성을 가진 대상의 샘플에서 치료 효과에 초점을 맞추면, ATT를 추정하는 것입니다
- 근데 ATT는 치료받은 대상자들이 모집단이라는데??

- 시간-사건 형태의 결과가 있는 경우, 치료된 대상과 치료되지 않은 대상에 대한 Kaplan-Meier 생존 곡선을 경향 점수 매칭된 샘플에서 추정할 수 있습니다. 추정된 생존 곡선을 통해 매칭된 샘플 내에서 치료 그룹 간의 생존을 직접 비교할 수 있습니다. 이전에 제시한 주장을 기반으로 하면, 매칭된 치료 대상 샘플과 매칭된 치료되지 않은 대상 샘플을 두 개의 독립된 샘플로 다루는 것은 부적절하다고 생각합니다. 따라서, 경향 점수 매칭된 샘플에서 생존 곡선의 동일성을 검정하기 위해 로그-랭크 테스트가 자주 사용되지만 [9, 10, 35], 이러한 접근 방식은 샘플이 서로 독립적이어야 한다는 가정 때문에 부적절합니다 [36, 37]. 대신, 매칭된 샘플에서 생존 곡선의 동일성을 비교하기 위해 계층화된 로그-랭크 테스트를 사용할 수 있습니다 [36]. 매칭에 대한 고려 없이 다른 통계적 검정에서의 매칭의 영향을 조사한 몬테카를로 시뮬레이션을 사용한 연구를 통해, 로그-랭크 테스트의 사용은 아마도 인위적으로 낮은 유형 I 오류율을 초래할 것으로 보입니다 [31,32]. 그러나 이는 후속 연구에서 확인이 필요합니다.

 - 치료 상태를 생존에 대해 단변량 (univariate)Cox 비례위험 모형을 사용하여 회귀하면 결과의 위험의 상대적 변화를 추정할 수 있습니다. 샘플의 매칭된 특성을 고려하기 위해, 매칭된 집단 내에서의 클러스터링을 고려하는 강건한 분산 추정기를 사용할 수 있습니다 [38]. 또 다른 방법은 매칭된 집단에 계층화하는 것입니다 [39]. 그러나 최근 연구에 따르면, 전자의 접근 방식은 주변 위험 비율의 편향되지 않은 추정을 가능케 하지만, 후자의 방식은 주변 위험 비율의 편향된 추정을 초래한다는 것이 입증되었습니다 [30]. 전자의 접근 방식은 클러스터링을 고려하지 않는 일반적인 Cox 비례위험 모형에서 얻은 결과와 동등한 추정된 위험 비율을 제공하며, 이는 진정한 주변 모형입니다. 반면, 후자의 접근 방식은 매칭된 쌍을 조건으로 하는 것이기 때문에 조건적인 효과 추정으로 보입니다.

`-` 3.2. Inverse probability of treatment weighting using the propensity score

`-` 3.3. Other propensity score approaches

`-` 3.4. Comparison of different propensity score methods
- 다양한 경향 점수 방법에 대한 간단한 비교를 제공하겠습니다. 여기서는 생존 결과의 치료 효과를 추정하는 데 국한하지 않겠습니다. 후반의 두 가지 방법은 경향 점수의 추정값을 직접적으로 사용하므로 추정된 경향 점수의 오용 또는 불안정성이 더 큰 영향을 미칠 수 있다는 제안이 있었습니다 [47]. 그에 반해, 전자의 두 방법은 경향 점수를 stratify하거나 match하는 데에는 사용하지만, 경향 점수는 치료 효과를 추정하는 데 직접적으로 관여하지는 않습니다. 경향 점수를 사용한 공변량 조정의 추가적인 비판점은 결과 회귀 모형이 올바르게 지정되었다는 가정이 필요하다는 것입니다. 경향 점수를 사용한 공변량 조정에 대한 균형 진단이 설명되었지만, 이러한 진단은 다른 세 가지 방법에 비해 덜 투명합니다 [48, 49]. 또한, 매칭, 계층화 및 가중화는 관측 연구의 설계를 관측 연구의 분석과 분리할 수 있습니다 [8]. 몬테카를로 시뮬레이션의 연구에 따르면, 경향 점수 매칭과 경향 점수를 사용한 역치료 확률 가중은 경향 점수에 대한 계층화 및 경향 점수를 사용한 공변량 조정과 비교하여 기준선 공변량의 균형을 더 잘 유지시키는 것으로 나타났습니다 [50]. 일반적인 경향 점수 매칭은 ATE(전체 효과)를 추정할 수 있지만, 계층화 및 역치료 확률 가중은 층화 또는 대상이 어떻게 가중되느냐에 따라 ATE 또는 ATT(치료 효과)를 추정할 수 있습니다. 경향 점수를 사용한 쌍 매칭은 치료되지 않은 대상자의 수가 치료 대상자의 수보다 많아야 하며 (가능하면 상당히 많아야 함), 이에 따라 두 개의 샘플이 거의 동일한 크기인 경우나 치료 대상자의 수가 치료되지 않은 대상자의 수보다 많은 경우에는 매칭이 잘 작동하지 않을 수 있습니다. 그러나 다른 세 가지 경향 점수 방법에는 이러한 제한이 없습니다. 마지막으로, 이 방법들의 상대적인 성능은 위험 차이 및 주변 위험 비율을 추정하는 데 있어서 다른 곳에서 보다 자세히 조사되었습니다 [51].

`-` 3.5. Sensitivity analyses

### 4. Discussion
- CONSORT(Consolidated Standards of Reporting Trials) 문서는 이분법적 결과를 갖는 RCT(Randomized Controlled Trials)의 경우, 치료 효과의 상대적 및 절대적 측정치를 모두 보고할 것을 권장합니다 [1].
- 우리는 관찰 연구에서 치료 효과의 추정은 유사한 설계의 RCT에서 수행될 분석을 반영해야 한다고 제안합니다.
- 경향성 점수 방법은 치료받는 그룹과 치료받지 않는 그룹의 생존 곡선을 추정할 수 있게 합니다.
- 이러한 주변 생존 곡선은 모든 대상이 치료를 받았을 때의 인구 내 생존 기능 또는 모든 대상이 치료를 받지 않았을 때의 인구 내 생존 기능을 반영합니다.
- 경향성 점수 매칭이나 IPTW(Inverse Probability of Treatment Weighting)를 사용할 때, 생존을 치료 상태를 나타내는 지시 변수에 대한 Cox 비례 위험 모형을 사용하면 사건 발생의 위험의 상대적 감소를 추정할 수 있습니다.
- 따라서 이러한 두 가지 경향성 점수 방법을 사용한 분석은 사건 발생 가능성의 절대 및 상대적 감소를 보고할 수 있으며, 이는 RCT에서 보고될 효과 측정치와 유사합니다.
- 저희는 조건부 치료 효과의 추정치로 이어질 것으로 보이는 경향성 점수 방법의 사용을 권장하지 않았습니다.
- 이는 조건부 효과 측정치가 주변 효과 측정치보다 덜 중요하다는 제안으로 오해되어서는 안 됩니다.
- 오히려, 이러한 강조에는 세 가지 동기가 있습니다.
- 첫째, 경향성 점수 방법은 주변 치료 효과를 추정하는 것이 목적입니다 [22].
- 둘째, 경향성 점수에 대한 계층화와 경향성 점수를 사용한 공변량 조정은 예후에 중요한 모든 공변량을 조정하는 것으로 얻어질 조건부 위험 비율의 편향된 추정치를 낼 수 있습니다 [30].
- 셋째, 우리는 RCT에서 보고되는 치료 효과를 추정할 수 있는 방법에 중점을 두었습니다.
- RCT에서 결과를 치료 상태에 대한 회귀 조정만으로 주변 위험 비율을 추정할 수 있습니다.
- 따라서, 우리는 경향성 점수에 대한 계층화 및 경향성 점수를 사용한 공변량 조정을 피하도록 권장했습니다.
- 조건부 추정치가 주변 효과와 비교했을 때 추정된 치료 효과의 크기가 확대될 경우, 의학적 의사 결정 및 정책 결정에 중요한 영향을 미칠 수 있습니다.
- 예를 들어, 인구 수준에서 치료나 노출의 영향을 해석할 때, 조건부 추정치의 사용은 치료의 이점이나 노출의 해로운 영향을 과대평가할 수 있습니다.
- 이로 인해 후속적으로 자원 낭비가 발생할 수 있습니다.
- 앞서 언급한 바와 같이, 주어진 인구에 대해 여러 가지 조건부 효과가 있습니다.
- 경향성 점수를 조정하여 얻은 조건부 위험 비율은 결과와 관련된 공변량을 직접 조정하여 얻은 조건부 위험 비율과 다를 수 있습니다(일부 보조 분석에서 조건부 위험 비율 추정 시 이러한 차이가 관찰되었습니다) [46].
- 경향성 점수를 사용한 공변량 조정이나 경향성 점수에 대한 계층화를 통해 얻은 조건부 위험 비율이 관심 있는 주요 조건부 위험 비율과 어떻게 관련되어 있는지는 명확하지 않습니다.
- 이 문제를 해결하기 위해 추가 연구가 필요합니다. 많은 경우에 주요한 관심 있는 조건부 위험 비율은 결과를 치료 상태를 나타내는 지시 변수와 모든 측정된 공변량(중간 수의 공변량 집합을 가정함)에 대해 회귀하고, 연속적인 공변량을 결과의 로그-위험과 관련시키기 위해 유연한 smoothing 방법을 사용하는 것이 최선으로 보입니다.
- 치료의 생존 결과에 대한 효과를 추정할 때, 연구자들에게 경향성 점수 매칭 또는 경향성 점수를 사용한 역확률 가중치를 사용하도록 권장합니다.
- 이 두 가지 방법 각각의 장단점이 있습니다. 매칭의 장점은 가중치를 생성하는 방식에 의존하는 가중치보다 더 투명하다고 인식될 수 있다는 것입니다. 또한, 가중치는 경향성 점수의 잘못된 명시에 더 민감할 수 있습니다 [47].
- 일반적인 매칭의 단점은 ATT(처치의 평균 효과)를 추정하는 데 제한된다는 것인데, 반면에 가중치는 선택한 가중치에 따라 ATE(전체 평균 효과) 또는 ATT를 추정할 수 있습니다.
- 연구의 맥락에 따라 이 중 하나가 다른 것보다 더 유용하고 정보를 제공할 수 있습니다.
- 일부 경우에 연구자는 효과의 두 가지 측정치를 모두 보고하길 원할 수 있습니다.
- 최근 연구에 따르면 가중치와 매칭은 치료를 받은 그룹과 받지 않은 그룹 간의 체계적인 차이를 거의 동등한 정도로 제거한다는 것이 입증되었습니다 [50].
- 경향성 점수 가중치의 장점은 이 방법이 시간 변동 노출 및 시간 변동 혼입 변수를 고려할 수 있는 보다 일반적인 모델인 주변 구조 모델(Marginal Structural Models)의 하위 클래스임을 의미합니다.
- 따라서 가중치는 보다 복잡한 연구 설계와 연구 문제를 검토할 수 있는 방식으로 일반화됩니다.
- 그러나, Lu는 치료가 시간에 따라 변하는 경우나 기준선에서 고정되지 않을 때 전통적인 경향성 점수 방법을 확장했다는 점에 주목해야 합니다 [64].
- 매칭의 잠재적인 한계는 이상적으로 치료 대상보다 적어도 동일한 규모의 잠재적 대조군이 필요하다는 것입니다.
- 일부 연구 상황에서는 치료 대상의 수가 비치료 대상의 수를 초과할 수 있습니다. 매칭과 가중치의 비교를 마무리하면, 일반적으로 어느 방법이 다른 방법보다 명확히 우월하다고 할 수는 없으며, 각 방법의 상대적인 강점과 한계가 선택하는 방법에 고려되어야 합니다.
- 일부 상황에서 한 가지 방법이 다른 방법보다 명확한 장점을 가질 수 있습니다.
- 앞서 언급했듯이, 캘리퍼 매칭과 최적 매칭을 선택하는 데에는 트레이드오프가 있습니다.
- 캘리퍼 매칭은 치료 대상과 미치료 대상 간의 체계적인 차이를 더 크게 제거할 것으로 예상되지만, 불완전한 매칭으로 인한 편향을 도입할 수 있습니다.
- 저희 주요한 매칭 분석에서 (약 20%의 치료 대상이 제외된) 추정된 위험 비율은 0.855였으며, 모든 치료 대상을 포함한 최적 매칭을 사용한 분석에서는 0.909였습니다.
- Figure 1의 이러한 분석을 비교하는 것이 유익합니다. 최적 매칭을 사용하여 생성된 표본에서 추정된 생존 곡선은 ATT 가중치를 사용한 가중치 계산된 생존 곡선과 매우 유사합니다.
- 그러나 캘리퍼 매칭을 사용하여 생성된 매칭 표본의 미치료 대상 생존 곡선은 다른 두 방법을 사용하여 얻은 해당 곡선과 다릅니다.
- 특히, 캘리퍼 매칭을 사용한 표본의 미치료 대상의 생존율은 최적 매칭을 사용한 표본 및 ATT 가중치를 사용한 표본에 비해 약간 나빴습니다. 캘리퍼 매칭을 사용한 결과는 다른 두 ATT 분석 결과와 비교했을 때, 치료 대상과 퇴행된 예후를 가진 통제 또는 미치료 대상의 생존을 비교하도록 이끌었습니다.
- 이러한 분석 결과는 캘리퍼 매칭을 사용한 결과가 다른 두 ATT 분석보다 더 많은 편향의 영향을 받을 수 있다는 것을 시사합니다.
- 
CONSORT(임상시험보고기준)는 무작위 대조 연구(RCTs)의 보고를 개선했습니다 [11]
-  본 논문에서 설명된 방법을 준수하면 치료의 효과를 추정하기 위해 경향성 점수 방법을 사용하는 연구의 수행 및 보고가 개선될 것입니다
-  결과가 시간에 따라 발생하는 경우, 우리는 다음과 같은 이유로 경향성 점수 매칭 또는 경향성 점수를 사용한 역확률 치료 가중치를 권장합니다
-  첫째, 이 방법들은 치료받은 그룹과 치료받지 않은 그룹의 생존 함수를 추정할 수 있게 합니다
-  이러한 생존 함수에서 특정 추적 기간 내에 사건 발생의 절대 감소를 계산할 수 있습니다
-  둘째, 이러한 각각의 방법은 주변 위험 비율을 추정할 수 있도록 해줍니다. 이는 치료를 받은 인구와 치료를 받지 않은 인구 간 사건 발생 위험의 상대적 감소를 정량화할 수 있습니다
-  이러한 방법을 사용하면 관찰 연구에서 절대적 및 상대적 효과 측정치를 모두 보고함으로써 RCTs의 보고를 모방할 수 있을 것입니다
