title: "시작품 제조 과정 중 도출되는 QC 합격기준"
date: "20240104"

## 배경
시작품 제조 과정에서 반복실험을 통해 얻어지는 ct값들 중 어떤 값이 합격기준을 만족하는지 알아보고자 함.

## 목적
각 실험별, template 별로 outlier 에 해당하는 ct값을 구하여 이 값이 합격기준에 부합하는지 판단하고자 함.

## 방법
outlier 를 구하는 방법은 여러가지가 있으며 univariate distribution 에서의 outlier 를 구하는 방법으로는
IQR (Interquartile Range) 를 사용하거나, Grubb's test, 또는 Generalized Extreme Studentized Deviate (ESD) test 등이 있다. 이 중 CLSI EP09A3 Appendix B에 소개된 Generalized ESD test 를 사용하여 outlier 를 구하였다.
이 test 는 R 4.3.2 버전에서 사용할 수 있는 EnvStats 패키지에 포함되어 있다.

## 결과
현재 데이터 상으로는 특정 실험 중 특정 template 중 특정 측정값이 outlier 인 것으로 나타났으며 그 외에는 모두 outlier 가 아닌 것으로 나타났다. Generalised ESD 테스트 특성 상 정규분포를 따르는 것을 가정으로 하고 있으며 sample 수가 25는 넘어야 정확한 산출을 할 수 있다. 현재 데이터는 이러한 기준을 모두 만족시키고 있지는 않으므로 실험 횟수를 늘리는 등의 방법을 통해 데이터를 더 확보할 것을 권장한다. 

## Reference

1. CLSI EP09A3 Appendix B
2. CLSI EP05-A3
3. https://search.r-project.org/CRAN/refmans/mcradds/html/ESD_test.html
4. https://rdrr.io/cran/EnvStats/man/rosnerTest.html
5. Burns, M. J., Nixon, G. J., Foy, C. A., & Harris, N. (2005). Standardisation of data from real-time quantitative PCR methods–evaluation of outliers and comparison of calibration curves. BMC biotechnology, 5(1), 1-13.
6. Rosner, B. (1983). Percentage Points for a Generalized ESD Many-Outlier Procedure. Technometrics 25, 165–172.
7. https://www.itl.nist.gov/div898/handbook/eda/section3/eda35h3.htm



## 사용된 R code
library(EnvStats)

exp1 = read.csv('experiment_1.csv', header = TRUE)
print(exp1)

num_sample = nrow(exp1)

for (j in 1:ncol(exp1)){
    print(exp1[j])
    exp1[[j]] <- as.numeric(exp1[[j]])
    qqPlot(exp1[[j]])
    print(rosnerTest(exp1[[j]], k = 1))
}


exp2 = read.csv('experiment_2.csv', header = TRUE) 

print(exp2)
num_sample = nrow(exp2)

for (j in 1:ncol(exp2)){
    print(exp2[j])
    exp2[[j]] <- as.numeric(exp2[[j]])
    qqPlot(exp2[[j]])
    print(rosnerTest(exp2[[j]], k = 2))
}

exp3 = read.csv('experiment_3.csv', header = TRUE)

print(exp3)

for (j in 1:ncol(exp3)){
    print(exp3[j])
    exp3[[j]] <- as.numeric(exp3[[j]])
    qqPlot(exp3[[j]])
    print(rosnerTest(exp3[[j]], k = 4))
}

exp4 = read.csv('experiment_4.csv', header = TRUE)

print(exp4)

for (j in 1:ncol(exp4)){
    print(exp4[j])
    exp4[[j]] <- as.numeric(exp4[[j]])
    qqPlot(exp4[[j]])
    print(rosnerTest(exp4[[j]], k = 5))
}

