In [3]:
import pandas as pd
import numpy as np
from scipy.stats import weibull_min  # scipy 패키지에서 weibull_min 함수 호출

In [4]:
n = 10000  # 표본 수
rho = 2    # 형태 (shape) 모수
gam = 2    # 척도 (scale) 모수

np.random.seed(100)  # 시드 설정: 동일한 난수 발생하기 위해

# 10000개의 와이블 분포를 따르는 시간을 생성: 형태 모수 = 2, 척도 모수 = 2
wb_ftime = weibull_min.rvs(rho, loc=0, scale=gam, size=n)

wb_ftime[0:5]  # 생성된 시간 중 처음 5개만 출력

array([1.77082847, 1.14235176, 1.48666959, 2.72975229, 0.13755036])

In [106]:
wb_ftime_bar = wb_ftime.mean()  # 표본 평균 계산

# 표본 평균을 출력
print ("Sample mean of 10000 Weibull RVs: \n", format(wb_ftime_bar,"1.3f"))

Sample mean of 10000 Weibull RVs: 
 1.767


In [83]:
import numpy as np  # numpy 패키지 사용 (np란 이름으로)

In [115]:
np.random.seed(200)  # 시드 설정: 동일한 난수 발생하기 위해

# (0, 10) 사이 균등 분포를 따르는 10000개의 시간 발생
uni_010 = np.random.uniform(0,10,n)   

uni_010[0:5]  # 생성된 시간 중 처음 5개만 출력

array([9.47632257, 2.26547421, 5.94420144, 4.28308685, 7.64140687])

In [116]:
v = list(range(0,n))  # for문을 사용하기 위해 0-9999의 list 생성
obs_010 = wb_ftime    # 관측 시간을 생존 시간으로 초기화
ind_010 = np.zeros(n) # 사건 지표값을 저장하기 위한 배열 초기화 (0이 10000개)

In [117]:
for i in v:   # 관측 시간과 사건 지표값을 생성하기 위한 for문
   if wb_ftime[i] < uni_010[i]:  # 생존 시간 < 중도 절단 시간 
    obs_010[i] = wb_ftime[i]     # 관측 시간 = 생존 시간
    ind_010[i] = 1               # 사건 지표 = 1 (생존 시간을 의미)
   else:                         # 생존 시간 > 중도 절단 시간
    obs_010[i] = uni_010[i]      # 관측 시간 = 중도 절단 시간

In [126]:
print ("Censoring proportion: \n", format(1-sum(ind_010)/n,"1.3f"))  # 우중도 절단률

Censoring proportion: 
 0.178


In [120]:
wb_cens010_bar = obs_010.mean()   # 관측 시간의 표본평균 계산

print ("Sample mean with unif(0, 10) censoring: \n", format(wb_cens010_bar,"1.3f"))

Sample mean with unif(0, 10) censoring: 
 1.562


In [121]:
np.random.seed(201)  # 시드 설정: 동일한 난수 발생하기 위해

# (0, 5) 사이 균등 분포를 따르는 10000개의 시간 발생
uni_05 = np.random.uniform(0,5,n)   

In [122]:
obs_05 = wb_ftime    # 관측 시간을 생존 시간으로 초기화
ind_05 = np.zeros(n) # 사건 지표값을 저장하기 위한 배열 초기화 (0이 10000개)

In [123]:
for i in v:   # 관측 시간과 사건 지표값을 생성하기 위한 for문
   if wb_ftime[i] < uni_05[i]:  # 생존 시간 < 중도 절단 시간 
    obs_05[i] = wb_ftime[i]     # 관측 시간 = 생존 시간   
    ind_05[i] = 1               # 사건 지표 = 1 (생존 시간을 의미)
   else:                        # 생존 시간 > 중도 절단 시간
    obs_05[i] = uni_05[i]       # 관측 시간 = 중도 절단 시간

In [127]:
print ("Censoring proportion: \n", format(1-sum(ind_05)/n,"1.3f"))  # 우중도 절단률

Censoring proportion: 
 0.312


In [125]:
wb_cens05_bar = obs_05.mean()   # 관측 시간의 표본평균 계산

print ("Sample mean with unif(0, 5) censoring: \n", format(wb_cens05_bar,"1.3f"))

Sample mean with unif(0, 5) censoring: 
 1.237
