In [1]:
import numpy  as np
import random

from operator import itemgetter

In [2]:
def sampleMeans(data, n, sS, Mu):
    result = np.zeros((len(n), 3))
    for t in range(len(n)):
        sampleMeans = []
        for i in range(n[t]):
            # Lấy mẫu S(i) gồm sS cá thể từ quần thể
            sample = random.choices(data, k = sS)
            sampleMeans.append(np.mean(sample))
    
        x_bar = np.mean(sampleMeans)
        result[t, 0] = n[t]
        result[t, 1] = x_bar
        result[t, 2] = abs(Mu - x_bar)
    return result

In [3]:
sP = np.power(10, 6)
sS = 20
n  = [1, 100, 1000, 10000]    # Thay đổi số lần lấy mẫu

In [4]:
print('----------------------------------------------------------------------')
print('1) UNIFORM')
print('----------------------------------------------------------------------')

# Tạo quần thể có chiều cao (cm) nằm trong khoảng [hMin, hMax]
hMin = 145
hMax = 195
data = np.random.uniform(hMin, hMax, sP)
data = data.astype(int) # chuyển sang kiểu INT
Mu   = (hMin + hMax) / 2
print('Kỳ vọng Mu = %.4f' %Mu)
# Phân tích kết quả theo số lần lấy mẫu n
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))

----------------------------------------------------------------------
1) UNIFORM
----------------------------------------------------------------------
Kỳ vọng Mu = 170.0000
Lấy mẫu   100 lần --> trung bình mẫu = 169.5125 (epsilon = 0.4875)
Lấy mẫu 10000 lần --> trung bình mẫu = 169.4658 (epsilon = 0.5342)
Lấy mẫu  1000 lần --> trung bình mẫu = 169.3864 (epsilon = 0.6136)
Lấy mẫu     1 lần --> trung bình mẫu = 168.3000 (epsilon = 1.7000)


In [5]:
print('\n----------------------------------------------------------------------')
print('2) BINOMIAL')
print('----------------------------------------------------------------------')
# Tạo quần thể từ thí nghiệm n phép thử Bernoulli
trials = 10
p      = 0.3
data   = np.random.binomial(n = trials, p = p, size = sP)
Mu     = (10 * 0.3)
print('Kỳ vọng Mu = %.4f' %Mu)
# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


----------------------------------------------------------------------
2) BINOMIAL
----------------------------------------------------------------------
Kỳ vọng Mu = 3.0000
Lấy mẫu 10000 lần --> trung bình mẫu = 2.9986 (epsilon = 0.0014)
Lấy mẫu  1000 lần --> trung bình mẫu = 3.0021 (epsilon = 0.0021)
Lấy mẫu   100 lần --> trung bình mẫu = 3.0095 (epsilon = 0.0095)
Lấy mẫu     1 lần --> trung bình mẫu = 3.4500 (epsilon = 0.4500)


In [6]:
print('\n----------------------------------------------------------------------')
print('3) POISSON')
print('----------------------------------------------------------------------')
# Tạo quần thể
lambda_ = 30
data    = np.random.poisson(lam = lambda_, size = sP)
Mu      = lambda_
print('Kỳ vọng Mu = %.4f' %Mu)
# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


----------------------------------------------------------------------
3) POISSON
----------------------------------------------------------------------
Kỳ vọng Mu = 30.0000
Lấy mẫu 10000 lần --> trung bình mẫu = 29.9990 (epsilon = 0.0010)
Lấy mẫu   100 lần --> trung bình mẫu = 29.9605 (epsilon = 0.0395)
Lấy mẫu  1000 lần --> trung bình mẫu = 29.9487 (epsilon = 0.0513)
Lấy mẫu     1 lần --> trung bình mẫu = 31.1500 (epsilon = 1.1500)


In [7]:


print('\n----------------------------------------------------------------------')
print('4) GEOMETRIC')
print('----------------------------------------------------------------------')
# Tạo quần thể
p    = 0.3
data = np.random.geometric(p = p, size = sP)
Mu   = 1 / p
print('Kỳ vọng Mu = %.4f' %Mu)
# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))
    


----------------------------------------------------------------------
4) GEOMETRIC
----------------------------------------------------------------------
Kỳ vọng Mu = 3.3333
Lấy mẫu 10000 lần --> trung bình mẫu = 3.3285 (epsilon = 0.0048)
Lấy mẫu  1000 lần --> trung bình mẫu = 3.3544 (epsilon = 0.0210)
Lấy mẫu   100 lần --> trung bình mẫu = 3.2930 (epsilon = 0.0403)
Lấy mẫu     1 lần --> trung bình mẫu = 2.5000 (epsilon = 0.8333)


In [8]:
print('\n----------------------------------------------------------------------')
print('5) EXPONENTIAL')
print('----------------------------------------------------------------------')
# Tạo quần thể
lambda_ = 30
data    = np.random.exponential(1. / lambda_, size = sP)
Mu      = 1. / lambda_
print('Kỳ vọng Mu = %.4f' %Mu)
# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


----------------------------------------------------------------------
5) EXPONENTIAL
----------------------------------------------------------------------
Kỳ vọng Mu = 0.0333
Lấy mẫu 10000 lần --> trung bình mẫu = 0.0334 (epsilon = 0.0000)
Lấy mẫu     1 lần --> trung bình mẫu = 0.0331 (epsilon = 0.0002)
Lấy mẫu  1000 lần --> trung bình mẫu = 0.0331 (epsilon = 0.0003)
Lấy mẫu   100 lần --> trung bình mẫu = 0.0348 (epsilon = 0.0015)


In [9]:
print('\n----------------------------------------------------------------------')
print('6) PARETO')
print('----------------------------------------------------------------------')
# Tạo quần thể
alpha = 3.0   # shape (độ dốc ở phần đầu, gần giá trị của k)
k     = 1     # location hay là giá trị min, default = 0 --> dời curve k đơn vị
data  = np.random.pareto(alpha, sP) + k
Mu    = (k * alpha) / (alpha - 1)
print('Kỳ vọng Mu = %.4f' %Mu)
# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


----------------------------------------------------------------------
6) PARETO
----------------------------------------------------------------------
Kỳ vọng Mu = 1.5000
Lấy mẫu 10000 lần --> trung bình mẫu = 1.4996 (epsilon = 0.0004)
Lấy mẫu  1000 lần --> trung bình mẫu = 1.4969 (epsilon = 0.0031)
Lấy mẫu   100 lần --> trung bình mẫu = 1.4803 (epsilon = 0.0197)
Lấy mẫu     1 lần --> trung bình mẫu = 1.5415 (epsilon = 0.0415)
