In [2]:
"""=============================================================================
    Các tham số: 
        - Kích thước quần thể: sP
        - Kích thước mẫu:      sS
        - Số lần lấy mẫu:      n
============================================================================="""
import numpy  as np
import random

from operator import itemgetter

In [5]:
'''-----------------------------------------------------------------------------
   Hàm tính các trung bình mẫu
-----------------------------------------------------------------------------'''
def sampleMeans(data, n, sS, Mu):
    import numpy as np
    
    result = np.zeros((len(n), 3))
    for t in range(len(n)):
        sampleMeans = []
        for i in range(n[t]):
            # Lấy mẫu S(i) gồm sS cá thể từ quần thể
            sample = random.choices(data, k = sS)
            sampleMeans.append(np.mean(sample))
    
        x_bar = np.mean(sampleMeans)
        result[t, 0] = n[t]
        result[t, 1] = x_bar
        result[t, 2] = abs(Mu - x_bar)
    return result

In [8]:
#===============================================================================
# Kích thước quần thể sP và kích thước mẫu sS    
sP = np.power(10, 6)
sS = 20
n  = [1, 100, 1000, 10000]    # Thay đổi số lần lấy mẫu

print('-----------------------------------------------------------------------')
print('1) UNIFORM')
print('-----------------------------------------------------------------------')
# Tạo quần thể có chiều cao (cm) nằm trong khoảng [hMin, hMax]
hMin = 145
hMax = 195
data = np.random.uniform(hMin, hMax, sP)
data = data.astype(int) # chuyển sang kiểu INT
Mu   = (hMin + hMax) / 2
print('Kỳ vọng Mu = %.4f' %Mu)

# Phân tích kết quả theo số lần lấy mẫu n
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))

-----------------------------------------------------------------------
1) UNIFORM
-----------------------------------------------------------------------
Kỳ vọng Mu = 170.0000
Lấy mẫu   100 lần --> trung bình mẫu = 169.9495 (epsilon = 0.0505)
Lấy mẫu  1000 lần --> trung bình mẫu = 169.5247 (epsilon = 0.4753)
Lấy mẫu 10000 lần --> trung bình mẫu = 169.5046 (epsilon = 0.4954)
Lấy mẫu     1 lần --> trung bình mẫu = 164.2000 (epsilon = 5.8000)


In [11]:
print('\n-----------------------------------------------------------------------')
print('2) BINOMIAL')
print('-----------------------------------------------------------------------')
# Tạo quần thể từ thí nghiệm n phép thử Bernoulli
trials = 10
p      = 0.3
data   = np.random.binomial(n = trials, p = p, size = sP)
Mu     = (10 * 0.3)
print('Kỳ vọng Mu = %.4f' %Mu)

# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


-----------------------------------------------------------------------
2) BINOMIAL
-----------------------------------------------------------------------
Kỳ vọng Mu = 3.0000
Lấy mẫu 10000 lần --> trung bình mẫu = 2.9987 (epsilon = 0.0013)
Lấy mẫu  1000 lần --> trung bình mẫu = 3.0070 (epsilon = 0.0070)
Lấy mẫu   100 lần --> trung bình mẫu = 2.9340 (epsilon = 0.0660)
Lấy mẫu     1 lần --> trung bình mẫu = 3.1500 (epsilon = 0.1500)


In [14]:
print('\n-----------------------------------------------------------------------')
print('3) POISSON')
print('-----------------------------------------------------------------------')
# Tạo quần thể
lambda_ = 30
data    = np.random.poisson(lam = lambda_, size = sP)
Mu      = lambda_
print('Kỳ vọng Mu = %.4f' %Mu)

# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


-----------------------------------------------------------------------
3) POISSON
-----------------------------------------------------------------------
Kỳ vọng Mu = 30.0000
Lấy mẫu  1000 lần --> trung bình mẫu = 29.9868 (epsilon = 0.0132)
Lấy mẫu 10000 lần --> trung bình mẫu = 29.9618 (epsilon = 0.0382)
Lấy mẫu   100 lần --> trung bình mẫu = 29.9510 (epsilon = 0.0490)
Lấy mẫu     1 lần --> trung bình mẫu = 28.9500 (epsilon = 1.0500)


In [17]:
print('\n-----------------------------------------------------------------------')
print('4) GEOMETRIC')
print('-----------------------------------------------------------------------')
# Tạo quần thể
p    = 0.3
data = np.random.geometric(p = p, size = sP)
Mu   = 1 / p
print('Kỳ vọng Mu = %.4f' %Mu)

# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


-----------------------------------------------------------------------
4) GEOMETRIC
-----------------------------------------------------------------------
Kỳ vọng Mu = 3.3333
Lấy mẫu  1000 lần --> trung bình mẫu = 3.3326 (epsilon = 0.0007)
Lấy mẫu   100 lần --> trung bình mẫu = 3.3460 (epsilon = 0.0127)
Lấy mẫu 10000 lần --> trung bình mẫu = 3.3480 (epsilon = 0.0147)
Lấy mẫu     1 lần --> trung bình mẫu = 3.3000 (epsilon = 0.0333)


In [20]:
print('\n-----------------------------------------------------------------------')
print('5) EXPONENTIAL')
print('-----------------------------------------------------------------------')
# Tạo quần thể
lambda_ = 30
data    = np.random.exponential(1. / lambda_, size = sP)
Mu      = 1. / lambda_
print('Kỳ vọng Mu = %.4f' %Mu)

# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


-----------------------------------------------------------------------
5) EXPONENTIAL
-----------------------------------------------------------------------
Kỳ vọng Mu = 0.0333
Lấy mẫu 10000 lần --> trung bình mẫu = 0.0334 (epsilon = 0.0001)
Lấy mẫu  1000 lần --> trung bình mẫu = 0.0334 (epsilon = 0.0001)
Lấy mẫu   100 lần --> trung bình mẫu = 0.0335 (epsilon = 0.0002)
Lấy mẫu     1 lần --> trung bình mẫu = 0.0286 (epsilon = 0.0047)


In [23]:
print('\n-----------------------------------------------------------------------')
print('6) PARETO')
print('-----------------------------------------------------------------------')
# Tạo quần thể
alpha = 3.0   # shape (độ dốc ở phần đầu, gần giá trị của k)
k     = 1     # location hay là giá trị min, default = 0 --> dời curve k đơn vị
data  = np.random.pareto(alpha, sP) + k
Mu    = (k * alpha) / (alpha - 1)
print('Kỳ vọng Mu = %.4f' %Mu)

# Phân tích kết quả theo số lần lấy mẫu n 
means = sampleMeans(data, n, sS, Mu).tolist()
means = sorted(means, key = itemgetter(2))

for i in range(len(n)):
    print('Lấy mẫu %5d' %means[i][0], 'lần --> trung bình mẫu = %.4f' %means[i][1], 
             '(epsilon = %.4f)' %abs(means[i][2]))


-----------------------------------------------------------------------
6) PARETO
-----------------------------------------------------------------------
Kỳ vọng Mu = 1.5000
Lấy mẫu 10000 lần --> trung bình mẫu = 1.4999 (epsilon = 0.0001)
Lấy mẫu  1000 lần --> trung bình mẫu = 1.5007 (epsilon = 0.0007)
Lấy mẫu   100 lần --> trung bình mẫu = 1.4894 (epsilon = 0.0106)
Lấy mẫu     1 lần --> trung bình mẫu = 1.6831 (epsilon = 0.1831)
