KIỂM ĐỊNH F

Thay vì xây dựng giả thuyết với giá trị trung bình, người ta có thể xây dựng giả thuyết với phương sai (variance $\sigma^{2}$). Trong trường hợp này, chúng ta sử dụng kiểm định F. Tóm tắt về kiểm định F như sau:

Kiểm định một đuôi:

$$H_{0}: \sigma^{2} = \sigma_{0}^{2} $$

$$H_{a}: \sigma^{2} < \sigma_{0}^{2} (H_{a}: \sigma^{2} > \sigma_{0}^{2})$$ 

Giá trị thống kê kiểm định:

$$ \chi^{2} = \frac{(n-1)s^{2}}{\sigma_{0}^{2}}$$

Vùng bác bỏ: $\chi^{2} < \chi_{(1 - \alpha)}^{2}$  hoặc $\chi^{2} > \chi_{(1 - \alpha)}^{2}$  khi $H_{a}: \sigma^{2} > \sigma_{0}^{2}$

Ghi chú: 

- $\chi^{2}$ - chi-square
- (n - 1) mức tự do



Kiểm định 2 đuôi:

$$H_{0}: \sigma^{2} = \sigma_{0}^{2}$$
$$H_{a}:\sigma^{2} \neq \sigma_{0}^{2} $$

Giá trị thống kê kiểm định:

$$ \chi^{2} = \frac{(n-1)s^{2}}{\sigma_{0}^{2}}$$

Vùng bác bỏ: $\chi^{2} < \chi_{(1 - \alpha/2)}^{2}$  hoặc $\chi^{2} > \chi_{(\alpha/2)}^{2}$  
Ghi chú: 

- $\chi^{2}$ - chi-square
- (n - 1) mức tự do

THỰC HÀNH KIỂM ĐỊNH F

Bước 1: Sinh ngẫu nhiên số liệu

Bước 2: Xây dựng giả thuyết 

Bước 3: Kiểm định Bartlett 

In [1]:
import numpy as np
import pandas as pd
import random
from scipy import stats
from statsmodels.stats.weightstats import ztest
import warnings
import matplotlib.pyplot as plt
import seaborn as sns
%matplotlib inline

In [2]:
#Sinh ngẫu nhiên 1000 mẫu tuân theo phân phối chuẩn có trung bình mẫu là 7.5 và độ lệch chuẩn là 0.25
mean_1 = 7.5
std_1 = 0.25
N_1 = 1000
samples_1 = np.random.normal(mean_1, std_1, N_1)

In [3]:
#In ra 10 phần tử đầu tiên
print(samples_1[:10])

[6.85706683 7.53956352 7.58029975 7.59973532 6.93977985 7.47344672
 7.34677838 7.53657789 7.40141037 7.62919999]


In [4]:
#Sinh ngẫu nhiên 900 mẫu tuân theo phân phối chuẩn có trung bình mẫu là 7 và độ lệch chuẩn là 0.2
mean_2= 7
std_2 = 0.2
N_2 = 900
samples_2 = np.random.normal(mean_2, std_2, N_2)

In [5]:
#In ra 10 phần tử đầu tiên
print(samples_2[:10])

[6.98960046 6.88910965 6.99507503 6.74511303 7.12411895 6.9404384
 7.0320715  7.15062904 6.97527432 7.33398319]


Xây dựng giả thuyết:
$$H_{0}: \sigma_{1}^{2} = \sigma_{2}^{2}$$
$$H_{a}: \sigma_{1}^{2} \neq \sigma_{2}^{2}$$

In [6]:
#Kiểm định Bartlett
stat_value, p_value = stats.bartlett(samples_1, samples_2)
print("Stat value: ", stat_value, "; p-value: ", p_value)

Stat value:  44.48699655797718 ; p-value:  2.560522494544838e-11


In [7]:
alpha = 0.05
if(p_value <  alpha):
    print("Có bằng chứng để bác bỏ giả thuyết H0")
else:
    print("Chưa có bằng chứng để bác bỏ giả thuyết H0")

Có bằng chứng để bác bỏ giả thuyết H0


BÀI TẬP

Bạn hãy thử viết code tiến hành kiểm định F 1 đuôi?

Gợi ý: Thử tìm kiếm ví dụ về kiểm dịnh F 1 đuôi trong ngôn ngữ lập trình Python & R để nhận thấy sự khác biệt.

Tạo mẫu 1 với:
- $\overline{\rm X} = 100$
- $\sigma = 10$
- $n = 1000$

In [10]:
tb1 = 100
std1 = 10
count1 = 1000
test1 = np.random.normal(tb1, std1, count1)
test1[:10]

array([ 96.25089575,  85.44316337, 102.87829577, 105.571694  ,
        99.80829698, 100.11394264,  95.94166412, 101.11615393,
        99.48195658, 104.99443601])

Tạo mẫu 1 với:
- $\overline{\rm X} = 130$
- $\sigma = 40$
- $n = 850$

In [15]:
tb2 = 110
std2 = 20
count2 = 850
test2 = np.random.normal(tb2, std2, count2)
test2[:10]

array([ 86.77359218, 123.30354629, 108.78442797,  73.54276495,
       136.42941018, 132.90464307, 122.73274675, 102.11095531,
        93.99947732,  91.57472353])

Xây dựng giả thuyết:
$$H_{0}: \sigma_{1}^{2} = \sigma_{2}^{2}$$
$$H_{a}: \sigma_{1}^{2} \neq \sigma_{2}^{2}$$

In [19]:
#Kiểm định Bartlett
stat_value_test, p_value_test = stats.bartlett(test1, test2)
print("Stat value: ", stat_value_test, "; p-value: ", p_value_test)

Stat value:  437.5383267077386 ; p-value:  3.7171028495046994e-97


In [20]:
alpha = 0.05
if(p_value_test <  alpha):
    print("Có bằng chứng để bác bỏ giả thuyết H0")
else:
    print("Chưa có bằng chứng để bác bỏ giả thuyết H0")

Có bằng chứng để bác bỏ giả thuyết H0
