In [1]:

# ====== CHUẨN BỊ DÙNG CHUNG ======
import numpy as np                      # numpy: tính toán số học mảng, mô phỏng ngẫu nhiên
import matplotlib.pyplot as plt         # matplotlib: vẽ biểu đồ
from scipy.stats import binom, poisson, norm  # scipy.stats: các phân phối xác suất

np.random.seed(2025)  # Đặt "hạt giống" ngẫu nhiên để kết quả tái lặp (reproducible)


# ==========================

In [2]:
# BÀI 01
# --------------------------
# Đề: Trắc nghiệm 10 câu, 4 phương án, 1 đúng. Chọn ngẫu nhiên mỗi câu.
# a) In ra số câu đúng trong 10 lần kiểm tra (mỗi lần làm 10 câu, p=1/4)
# b) Thang điểm: đúng +4, sai -2. Xác suất được đúng 4 điểm?
# c) Gọi X là số câu đúng. Tính E(X) và Var(X).
# ==========================

# --- a) Mô phỏng 10 lần kiểm tra ---
n_questions = 10               # số câu hỏi mỗi lần kiểm tra
p_correct = 1/4                 # xác suất chọn đúng khi đoán mò (1 đáp án đúng trong 4 đáp án)
n_trials = 10                   # số lần kiểm tra cần mô phỏng

# Mỗi lần kiểm tra: số câu đúng ~ Binomial(n=10, p=0.25)
ten_attempts_correct = binom.rvs(n=n_questions, p=p_correct, size=n_trials)  # mảng 10 giá trị, mỗi giá trị = số câu đúng
print("Bài 01a) Số câu đúng trong 10 lần kiểm tra:", ten_attempts_correct)

# --- b) Xác suất được đúng 4 điểm ---
# Quy đổi điểm: mỗi câu đúng +4, mỗi câu sai -2. Tổng điểm S = 4*C - 2*(10 - C) = 6*C - 20
# Muốn S = 4  => 6*C - 20 = 4  => 6*C = 24  => C = 4
score_target = 4
required_correct = (score_target + 20) / 6    # giải ngược công thức S = 6*C - 20
# required_correct phải là số nguyên mới khả thi
if required_correct.is_integer():
    required_correct = int(required_correct)  # số câu đúng cần có để đạt 4 điểm
    prob_score_eq_4 = binom.pmf(required_correct, n_questions, p_correct)  # P(X=4) với X~Bin(n=10,p=0.25)
else:
    prob_score_eq_4 = 0.0

print(f"Bài 01b) Xác suất đạt đúng {score_target} điểm:", prob_score_eq_4)

# --- c) Kỳ vọng và phương sai của X ~ Bin(n,p) ---
EX = n_questions * p_correct                    # E(X) = n*p
VarX = n_questions * p_correct * (1 - p_correct)  # Var(X) = n*p*(1-p)
print("Bài 01c) E(X) =", EX, " ; Var(X) =", VarX)

Bài 01a) Số câu đúng trong 10 lần kiểm tra: [1 4 5 2 2 2 3 2 5 4]
Bài 01b) Xác suất đạt đúng 4 điểm: 0.14599800109863278
Bài 01c) E(X) = 2.5  ; Var(X) = 1.875


In [None]:

# ==========================
# BÀI 02
# --------------------------
# Trung tâm bưu điện nhận trung bình λ = 3 cuộc gọi mỗi phút ~ Poisson(λ=3)
# Tính P(N=1), P(N=2), P(N=3) trong một phút.
# ==========================

lam = 3  # λ = 3 cuộc/phút
p1 = poisson.pmf(1, lam)   # P(N=1)
p2 = poisson.pmf(2, lam)   # P(N=2)
p3 = poisson.pmf(3, lam)   # P(N=3)

print("Bài 02) P(N=1) =", p1, "; P(N=2) =", p2, "; P(N=3) =", p3)



In [None]:

# BÀI 03
# --------------------------
# Trọng lượng trái cây X ~ N(μ=500 g, σ=?). Đề bị thiếu σ, ta giả thiết hợp lý σ=5 g để minh hoạ.
# Phân loại:
#  Loại 1: X > 505
#  Loại 2: 495 ≤ X ≤ 505
#  Loại 3: X < 495
# a) Tính tỷ lệ mỗi loại (theo mô hình lý thuyết).
# b) Mô phỏng lấy mẫu 20 trái, vẽ histogram, tính mean & std mẫu.
# c) Mô phỏng lấy mẫu 100 trái, vẽ histogram, tính mean & std mẫu.
# d) Nhận xét từ b) và c).
# ==========================

mu = 500      # trung bình (gam)
sigma = 5     # độ lệch chuẩn (gam) - GIẢ ĐỊNH hợp lý cho ví dụ này

# --- a) Tỷ lệ mỗi loại theo mô hình chuẩn ---
p_loai1 = 1 - norm.cdf(505, loc=mu, scale=sigma)                    # P(X > 505) = 1 - F(505)
p_loai2 = norm.cdf(505, mu, sigma) - norm.cdf(495, mu, sigma)       # P(495 ≤ X ≤ 505) = F(505) - F(495)
p_loai3 = norm.cdf(495, mu, sigma)                                  # P(X < 495) = F(495)

print("Bài 03a) Tỷ lệ mỗi loại (theo mô hình):")
print("  Loại 1 (X > 505):", p_loai1)
print("  Loại 2 (495 ≤ X ≤ 505):", p_loai2)
print("  Loại 3 (X < 495):", p_loai3)
print("  Tổng kiểm tra:", p_loai1 + p_loai2 + p_loai3)  # nên xấp xỉ 1.0

# --- b) Mô phỏng 20 trái, vẽ histogram, tính thống kê mẫu ---
n1 = 20
sample20 = norm.rvs(loc=mu, scale=sigma, size=n1)  # sinh 20 giá trị ~ N(500, 5)

# Tính trung bình & độ lệch chuẩn mẫu (ddof=1 để đúng công thức thống kê mẫu)
mean20 = np.mean(sample20)
std20 = np.std(sample20, ddof=1)

# Vẽ histogram cho 20 trái
plt.figure(figsize=(6,4), dpi=120)              # mỗi hình một figure riêng
plt.hist(sample20, bins=8, density=True)        # histogram chuẩn hoá (diện tích ~1)
plt.title('Bài 03b) Histogram – Mẫu 20 trái')
plt.xlabel('Trọng lượng (g)'); plt.ylabel('Mật độ xấp xỉ')
plt.tight_layout()
plt.show()

print("Bài 03b) Thống kê mẫu 20 trái:")
print("  Mean (mẫu) =", mean20, " ; Std (mẫu) =", std20)

# --- c) Mô phỏng 100 trái, vẽ histogram, tính thống kê mẫu ---
n2 = 100
sample100 = norm.rvs(loc=mu, scale=sigma, size=n2)  # sinh 100 giá trị ~ N(500, 5)

mean100 = np.mean(sample100)
std100 = np.std(sample100, ddof=1)

plt.figure(figsize=(6,4), dpi=120)
plt.hist(sample100, bins=12, density=True)
plt.title('Bài 03c) Histogram – Mẫu 100 trái')
plt.xlabel('Trọng lượng (g)'); plt.ylabel('Mật độ xấp xỉ')
plt.tight_layout()
plt.show()

print("Bài 03c) Thống kê mẫu 100 trái:")
print("  Mean (mẫu) =", mean100, " ; Std (mẫu) =", std100)

# --- d) Nhận xét: sẽ in dưới dạng text, nhưng để phù hợp bài, ta để phần nhận xét trong phần trả lời chính.


In [None]:
# ==========================
# BÀI 04
# --------------------------
# Cho X là phân phối chuẩn tắc (Z ~ N(0,1)).
# YÊU CẦU:
#  - Tính P(Z < 0.5), P(Z > 0.5), P(|Z| < 0.5).
#  - Phần "Tìm z thỏa mãn: P(X<z)=1.96 ..." trong đề gốc là KHÔNG HỢP LÝ vì 1.96 không phải xác suất.
#    Ta sửa logic về dạng đúng: tìm z sao cho
#        (i) P(Z < z) = 0.975     (thì z ≈ 1.96)
#       (ii) P(Z > z) = 0.025     (thì z ≈ 1.96)
#      (iii) P(|Z| < z) = 0.95    (thì z ≈ 1.96)
# ==========================

# --- Xác suất với Z ~ N(0,1) ---
P_less_0_5 = norm.cdf(0.5, loc=0, scale=1)                 # P(Z ≤ 0.5)
P_greater_0_5 = 1 - P_less_0_5                             # P(Z > 0.5)
P_abs_less_0_5 = norm.cdf(0.5, 0, 1) - norm.cdf(-0.5, 0, 1)  # P(-0.5 ≤ Z ≤ 0.5)

print("Bài 04) Xác suất với Z ~ N(0,1):")
print("  P(Z < 0.5) =", P_less_0_5)
print("  P(Z > 0.5) =", P_greater_0_5)
print("  P(|Z| < 0.5) =", P_abs_less_0_5)

# --- Các giá trị z chuẩn "1.96" theo cách diễn đạt đúng ---
z_p_less_0_975 = norm.ppf(0.975, loc=0, scale=1)  # z sao cho P(Z < z)=0.975
z_p_greater_0_025 = norm.isf(0.025, loc=0, scale=1)  # isf = inverse survival => z sao cho P(Z > z)=0.025
# P(|Z|<z)=0.95 => tương đương P(Z<z)=0.975 vì chuẩn đối xứng
z_abs_0_95 = norm.ppf(0.975, 0, 1)

print("  z sao cho P(Z < z)=0.975:", z_p_less_0_975)
print("  z sao cho P(Z > z)=0.025:", z_p_greater_0_025)
print("  z sao cho P(|Z| < z)=0.95:", z_abs_0_95)



In [None]:

# ==========================
# BÀI 05
# --------------------------
# Cho X ~ N(μ=10, σ=2).
# Tính:
#  - P(X < 12);  P(|X| < 12).
#  - "Tìm z thỏa mãn: P(X<z)=2.58; ..." là KHÔNG HỢP LÝ (2.58 không phải xác suất).
#    Ta chuyển về diễn đạt chuẩn hơn dựa trên z=2.58 là mốc phân vị chuẩn:
#       z_{0.995} ≈ 2.58, tương đương P(Z < 2.58)=0.995.
#    Nếu muốn tìm NGƯỠNG theo X:
#       t sao cho P(X < t) = 0.995  => t = μ + 2.58*σ
#       t sao cho P(X > t) = 0.995  => không tồn tại vì 0.995 > 0.5 (ý đúng phải là 0.005)
#       t sao cho P(|X| < t) = 0.995 => phải quy về chuẩn đối xứng quanh 0 (X không đối xứng quanh 0 do μ=10).
#  - Tìm t sao cho 25% giá trị không vượt quá t (t = phân vị 0.25).
#  - Tìm t sao cho 5% giá trị lớn hơn t (t = phân vị 0.95).
# ==========================

mu_x, sigma_x = 10, 2  # tham số của X

# --- Xác suất cơ bản ---
P_X_less_12 = norm.cdf(12, loc=mu_x, scale=sigma_x)              # P(X < 12)
P_absX_less_12 = norm.cdf(12, mu_x, sigma_x) - norm.cdf(-12, mu_x, sigma_x)  # P(-12 < X < 12)

print("Bài 05) Với X ~ N(10, 2):")
print("  P(X < 12) =", P_X_less_12)
print("  P(|X| < 12) =", P_absX_less_12)

# --- Liên hệ 2.58 là z_{0.995} của chuẩn tắc ---
z_0_995 = norm.ppf(0.995, 0, 1)  # ≈ 2.575829...
# Nếu muốn NGƯỠNG theo X tương ứng phân vị 0.995:
t_0_995 = norm.ppf(0.995, loc=mu_x, scale=sigma_x)  # μ + z*σ
# Nếu muốn NGƯỠNG sao cho P(X > t) = 0.995 (ý này không hợp lý), sửa ý đúng: P(X > t) = 0.005 (5 phần nghìn)
t_right_tail_0_005 = norm.isf(0.005, loc=mu_x, scale=sigma_x)    # phân vị 0.995 của X

print("  z_{0.995} (chuẩn tắc) ≈", z_0_995)
print("  t sao cho P(X < t)=0.995:", t_0_995)
print("  t sao cho P(X > t)=0.005 (đuôi phải 0.5%):", t_right_tail_0_005)

# --- Phân vị theo yêu cầu rõ ràng của đề ---
t_25 = norm.ppf(0.25, loc=mu_x, scale=sigma_x)   # 25% không vượt quá t => phân vị 0.25
t_95 = norm.ppf(0.95, loc=mu_x, scale=sigma_x)   # 5% lớn hơn t => P(X>t)=0.05 => t là phân vị 0.95

print("  t với 25% không vượt quá t (quantile 0.25):", t_25)
print("  t với 5% lớn hơn t (quantile 0.95):", t_95)
