In [1]:
# Import các thư viện thông dụng
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# Import các distribution packages từ thư viện scipy
from scipy.stats import binom
from scipy.stats import poisson
from scipy.stats import norm
from scipy.stats import t
# ví dụ các hàm:
# rsv
from scipy.stats import binom, poisson, norm

# Nhị thức: 10 lần thử, xác suất thành công 0.3
print(binom.rvs(n=10, p=0.3, size=10))

# Poisson: Trung bình 4 sự kiện
print(poisson.rvs(mu=4, size=10))

# Chuẩn: Trung bình 170, độ lệch chuẩn 10
print(norm.rvs(loc=170, scale=10, size=10))

# 2️⃣ pmf – Probability Mass Function (Hàm xác suất rời rạc)
# 🔹 Chức năng: Tính xác suất của một giá trị cụ thể cho phân phối rời rạc.
# 🔹 Áp dụng: Chỉ dùng cho phân phối rời rạc (Binomial, Poisson).

# 📌 Ví dụ: Tính xác suất:

# X = 3 trong phân phối Nhị thức với 𝑛=10,𝑝=0.3

# X = 2 trong phân phối Poisson với 𝜆=4
print(binom.pmf(k=3, n=10, p=0.3))  # P(X=3) trong B(10, 0.3)
print(poisson.pmf(k=2, mu=4))       # P(X=2) trong Poisson(4)

# pdf – Probability Density Function (Hàm mật độ liên tục)
# 🔹 Chức năng: Trả về giá trị mật độ xác suất cho một điểm trong phân phối liên tục.
# 🔹 Áp dụng: Chỉ dùng cho phân phối liên tục (Normal).

# 📌 Ví dụ: Mật độ xác suất tại x = 170 trong phân phối chuẩn sigma= 10, mu=170
print(norm.pdf(x=170, loc=170, scale=10))  # f(170) trong N(170, 10)

# cdf – Cumulative Distribution Function (Hàm phân phối tích lũy)
# 🔹 Chức năng: Tính xác suất 𝑃(𝑋≤𝑥) - Xác suất tích lũy đến giá trị x.
# 🔹 Áp dụng: Dùng cho cả phân phối rời rạc và liên tục.

# 📌 Ví dụ:

# Xác suất ≤3 câu đúng trong bài thi 10 câu (B(10, 0.3)).
# Xác suất ≤2 sự kiện xảy ra trong Poisson(4).
# Xác suất chiều cao ≤170 cm trong Normal(170,10).
print(binom.cdf(k=3, n=10, p=0.3))  # P(X≤3) trong B(10, 0.3)
print(poisson.cdf(k=2, mu=4))       # P(X≤2) trong Poisson(4)
print(norm.cdf(x=170, loc=170, scale=10))  # P(X≤170) trong N(170, 10)

#  ppf – Percent Point Function (Inverse of CDF)
# 🔹 Chức năng: Tìm giá trị x sao cho 𝑃(𝑋≤𝑥)=𝑝
# 🔹 Áp dụng: Dùng để tìm giá trị phân vị.

# 📌 Ví dụ:
# Tìm phân vị 90% của Normal(170,10) → Giá trị x sao cho P(X ≤ x) = 0.9.
# Tìm phân vị 50% của Poisson(4).
print(norm.ppf(q=0.9, loc=170, scale=10))  # Giá trị x sao cho P(X≤x) = 0.9
print(poisson.ppf(q=0.5, mu=4))            # Giá trị x sao cho P(X≤x) = 0.5

#  sf – Survival Function (1 - CDF)
# 🔹 Chức năng: Tính xác suất P(X > x) (xác suất còn lại).
# 🔹 Áp dụng: Dùng khi cần xác suất còn lại thay vì tích lũy.

# 📌 Ví dụ:

# Xác suất >3 câu đúng trong B(10,0.3).
# Xác suất >2 sự kiện trong Poisson(4).
# Xác suất chiều cao >170 cm trong Normal(170,10).
print(binom.sf(k=3, n=10, p=0.3))  # P(X>3) = 1 - P(X≤3)
print(1-binom.cdf(k=3,n=10,p=0.3))
print(poisson.sf(k=2, mu=4))       # P(X>2) = 1 - P(X≤2)
print(norm.sf(x=170, loc=170, scale=10))  # P(X>170) = 1 - P(X≤170)

# 7️⃣ isf – Inverse Survival Function (Ngược của SF)
# 🔹 Chức năng: Tìm giá trị x sao cho P(X>x)=p
# 🔹 Áp dụng: Dùng để tìm điểm cắt phía trên.

# 📌 Ví dụ:

# 10% trên cùng của phân phối chuẩn N(170,10).
# 5% trên cùng của Poisson(4).
print(norm.isf(q=0.1, loc=170, scale=10))  # Giá trị x sao cho P(X>x) = 0.1
print(poisson.isf(q=0.05, mu=4))           # Giá trị x sao cho P(X>x) = 0.05


[3 4 2 3 4 2 5 3 2 4]
[5 4 4 5 6 2 9 5 3 4]
[150.03054773 160.32148438 162.80580264 178.48681615 175.10280906
 158.71548294 165.40043146 172.23130438 174.80345601 158.47425914]
0.2668279319999998
0.14652511110987343
0.03989422804014327
0.6496107184000001
0.23810330555354436
0.5
182.815515655446
4.0
0.35038928159999994
0.35038928159999994
0.7618966944464556
0.5
182.815515655446
8.0


![image.png](attachment:c9f406ac-5012-436d-a316-4d3ed78fa082.png)

In [2]:
print(binom.pmf(k=2,n=10,p=0.25))

0.28156757354736334


![image.png](attachment:17ed10dd-338d-4711-aee7-cd05e60cacc1.png)

In [3]:
# a
print(binom.pmf(k=3,n=2000,p=1/1000))
# b
print(binom.cdf(3,2000,1/1000))
print(1-binom.sf(3,2000,1/1000))
# c
print(binom.sf(3,2000,1/1000))
print(1-binom.cdf(3,2000,1/1000))

0.18053732803180345
0.857213766793324
0.857213766793324
0.142786233206676
0.14278623320667605


![image.png](attachment:6b2eb221-ee75-4064-b15a-cc65e58faa77.png)

In [4]:
print((binom.pmf(2,4,0.5)+binom.pmf(2,4,0.5))/2)
print((binom.pmf(1,4,0.5)+binom.pmf(3,4,0.5))/2)
print(binom.pmf(4,4,0.5))

0.375
0.25
0.0625


![image.png](attachment:56bd3307-14aa-4796-8826-b946458d9ab3.png)

![image.png](attachment:a9d4601c-152a-4d44-841a-94d9b9cf60b6.png)

![image.png](attachment:7add1b00-248f-423c-955a-5436c0670613.png)

In [5]:
# a
print(binom.pmf(1,10,0.07))
print(1 - binom.pmf(0,10,0.07))
print(binom.sf(0,10,0.07))
print(1-binom.cdf(1,10,0.07))
print(binom.cdf(1,10,0.07))
#b
print(binom.isf(0.1,10,0.07))

0.3642877580919411
0.516017692820707
0.5160176928207068
0.15172993472876573
0.8482700652712343
2.0


In [6]:
# Thông số
import math
p = 0.07  # Xác suất phế phẩm

# Giải bất phương trình (1 - p)^n <= 0.1
n_min = math.log(0.1) / math.log(1 - p)

# Làm tròn lên vì số sản phẩm phải là số nguyên
n_min = math.ceil(n_min)
n_min

32

![image.png](attachment:f4e38fe7-290c-46ea-969d-64185d27bcf7.png)

![image.png](attachment:8fb0984b-d7a7-4cfd-997f-c00d7ea9653c.png)

In [7]:
import math
print(20*0.6)
print(math.sqrt(20*0.6*0.4))
print(binom.cdf(10,20,0.6))
print(binom.sf(12,20,0.6))
print(binom.pmf(11,20,0.6))

12.0
2.1908902300206647
0.24466279668360713
0.41589293755753576
0.1597384780041684


In [8]:
print(binom.ppf(0.1,10,0.07))

0.0


In [9]:
target_prob = 0.9
n_min = binom.isf(1 - target_prob, n=10, p=0.07)
print(f"Số sản phẩm tối thiểu cần kiểm tra: {n_min}")

Số sản phẩm tối thiểu cần kiểm tra: 2.0


In [10]:
print(norm.isf(0.1,50,10))

62.815515655446006


In [11]:
n_min = 0
while True:
    prob_at_least_1_n = 1 - binom.pmf(0, n_min, p)
    if prob_at_least_1_n >= 0.9:
        break
    n_min += 1

print(n_min)

32


In [12]:
from scipy.stats import norm

mean = 50  # Trung bình
std = 10   # Độ lệch chuẩn

# Tìm điểm thấp nhất của top 10%
x_90 = norm.ppf(0.90, mean, std)
print(f"Điểm thấp nhất của top 10% sinh viên cao nhất: {x_90:.2f}")
x_90_1 = norm.isf(0.1, mean, std)
print(f"Điểm thấp nhất của top 10% sinh viên cao nhất: {x_90_1:.2f}")

Điểm thấp nhất của top 10% sinh viên cao nhất: 62.82
Điểm thấp nhất của top 10% sinh viên cao nhất: 62.82


In [13]:
print(norm.cdf(175,170,5))

0.8413447460685429


![image.png](attachment:ad2c295d-735e-4b63-9cfa-02bbccd69f71.png)

![image.png](attachment:6200d5c5-68d9-4f17-9238-f2b8e1145700.png)

In [14]:
norm_cdf_90 = norm.cdf(91,100,15)
norm_cdf_130 = norm.cdf(130, 100, 15)
norm_90_to_130 = norm_cdf_130 - norm_cdf_90
1- norm_90_to_130
# norm.pdf(91,100,15)

np.float64(0.29700324969825287)

![image.png](attachment:767986fd-1624-49d9-a526-448eda30b728.png)

In [15]:
print(binom.pmf(0,20,0.01))
print(binom.pmf(1,20,0.01))
print(binom)

0.817906937597231
0.16523372476711734
<scipy.stats._discrete_distns.binom_gen object at 0x000001951AC84B00>
