## Họ và Tên: Lâm Quang Phú
## MSSV: 21094601

In [1]:
import numpy as np
from scipy import integrate  
from scipy import stats as st
import sympy as sp

## Bài 1:
Viết hàm tính kỳ vọng theo định nghĩa như sau:
- Kỳ vọng (expected value): là giá trị trung bình sau khi lặp lại một thí nghiệm vô số lần
- Ký hiệu: E(X)

- **Biến ngẫu nhiên rời rạc**
$$ \mu = E(x) = \sum_{x} xf(x) $$

In [2]:
def expected_values_discrete(variable_value, probaliti):
    if len(variable_value)!= len(probaliti):
        raise ValueError("Lỗi kích thước")
        
    return round(np.sum(np.array(variable_value)*np.array(probaliti)), 4)


In [3]:
variable_value = [0, 1, 2, 3]
probaliti = [1/6, 1/2, 3/10, 1/30]

print("Kỳ vọng của biến ngẫu nhiên rời rạc X:", expected_values_discrete(variable_value, probaliti))

Kỳ vọng của biến ngẫu nhiên rời rạc X: 1.2


- **Trường hợp biến ngẫu nhiên liên tục**
$$ \mu = E(x)= \int_{x} xf(x)$$

In [4]:
def expected_values_continuous(pdf_function, low, high):
    e_value, error = integrate.quad(lambda x: x*pdf_function(x), low, high)
    return round(e_value,4)
    

$f(x) = \frac{1}{450}*(30-x) $ với $x \in  [0, 30]$

In [5]:


def pdf_function(x):
    return 1/450*(30-x)

print("Kỳ vọng của biến ngẫu nhiên liên tục X: ", expected_values_continuous(pdf_function, 0, 30))

Kỳ vọng của biến ngẫu nhiên liên tục X:  10.0


## Bài 2:
Viết hàm tính phương sai theo định nghĩa như sau:
- Phương sai (variance): là trung bình của thổng bình phương độ lệch của tất cả giá trị của biến ngẫu nhiên so với giá trị kỳ vọng
- Ký hiệu: $$ \sigma^2 , var(x), V(x) $$
- Công thức:
**+ Trường hợp biến ngẫu nhiên rời rạc**
$$ \sigma^2 = E[(X- \mu )^2] = \sum _{x} f(x)(x- \mu)^2 = E(X^2) - \mu^2 = \sum _{x} x^2f(x) - \mu^2$$

In [6]:
def variance(variable_value, probaliti):
    if len(variable_value)!= len(probaliti):
        raise ValueError("Lỗi kích thước")
    
    ex = expected_values_discrete(variable_value, probaliti)
    tmp = (np.array(variable_value)-ex)**2 *np.array(probaliti)
    return np.sum(tmp)


variable_value = [0, 1, 2, 3]
probaliti = [1/6, 1/2, 3/10, 1/30]


print("Phương sai của biến ngẫu nhiên rời rạc X:", variance(variable_value, probaliti))

Phương sai của biến ngẫu nhiên rời rạc X: 0.56


- **Trường hợp biến ngẫu nhiên liên tục**
$$\sigma^2 = E[(X- \mu )^2] = \int _{x} f(x)(x- \mu)^2 = E(X^2) - \mu^2 = \int _{x} x^2f(x) - \mu^2$$

In [7]:
def variance_continuous(pdf_function, low, high):
    e_value, error = integrate.quad(lambda x: x*x*pdf_function(x), low, high) 
    
    return e_value - expected_values_continuous(pdf_function, low, high)**2
    
    

In [8]:
def pdf_function(x):
    return 1/450*(30-x)

print("Phương sai của biến ngẫu nhiên liên tục X: ",variance_continuous(pdf_function, 0, 30))

Phương sai của biến ngẫu nhiên liên tục X:  50.0


### Bài 3: 
Viết hàm tính độ lệch chuẩn theo định nghĩa như sau:

In [9]:
def standard_variation( variable_value =None, robaliti = None, pdf_function = None, low = None,  high = None):
    if probaliti == None or variable_value == None:
        return np.sqrt(variance_continuous(pdf_function, low, high))
    return np.sqrt(variance(variable_value, probaliti))


In [10]:
print("Độ lệch chuẩn của biến ngẫu nhiên rời rạc X:", standard_variation(variable_value, probaliti))
print("Độ lệch chuẩn của biến ngẫu nhiên liên tục X:", standard_variation(pdf_function = pdf_function, low = 0, high = 30))

Độ lệch chuẩn của biến ngẫu nhiên rời rạc X: 0.7483314773547883
Độ lệch chuẩn của biến ngẫu nhiên liên tục X: 7.0710678118654755


### Bài 4:






- **a. Một nhóm học sinh có 10 em, trong đó có 3 em học loại giỏi, 4 loại khá, còn lại là
trung bình. Từ nhóm đó chọn ngẫu nhiên ra 3 học sinh. Gọi X là số học sinh giỏi trong số
học sinh chọn ra**

Lập bảng phân phối xác suất của X, đưa dữ liệu bảng này vào file data.txt
Áp dụng các hàm đã viết ở 1,2,3 tính Kỳ vọng, Phương sai, Độ lệch chuẩn cho dữ liệu
biến ngẫy nhiên rời rạc được cung cấp ở file data.txt

|  X |   0 | 1  | 2  | 3  |
|---|---|---|---|---|
|  P(X) | 7/24  | 21/40  | 7/40  | /120  |


In [11]:
from scipy.special import comb

In [12]:
# Lập bảng phân phối và đưa dữ liệu vào file data.txt
cnt0_student_good = comb(7, 3)/ comb(10, 3)
cnt1_student_good = comb(3, 1)*comb(7, 2)/comb(10, 3)
cnt2_student_good = comb(3, 2)*comb(7, 1)/comb(10, 3)
cnt3_student_good = comb(3, 3)/comb(10, 3)


ls = [cnt0_student_good, cnt1_student_good, cnt2_student_good, cnt3_student_good]

with open("data.txt", "w") as f:
    for i in range(4):
        f.write(f"{i}: {ls[i]}\n")

In [13]:
#Phương sai, Độ lệch chuẩn cho dữ liệu biến ngẫy nhiên rời rạc được cung cấp ở file data.txt

variable_value = []
probaliti = []

with open("data.txt", "r") as f:
    
    for line in f:
        x, px = map(float, line.strip().split(':'))
        variable_value.append(x)
        probaliti.append(px)


print("Kỳ vọng của biến ngẫu nhiên rời rạc X:", expected_values_discrete(variable_value, probaliti))  
print("Phương sai của biến ngẫu nhiên rời rạc X:", variance(variable_value, probaliti))
print("Độ lệch chuẩn của biến ngẫu nhiên rời rạc X:", standard_variation(variable_value, probaliti))

Kỳ vọng của biến ngẫu nhiên rời rạc X: 0.9
Phương sai của biến ngẫu nhiên rời rạc X: 0.49000000000000005
Độ lệch chuẩn của biến ngẫu nhiên rời rạc X: 0.7000000000000001


- b. Áp dụng các hàm đã viết ở 1,2,3 tính Kỳ vọng, Phương sai, Độ lệch chuẩn cho dữ liệu
biến ngẫy nhiên liên tục như mô tả sau: \
Nhu cầu hàng năm về loại hàng hóa A là biến ngẫu nhiên liên tục X có hàm mật
độ xác suất như sau: (đơn vị: ngàn sản phẩm)

$f(x)  = \begin{Bmatrix}
k(30-x) \text{ voi x} \in [0, 30]
\\ 
0 x \notin  [0, 30]
\end{Bmatrix} $

Vì $\int_{-\infty}^{+\infty}f(x)  = 1$
$$ \int_{-\infty}^{0}f(x) + \int_{0}^{30}k(30-x) +\int_{30}^{+\infty}f(x) = 1$$
 $$  =>\int_{0}^{30}k(30-x) = 1$$

In [14]:
k =sp.Symbol('k')
x = sp.Symbol('x')
f =  30-x
k =sp.solve(k*sp.integrate(f, (x,0, 30))-1, k)[0]
print("K =", k)

K = 1/450


In [15]:
def f(x):
    return 1/450*(30-x)
#Kỳ vọng
print("Kỳ vọng của biến ngẫu nhiên liên tục X: ", expected_values_continuous(f, 0, 30))
#Phương sai
print("Phương sai của biến ngẫu nhiên liên tục X: ",variance_continuous(f, 0, 30))
# Độ lệch chuẩn
print("Độ lệch chuẩn của biến ngẫu nhiên liên tục X:", standard_variation(pdf_function = f, low = 0, high = 30))

Kỳ vọng của biến ngẫu nhiên liên tục X:  10.0
Phương sai của biến ngẫu nhiên liên tục X:  50.0
Độ lệch chuẩn của biến ngẫu nhiên liên tục X: 7.0710678118654755


- c. Sử dụng thư viện có sẵn tính Kỳ vọng, Phương sai, Độ lệch chuẩn cho dữ liệu ở câu a

In [16]:
variable_value = []
probaliti = []

with open("data.txt", "r") as f:
    
    for line in f:
        x, px = map(float, line.strip().split(':'))
        variable_value.append(x)
        probaliti.append(px)

In [17]:
from scipy.stats import rv_discrete
custom_discrete = rv_discrete(name='custom', values=(variable_value, probaliti))
print("Kỳ vọng của biến ngẫu nhiên rời rạc:",  custom_discrete.expect())
print("Phương sai của biến ngẫu ngiên rời rạc:", custom_discrete.std())
print("Độ lệch chuẩn của biến ngẫu ngiên rời rạc:", custom_discrete.var())

Kỳ vọng của biến ngẫu nhiên rời rạc: 0.9
Phương sai của biến ngẫu ngiên rời rạc: 0.7
Độ lệch chuẩn của biến ngẫu ngiên rời rạc: 0.49


- d. Sử dụng thư viện có sẵn tính Kỳ vọng, Phương sai, Độ lệch chuẩn cho dữ liệu ở câu b

In [28]:
from scipy import integrate
def pdf(x):
    if 0 <= x <= 30:
        return (30 - x) * 1/450
    else:
        return 0


mean_value, _ = integrate.quad(lambda x: x * pdf(x), 0, 30)

# Tính phương sai
variance_value, _ = integrate.quad(lambda x: (x - mean_value)**2 * pdf(x), 0, 30)

print("Kỳ vọng của biến ngẫu nhiên liên tục:",  mean_value)
print("Phương sai của biến ngẫu ngiên liên tục:", variance_value)
print("Độ lệch chuẩn của biến ngẫu ngiên liên tục:", np.sqrt(variance_value))


Kỳ vọng của biến ngẫu nhiên liên tục: 10.000000000000002
Phương sai của biến ngẫu ngiên liên tục: 50.0
Độ lệch chuẩn của biến ngẫu ngiên liên tục: 7.0710678118654755
