### **Đồ án Final - Toán ứng dụng và Thống kê - Applied Mathematics and Statistics**

### **Phần 2: Markov Chain**

Đề bài: Cho một con xúc xắc cân bằng có 6 mặt được đánh số từ 1 đến 6. Gọi $S_n$ là tổng các kết quả sau khi tung xúc xắc n lần đầu tiên. Ta muốn khảo sát phân phối của giá trị phần dư của $S_n$ khi chia cho 7.

### **Câu a: Hãy mô tả biến ngẫu nhiên Xn phù hợp cho bài toán trên mà có tính chất Markov. Từ đó, xác định ma trận chuyển trạng thái P và vectơ phân phối đầu π0**

#### 1. Xác định biến ngẫu nhiên $X_n$:

Mỗi lần tung xúc xắc, kết quả sẽ là 1 trong các số từ 1 đến 6 sau đó cộng dồn lại vào tổng $S_n$. Giá trị phần dư của $S_n$ khi chia cho 7 sẽ là một trong các giá trị từ 0 đến 6. Vì mỗi lần tung xúc xắc chỉ ảnh hưởng đến giá trị phần dư hiện tại, không phụ thuộc vào các kết quả trước đó, nên bài toán trên có tính chất Markov và có thể miêu tả biến ngẫu nhiên $X_n$ như sau:

- Biến ngẫu nhiên $X_n$ = $S_n$ % 7 = $\{0, 1, 2, 3, 4, 5, 6\}$

#### 2. Xác định ma trận chuyển trạng thái P:

Ma trận chuyển trạng thái $P$ sẽ được xây dựng dựa trên xác suất chuyển từ trạng thái này sang trạng thái khác. Cụ thể:

Khi đang ở trạng thái $i$, sau một lần tung xúc xắc, ta có thể chuyển đến các trạng thái $(i + j) \mod 7$ với xác suất $\frac{1}{6}$ cho mỗi $j = 1, 2, 3, 4, 5, 6$. Do đó, ma trận chuyển trạng thái $P$ sẽ có dạng:

$
P = \begin{bmatrix}
0 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
1/6 & 0 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 \\
1/6 & 1/6 & 0 & 1/6 & 1/6 & 1/6 & 1/6 \\
1/6 & 1/6 & 1/6 & 0 & 1/6 & 1/6 & 1/6 \\
1/6 & 1/6 & 1/6 & 1/6 & 0 & 1/6 & 1/6 \\
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 0 & 1/6 \\
1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 1/6 & 0
\end{bmatrix}
$

#### 3. Xác định vectơ phân phối đầu $\pi_0$:

$\pi_0$ = 
$\begin{bmatrix} 
1 \\
0 \\
0 \\
0 \\
0 \\
0 \\
0
\end{bmatrix}$

Vì khi bắt đầu, tổng $S_0 = 0$, nên phần dư của $S_0$ khi chia cho 7 là 0. Do đó, xác suất $P(X_0 = 0) = 1$ và các xác suất khác là 0.

### **Câu b: Viết hàm dùng để tính xác suất xuất hiện các giá trị phần dư của $S_n$ khi chia cho 7**

#### Import các thư viện cần thiết

In [1]:
import pandas as pd

### Các hàm hỗ trợ trong việc tính xác suất:

Vector phân phối đầu vào $\pi_0$

In [2]:
pi_0 = [[1], [0], [0], [0], [0], [0], [0]]

Hàm tạo ma trận 0 với n dòng và m cột

In [3]:
def create_zero_matrix(n_row, n_col):
    return [[0 for _ in range(n_col)] for _ in range(n_row)]

Hàm tạo ma trận chuyển trạng thái P:

- Hàm này sẽ tạo ra ma trận chuyển trạng thái $P$ dựa trên câu a.

In [4]:
def create_transition_matrix():
    P = create_zero_matrix(7, 7)
    for i in range(7):
        for dice in range(1, 7):
            j = (i + dice) % 7
            P[j][i] += 1/6
    return P

Hàm nhân 2 ma trận A và B:

- Hàm này sẽ nhân 2 ma trận với nhau. Điều kiện là số cột của ma trận A phải bằng số dòng của ma trận B.

In [5]:
def matrix_multiply(A, B):
    rows_A, cols_A = len(A), len(A[0])
    rows_B, cols_B = len(B), len(B[0])
    
    if cols_A != rows_B:
        raise ValueError("Number of columns in A must equal number of rows in B")
    
    result = create_zero_matrix(rows_A, cols_B)
    for i in range(rows_A):
        for j in range(cols_B):
            for k in range(cols_A):
                result[i][j] += A[i][k] * B[k][j]
    return result

In [6]:
def matrix_multiply(A, B):
    rows_A, cols_A = len(A), len(A[0])
    rows_B, cols_B = len(B), len(B[0])
    
    if cols_A != rows_B:
        raise ValueError("Number of columns in A must equal number of rows in B")
    
    result = create_zero_matrix(rows_A, cols_B)
    for i in range(rows_A):
        for j in range(cols_B):
            for k in range(cols_A):
                result[i][j] += A[i][k] * B[k][j]
    return result

Hàm lũy thừa ma trận

- Hàm này sẽ tính lũy thừa của ma trận $P$ với số mũ là $n$. Sử dụng lại hàm nhân ma trận đã định nghĩa ở trên.

In [7]:
def matrix_power(matrix, n):
    size = len(matrix)
    result = create_zero_matrix(size, size)
    for i in range(size):
        result[i][i] = 1

    for _ in range(n):
        result = matrix_multiply(matrix, result)
    return result

Hàm tính phân phối xác suất của các giá trị phần dư của $S_n$ khi chia cho 7 sau $n$ lần tung xúc xắc:

- Để có thể tính được xác suất xuất hiện các giá trị phần dư của $S_n$ khi chia cho 7 sau $n$ lần tung, ta sẽ sử dụng công thức:

$$
\pi_n = P^n \cdot \pi_0
$$

In [8]:
def compute_distribution_after_n_steps(P, n):
    pi_n = matrix_multiply(matrix_power(P, n), pi_0)
    return [round(x[0], 6) for x in pi_n]

Thực hiện tính toán. Sử dụng dataframe trong thư viện pandas để lưu trữ và hiển thị kết quả cho dễ nhìn.

In [11]:
# tao ma tran P
P = create_transition_matrix()

results = []
for n in range(1, 11):
    dist = compute_distribution_after_n_steps(P, n)
    row = [n] + dist
    results.append(row)

columns = ['n'] + [f'S%7={i}' for i in range(7)]
df = pd.DataFrame(results, columns=columns)

df.style.hide(axis='index')

n,S%7=0,S%7=1,S%7=2,S%7=3,S%7=4,S%7=5,S%7=6
1,0.0,0.166667,0.166667,0.166667,0.166667,0.166667,0.166667
2,0.166667,0.138889,0.138889,0.138889,0.138889,0.138889,0.138889
3,0.138889,0.143519,0.143519,0.143519,0.143519,0.143519,0.143519
4,0.143519,0.142747,0.142747,0.142747,0.142747,0.142747,0.142747
5,0.142747,0.142876,0.142876,0.142876,0.142876,0.142876,0.142876
6,0.142876,0.142854,0.142854,0.142854,0.142854,0.142854,0.142854
7,0.142854,0.142858,0.142858,0.142858,0.142858,0.142858,0.142858
8,0.142858,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857
9,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857
10,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857


Ví dụ: Xác suất để phần dư của $S_n$ khi chia cho 7 là 1 sau 3 lần tung xúc xắc sẽ là $\pi_3[1] = 0.143519$.

#### Câu c: Viết hàm dùng để kiểm tra xích Markov đã cho có tồn tại phân phối dừng hay không. Nếu có, hãy tính phân phối dừng và chỉ ra thời điểm t ∈Nsao cho phân phối xác suất πt chính là phân phối dừng.

Markov Chain tồn tại phân phối dừng khi tồn tại $t \in \mathbb{N}$ sao cho $\pi_{n+1} \approx \pi_n$.

Em sẽ kiểm tra bằng cách lặp lại thông qua 1 vòng for việc nhân ma trận chuyển trạng thái $P$ với phân phối xác suất $\pi_n$ cho đến khi phân phối xác suất không thay đổi nhiều nữa (được xác định bằng một ngưỡng nhỏ $\epsilon$).

Hàm kiểm tra sự hội tụ: so sánh hai vector `vec1` và `vec2` với ngưỡng sai số `epsilon`. Nếu độ chênh lệch giữa các phần tử tương ứng nhỏ hơn `epsilon` thì coi như đã hội tụ.

In [12]:
def is_converged(vec1, vec2, epsilon=1e-8):
    for a, b in zip(vec1, vec2):
        if abs(a - b) > epsilon:
            return False
    return True

Hàm tính $\pi_n$ cho đến khi hội tụ:

In [13]:
def markov_stationary_distribution(P, max_steps=1000, epsilon=1e-8):
	pi_0 = [[1], [0], [0], [0], [0], [0], [0]] 
	
	for t in range(1, max_steps + 1):
		next_pi = matrix_multiply(P, pi_0)
		if is_converged([x[0] for x in pi_0], [x[0] for x in next_pi], epsilon):
			print(f"Phân phối dừng tồn tại tại thời điểm t = {t}")
			print("Phân phối dừng:")
			for i, prob in enumerate(next_pi):
				print(f"π[{i}] = {prob[0]:.6f}")
			return next_pi, t
		pi_0 = next_pi
	
	print("Không tìm thấy phân phối dừng trong step cho trước")
	return pi_0, max_steps


In [14]:
result = markov_stationary_distribution(P)

Phân phối dừng tồn tại tại thời điểm t = 12
Phân phối dừng:
π[0] = 0.142857
π[1] = 0.142857
π[2] = 0.142857
π[3] = 0.142857
π[4] = 0.142857
π[5] = 0.142857
π[6] = 0.142857


In [15]:
# tính p ^ 3
P_3 = matrix_power(P, 3)

for i in range(7):
    print(f"{P_3[i]}")

[0.13888888888888887, 0.1435185185185185, 0.1435185185185185, 0.1435185185185185, 0.14351851851851852, 0.14351851851851852, 0.14351851851851852]
[0.1435185185185185, 0.13888888888888887, 0.1435185185185185, 0.1435185185185185, 0.14351851851851852, 0.14351851851851852, 0.14351851851851852]
[0.1435185185185185, 0.1435185185185185, 0.13888888888888887, 0.1435185185185185, 0.14351851851851852, 0.14351851851851852, 0.14351851851851852]
[0.1435185185185185, 0.1435185185185185, 0.1435185185185185, 0.13888888888888887, 0.14351851851851852, 0.14351851851851852, 0.14351851851851852]
[0.1435185185185185, 0.1435185185185185, 0.1435185185185185, 0.14351851851851852, 0.13888888888888887, 0.14351851851851852, 0.14351851851851852]
[0.1435185185185185, 0.1435185185185185, 0.1435185185185185, 0.14351851851851852, 0.14351851851851852, 0.13888888888888887, 0.14351851851851852]
[0.1435185185185185, 0.1435185185185185, 0.1435185185185185, 0.14351851851851852, 0.14351851851851852, 0.14351851851851852, 0.1388

Nhận thấy: tồn tại n sao cho mọi số hạng của $P^n$ đều là số dương. Nên ma trận chuyển P là ma trận chính quy => Phân phối giới hạn cũng là phân phối dừng duy nhất.

#### Câu d: Quá trình tung xúc xắc được diễn ra cho đến khi tồn tại i ∈N∗ sao cho giá trị Si chia hết cho 7 thì dừng. Viết hàm tính xác suất tung xúc xắc không quá n lần với giá trị n là một trong những đầu vào của hàm.

Xác suất tổng chia hết cho 7 (phần dư là 0) sau không quá n lần tung.

Ta có : $\pi_0 =
\begin{bmatrix}
1 \\
0 \\
0 \\
0 \\
0 \\
0 \\
0
\end{bmatrix}
$

#### Giải thích thuật toán:

Để tính xác suất dừng trong không quá n lần tung, ta sử dụng công thức:

**$\pi_{t+1} = P \times \pi_t$**

Trong đó:
- $\pi_t$ là vector phân phối xác suất tại bước t
- $P$ là ma trận chuyển trạng thái

#### Các bước thực hiện:

**Bước 1: Khởi tạo**
- $\pi_0 = [1, 0, 0, 0, 0, 0, 0]$ (bắt đầu từ trạng thái 0)

**Bước 2: Tại mỗi bước t từ 1 đến n**
1. Tính $\pi_t = P \times \pi_{t-1}$
2. Lấy xác suất dừng tại bước t: $\pi_t[0]$
3. Cộng vào tổng xác suất dừng tích lũy
4. **Reset $\pi_t[0] = 0$** để không đếm lại những trường hợp đã dừng

**Bước 3: Kết quả**
- Trả về tổng xác suất dừng tích lũy

#### Ví dụ chi tiết:

**Bước 1:** $\pi_1 = P \times \pi_0 = [0, 1/6, 1/6, 1/6, 1/6, 1/6, 1/6]$
- Xác suất dừng bước 1: 0 (vì 1,2,3,4,5,6 đều không chia hết cho 7)

**Bước 2:** $\pi_2 = P \times \pi_1$ (sau reset) = $[1/6, 1/36, 5/36, 5/36, 5/36, 5/36, 1/36]$
- Xác suất dừng bước 2: 1/6
- Các cách: 1+6, 2+5, 3+4, 4+3, 5+2, 6+1 → $6 \times \frac{1}{6} \times \frac{1}{6} = \frac{1}{6}$
- Reset $\pi_2[0] = 0$, tiếp tục...

In [16]:
def detailed_stop_probability_steps(n):
    P = create_transition_matrix()
    pi = [[1.0], [0.0], [0.0], [0.0], [0.0], [0.0], [0.0]]  # π_0
    
    total_stop_prob = 0.0

    for step in range(1, n + 1):
        # Tính π_t = P × π_{t-1}
        pi = matrix_multiply(P, pi)

        prob_stop_at_step = pi[0][0]
        total_stop_prob += prob_stop_at_step

        # print(f"P(dừng trong ≤{step} bước) = {total_stop_prob: .6f}")

        # Reset π_t[0] = 0
        pi[0][0] = 0.0
        
    print(f"P(dừng trong ≤{step} bước) = {total_stop_prob: .6f}")

In [None]:
n = 10 # thay doi gia tri cua n
detailed_stop_probability_steps(n)

P(dừng trong ≤10 bước) =  0.806193
