# Họ và tên: Đỗ Tiến Đạt
# MSSV: 23120119
# Lớp: 23CTT2

## Chạy lần lượt từng đoạn cell từ trên xuống dưới để tránh bị lỗi mã nguồn.

In [16]:
class Matrix:
  '''
    A simple class for basic matrix operations: addition, multiplication, and summation.

    Attributes:
      data (list[list[float]]): 2D list representing the matrix.
      row (int): Number of rows.
      col (int): Number of columns.
  '''
  def __init__(self, data: list[list[float]]):
    '''
      Initializes a Matrix object.

      Parameters:
        data (list[list[float]]): 2D list representing the matrix elements.
    '''
    self.data = data
    self.row = len(data)
    self.col = len(data[0]) if data else 0

  def add(self, other: 'Matrix') -> 'Matrix':
    '''
      Adds two matrices of the same dimensions.

      Parameters:
        other (Matrix): The matrix to add.

      Returns:
        Matrix: A new matrix which is the sum of self and other.

      Raises:
        ValueError: If dimensions do not match.
    '''
    if self.row != other.row or self.col != other.col:
      raise ValueError('Matrix dimensions must match for addition')
    return Matrix(
        [[self.data[i][j] + other.data[i][j] for j in range(self.col)]
         for i in range(self.row)])

  def mul(self, other: 'Matrix') -> 'Matrix':
    '''
      Multiplies two matrices if dimensions are compatible.

      Parameters:
        other (Matrix): The matrix to multiply with.

      Returns:
        Matrix: A new matrix which is the result of self × other.

      Raises:
        ValueError: If the number of columns in self does not match rows in other.
    '''
    if self.col != other.row:
      raise ValueError('Matrix dimensions must match for multiplication')
    return Matrix(
        [[sum(self.data[i][k]*other.data[k][j] for k in range(self.col))
          for j in range(other.col)] for i in range(self.row)])

  def sum_matrix(self) -> float:
    '''
      Computes the sum of all elements in the matrix.

      Returns:
        float: Sum of all matrix elements.
    '''
    return sum(self.data[i][j] for j in range(self.col) for i in range(self.row))

  def __str__(self) -> str:
    '''
      Returns a string representation of the matrix with formatted rows.

      Returns:
        str: Formatted string of matrix rows.
    '''
    return '\n'.join(['\t'.join(f'{x:.7f}' for x in row) for row in self.data])
  def __repr__(self) -> str:
    '''
      Returns the same string as __str__ for debugging.

      Returns:
        str: Formatted string of matrix.
    '''
    return self.__str__()

## Xích Markov

### a. Mô tả biến ngẫu nhiên $X_n$, từ đó xác định ma trận chuyển trạng thái $P$ và vector phân phối đầu $\pi_0$

- Đặt $X_n$ = $S_n \text{ mod } 7$, khi đấy $X_n$ là xích Markov vì kết quả của $X_n$ chỉ phụ thuộc vào kết quả của tổng $S_{n-1}$ trước đó và phụ thuộc vào kết quả tung xúc xắc hiện tại.
- Ma trận chuyển trạng thái $P$ và vector phân phối đầu vào $\pi_0$ được mô tả như sau

In [17]:
P = Matrix(
    [[0 if i == j else 1/6 for j in range(7)] for i in range(7)])

print('Transition matrix')
print(P)

print('Intial state distribution')
p = Matrix([[1, 0, 0, 0, 0, 0, 0]])
print(p)

Transition matrix
0.0000000	0.1666667	0.1666667	0.1666667	0.1666667	0.1666667	0.1666667
0.1666667	0.0000000	0.1666667	0.1666667	0.1666667	0.1666667	0.1666667
0.1666667	0.1666667	0.0000000	0.1666667	0.1666667	0.1666667	0.1666667
0.1666667	0.1666667	0.1666667	0.0000000	0.1666667	0.1666667	0.1666667
0.1666667	0.1666667	0.1666667	0.1666667	0.0000000	0.1666667	0.1666667
0.1666667	0.1666667	0.1666667	0.1666667	0.1666667	0.0000000	0.1666667
0.1666667	0.1666667	0.1666667	0.1666667	0.1666667	0.1666667	0.0000000
Intial state distribution
1.0000000	0.0000000	0.0000000	0.0000000	0.0000000	0.0000000	0.0000000


### b. Tính xác suất xuất hiện các giá trị phần dư của $S_n$ khi chia cho $7$

In [18]:
import pandas as pd

def cal_prob_marginal(n = 10):
  '''
  Calculates the probability distribution of S_n % 7 over n steps.

  Parameters:
    n (int): Number of steps to compute (default is 10).

  Returns:
    pd.DataFrame: Probabilities of S_n % 7 = 0 to 6 for each step.
  '''
  result = {
      'S_n % 7 = 0': [],
      'S_n % 7 = 1': [],
      'S_n % 7 = 2': [],
      'S_n % 7 = 3': [],
      'S_n % 7 = 4': [],
      'S_n % 7 = 5': [],
      'S_n % 7 = 6': []
  }
  p_ = p

  for _ in range(n):
    p_ = p_.mul(P)
    for i in range(7):
      result[f'S_n % 7 = {i}'].append(p_.data[0][i])

  df = pd.DataFrame(result, index=[f'n = {i}' for i in range(1, n + 1)])
  return df

In [19]:
df = cal_prob_marginal()
df

Unnamed: 0,S_n % 7 = 0,S_n % 7 = 1,S_n % 7 = 2,S_n % 7 = 3,S_n % 7 = 4,S_n % 7 = 5,S_n % 7 = 6
n = 1,0.0,0.166667,0.166667,0.166667,0.166667,0.166667,0.166667
n = 2,0.166667,0.138889,0.138889,0.138889,0.138889,0.138889,0.138889
n = 3,0.138889,0.143519,0.143519,0.143519,0.143519,0.143519,0.143519
n = 4,0.143519,0.142747,0.142747,0.142747,0.142747,0.142747,0.142747
n = 5,0.142747,0.142876,0.142876,0.142876,0.142876,0.142876,0.142876
n = 6,0.142876,0.142854,0.142854,0.142854,0.142854,0.142854,0.142854
n = 7,0.142854,0.142858,0.142858,0.142858,0.142858,0.142858,0.142858
n = 8,0.142858,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857
n = 9,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857
n = 10,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857,0.142857


### c. Kiểm tra Xích Markov có tồn tại phân phối dừng hay không? Nếu có, hãy tính phân phối dừng và xác định thời điểm $t \in \mathbb{N}$ sao cho phân phối xác suất $\pi_t$ chính là phân phối dừng.

In [20]:
def is_exists_stationary(p, P, iter=1000, eps=1e-6):
  '''
  Checks if a stationary distribution exists for a Markov chain.

  Parameters:
    p (pd.DataFrame): Initial probability vector.
    P (pd.DataFrame): Transition matrix.
    iter (int): Maximum number of iterations (default is 1000).
    eps (float): Convergence threshold (default is 1e-6).

  Returns:
    None: Prints whether a stationary distribution is found.
  '''
  p_old = p
  for t in range(iter):
    p_new = p_old.mul(P)

    if all(abs(p_new.data[0][i] - p_old.data[0][i]) < eps for i in range(7)):
      print(f'Yes - Stationary distribution found at iteration {t}: {p_new}')
      return
    p_old = p_new
  print('No - Stationary distribution not found within the given iterations.')

In [21]:
is_exists_stationary(p, P)

Yes - Stationary distribution found at iteration 8: 0.1428571	0.1428572	0.1428572	0.1428572	0.1428572	0.1428572	0.1428572


### d. Tính xác suất xảy ra biến cố "$S_n$ chia hết cho $7$ mà sử dụng nhiều nhất $n$ lần tung xúc xắc."

**Xác suất có ít nhất một lần tổng các lần tung xúc xắc chia hết cho 7 sau tối đa n lần tung:**

- Đặt $Y_n = \{k \in \{1,\dots,n  \} | \space X_k = 0 \}$
- Đặt $T = \text{min}\{k \in \{1,\dots,n \} | \space X_l \ne 0, \forall 1 \leq l < k, X_k = 0  \}$ \\
- Xác suất ta cần tính là $P(Y_n)$.
- Nhận xét:
\begin{align*}
 &Y_n = \{T \le n \} \\
 &P(Y_n) = P(X_k = 0 \space \text{for some } k \in \{1,2,\dots,n \}) \\
 &P(T=k) = P(X_1 \ne 0, X_2 \ne 0,\dots,X_{k-1} \ne 0, X_k = 0)\\
 &P(T=k|X_{k-1}=s)=P(X_k=0|X_{k-1}=s)=P_{s,0}, \quad s \ne 0
\end{align*}

- Ta có:
\begin{align*}
P(Y_n) &= P(T \le n) = \sum_{k=1}^n P(T=k) \\
\end{align*}
- Và
\begin{align*}
P(T=k) &= \sum_{i=0}^{6}P(T=k|X_0=i)P(X_0=i) \quad \text{(LOTP)} \\
  &= P(T=k|X_0=0) \\
  &= \sum_{r \ne 0} P(T=k, X_1=r|X_0=0) \\
  &= \sum_{r \ne 0} P(T=k | X_1 = r)P(X_1=r|X_0=0) \quad \text{(Bayes and Markov property)} \\
  &= \sum_{r,s \ne 0} P(T=k, X_{k-1} = s| X_1 = r)P(X_1=r|X_0=0) \\
  &= \sum_{r,s \ne 0} P(T=k|X_{k-1}=s)P(X_{k-1}=s|X_1=r)P(X_1=r|X_0=0)\\
  &= \sum_{r,s \ne 0} P_{s,0}P_{r,s}^{(k-2)}P_{0,r} \\
  &= \dfrac{1}{36} \sum_{r,s \ne 0} P_{s,r}^{(k-2)}
\end{align*}
- Do đó ta có:
\begin{align*}
P(Y_n) = \sum_{k=1}^n P(T=k) = \dfrac{1}{36} \sum_{k=2}^n \sum_{r,s \ne 0} P_{s,r}^{(k-2)} , \quad \forall n \ge 2
\end{align*}
- Với $n=1$ thì $P(Y_1) = P(X_1 = 0) = 0$ vì lần gieo xúc xắc đầu tiên luôn nhận giá trị trong tập $\{1,2,\dots,6\}$
- Nên ta có
$$
P(Y_n) =
\begin{cases}
 \dfrac{1}{36} \sum_{k=2}^n \sum_{r,s \ne 0} P_{s,r}^{(k-2)} \quad \text{if $n \ge 2$}  \\
 0 \quad \text{if $n=1$}
\end{cases}
$$

In [33]:
Q = Matrix(
    [[P.data[i][j] for j in range(1,7)] for i in range(1,7)])

def prob_sum_divisible_by_7(n: int, Q = Q):
  '''
  Computes the probability that the sum of n independent fair dice rolls
  is divisible by 7.

  Parameters:
    n (int): Number of dice rolled (n >= 1).
    Q (Matrix): Transition matrix for states 1–6 modulo 7.

  Returns:
    float: Probability that the total sum modulo 7 equals 0.
  '''
  if n == 1:
    return 0

  if n == 2:
    return 1/6

  Q_ = Q
  res = 0
  for _ in range(2,n):
    res += Q_.sum_matrix()
    Q_ = Q_.mul(Q)
  return (1/36)*(res + 6)

In [35]:
n = 50
r = prob_sum_divisible_by_7(n)
print(f'Probability that the sum of {n} dice rolls is divisible by 7: {r:.7f}')

Probability that the sum of 50 dice rolls is divisible by 7: 0.9998681
