## **Student Information**
__Môn học: Toán Ứng dụng và Thống kê__

__Họ tên: Bế Lã Anh Thư__

__Lớp: 22CLC02__

__MSSV: 22127402__


# 1) Cài đặt thủ công

## <center> **Thuật giải Gram-Schmidt** </center>

**Input**: Họ các vector $u_1, u_2,...,u_n$ có cùng kích thước.

**Output**: Họ trực giao $v_1, v_2,...,v_k$ là các cơ sở của $S(u_1, u_2,...,u_k$).

Giải thuật được thực hiện với các bước như sau:
- Bước 1: Cho $v_1 = u_1$. Nếu $v_1 = 0$, không độc lập tuyến tính.
- Bước 2: Cho $v_2 = u_2 - \frac{\langle u_2, v_1 \rangle}{||v_1||^2}$. Nếu $v_2 = 0$, không độc lập tuyến tính.
- Bước 3: Cho $v_3 = u_3 - \frac{\langle u_3, v_1 \rangle}{||v_1||^2} - \frac{\langle u_3, v_2 \rangle}{||v_2||^2}$. Nếu $v_3 = 0$, không độc lập tuyến tính.

Tiếp tục cho đến hết $k$ bước hoặc kết thúc với thông báo không độc lập tuyến tính.

Ngoài ra, chúng ta có thể lấy được họ trực giao ${q_1, q_2, ..., q_n}$ từ S bằng cách cho:
$$q_i = \frac{v_i}{||v_i||}, i = 1, 2, ..., n.$$

## <center> **Phân rã QR (QR decomposition)** </center>

Nếu $A$ là ma trận $m \times n$ gồm $n$ vector cột độc lập tuyến tính thì $A$ có thể được phân tích thành
$$A = QR$$
với $Q$ là ma trận $m \times n$ gồm $n$ vector cột trực chuẩn và $R$ là ma trận $n \times n$ tam giác trên khả nghịch.

**Input**: Ma trận $A$, kích thước $m \times n$.

**Output**: $Q, R$.

Giải thuật được thực hiện với các bước như sau:
- Bước 1: Kiểm tra ma trận $A$, nếu ma trận có $m < n$, tức số dòng nhỏ hơn số cột, ma trận không thể trực chuẩn được (hệ không độc lập tuyến tính).
- Bước 2: Xác định $n$ cột của $A = \begin{bmatrix}u_1 & | & u_2 & | & \ldots & | & u_n\end{bmatrix}$.
- Bước 3: Thực hiện giải thuật Gram-Schmidt trực chuẩn hóa $u_1, u_2,..., u_n$.

Nếu không độc lập tuyến tính, trả về; ngược lại, được $q_1, q_2,...,q_n$ là họ trực chuẩn tương ứng
- Bước 4: Xây dựng ma trận $Q$ gồm $n$ cột:
$$Q = [q_1|q_2|...|q_n]$$
- Bước 5: Xây dựng ma trận $R$ có kích thước $n \times n$ như sau
$$R = \begin{bmatrix}\langle u_1, q_1 \rangle & \langle u_2, q_1 \rangle & \ldots & \langle u_n, q_1 \rangle \cr 0 & \langle u_2, q_2 \rangle & \ldots & \langle u_n, q_2 \rangle \cr \vdots & \vdots & \ddots & \vdots \cr 0 & 0 & \ldots & \langle u_n, q_n \rangle \end{bmatrix}$$
- Bước 6: Trả về $A = QR$.


In [1]:
from copy import deepcopy

# tích vô hướng của 2 vector
def dot_product(v1, v2):
    return sum(x*y for x, y in zip(v1, v2))

# Tính chuẩn của các vector
def norm_product(vec):
    return dot_product(vec, vec)**0.5

# check if vector is zero
def check_zero(vec):
    return all(abs(i) <= 1e-9 for i in vec)

# get collumn i of matrix
def get_col(matrix,i):
    return [matrix[row][i] for row in range(len(matrix))]

# calculate the projection of vector u and v
def projection(u, v):
    dot_uv = dot_product(u, v)
    norm_v = norm_product(v)
    if norm_v == 0:
        return [0]*len(v)
    return [(dot_uv / norm_v**2) * x for x in v]

# subtract 2 vector
def subtract_vector(v1, v2):
    return [x-y for x, y in zip(v1, v2)]

# tạo tập các vector cột của ma trận
def transpose_matrix(matrix):
    return [[matrix[row][col] for row in range(len(matrix))] for col in range(len(matrix[0]))]

# làm tròn các số trong ma trận
def round_matrix(matrix, decimals=4):
    return [[round(element, decimals) for element in row] for row in matrix]

# giải thuật gram-schmidt
def gram_schmidt(vectors):
    orthogonal = []
    for u in vectors:
        vec = deepcopy(u)
        for v in orthogonal:
            proj = projection(vec, v)
            u = subtract_vector(u, proj)
        if check_zero(u):
            return []
        orthogonal.append(u)
    return orthogonal

# QR decomposition function
def qr_decomposition(matrix):

    # ma trận có số dòng < số cột (số vector > số chiều)
    if (len(matrix) < len(matrix[0])):
        return False, [], []
    
    transpose = transpose_matrix(matrix)
    orthogonal = gram_schmidt(transpose)

    # vector trực giao bằng 0
    if len(orthogonal) == 0:
        return False, [], []

    Q = []
    R = [[0]*len(matrix[0]) for _ in range(len(matrix[0]))]

    for i in range(len(orthogonal)):
        norm = norm_product(orthogonal[i])
        if norm == 0:
            continue
        Q_col = [x / norm for x in orthogonal[i]]
        Q.append(Q_col)
        for j in range(i, len(transpose)):
            R[i][j] = dot_product(transpose[j], Q_col)

    Q = transpose_matrix(Q)
    return True, Q, R

In [2]:
# Ma trận trong Bài 2 - tuần 2
bt2a = [
    [1, 1, 2],
    [2, -1, 1],
    [-2, 4, 1]
]
bt2b = [
    [1, 1, 1],
    [2, -2, 2],
    [1, 1, -1]
]
bt2c = [
    [1, 1, -1],
    [0, 1, 2],
    [1, 1, 1]
]
bt2d = [
    [-1, -1, 1],
    [1, 3, 3],
    [-1, -1, 5],
    [1, 3, 7]
]
bt2e = [
    [1, 1, 1],
    [2, 2, 0],
    [3, 0, 0],
    [0, 0, 1]
]
bt2f = [
    [-2, 1, 3],
    [1, 0, 0],
    [0, 1, 0],
    [0, 0, 1]
]
bt2g = [
    [1, -1, 2],
    [1, 0, -1],
    [-1, 1, 2],
    [0, 1, 1]
]

name = ['a)', 'b)', 'c)', 'd)', 'e)', 'f)', 'g)']
bt2 = [bt2a, bt2b, bt2c, bt2d, bt2e, bt2f, bt2g]

for bt in range(len(bt2)):
    print(f'\n================{name[bt]}================')

    print("Matrix:")
    for row in bt2[bt]:
        print(row)

    invertible, Q, R = qr_decomposition(bt2[bt])

    # Round the matrices for better readability
    Q = round_matrix(Q, decimals=4)
    R = round_matrix(R, decimals=4)

    if not invertible:
        print('Ma trận không chéo hóa được.')
    else:
    # Print Q and R matrices    
        print("Matrix Q:")
        for row in Q:
            print(row)

        print("Matrix R:")
        for row in R:
            print(row)


Matrix:
[1, 1, 2]
[2, -1, 1]
[-2, 4, 1]
Matrix Q:
[0.3333, 0.6667, 0.6667]
[0.6667, 0.3333, -0.6667]
[-0.6667, 0.6667, -0.3333]
Matrix R:
[3.0, -3.0, 0.6667]
[0, 3.0, 2.3333]
[0, 0, 0.3333]

Matrix:
[1, 1, 1]
[2, -2, 2]
[1, 1, -1]
Matrix Q:
[0.4082, 0.5774, 0.7071]
[0.8165, -0.5774, 0.0]
[0.4082, 0.5774, -0.7071]
Matrix R:
[2.4495, -0.8165, 1.633]
[0, 2.3094, -1.1547]
[0, 0, 1.4142]

Matrix:
[1, 1, -1]
[0, 1, 2]
[1, 1, 1]
Matrix Q:
[0.7071, 0.0, -0.7071]
[0.0, 1.0, 0.0]
[0.7071, 0.0, 0.7071]
Matrix R:
[1.4142, 1.4142, 0.0]
[0, 1.0, 2.0]
[0, 0, 1.4142]

Matrix:
[-1, -1, 1]
[1, 3, 3]
[-1, -1, 5]
[1, 3, 7]
Matrix Q:
[-0.5, 0.5, -0.5]
[0.5, 0.5, -0.5]
[-0.5, 0.5, 0.5]
[0.5, 0.5, 0.5]
Matrix R:
[2.0, 4.0, 2.0]
[0, 2.0, 8.0]
[0, 0, 4.0]

Matrix:
[1, 1, 1]
[2, 2, 0]
[3, 0, 0]
[0, 0, 1]
Matrix Q:
[0.2673, 0.3586, 0.5963]
[0.5345, 0.7171, -0.2981]
[0.8018, -0.5976, 0.0]
[0.0, 0.0, 0.7454]
Matrix R:
[3.7417, 1.3363, 0.2673]
[0, 1.7928, 0.3586]
[0, 0, 1.3416]

Matrix:
[-2, 1, 3]
[1, 0, 0]
[0, 1,

# 2) Cài đặt sử dụng thư viện

In [3]:
import numpy as np
def qr_decom(matrix):
    A = np.array(matrix)

    Q, R = np.linalg.qr(matrix, mode='reduced')

    Q = round_matrix(Q)
    R = round_matrix(R)

    return Q, R

for bt in range(len(bt2)):
    print(f'\n================{name[bt]}================')

    print("Matrix:")
    for row in bt2[bt]:
        print(row)

    Q, R = qr_decom(bt2[bt])

    # Round the matrices for better readability
    Q = round_matrix(Q, decimals=4)
    R = round_matrix(R, decimals=4)

    # Print Q and R matrices    
    print("Matrix Q:")
    for row in Q:
        print(row)

    print("Matrix R:")
    for row in R:
        print(row)


Matrix:
[1, 1, 2]
[2, -1, 1]
[-2, 4, 1]
Matrix Q:
[-0.3333, -0.6667, 0.6667]
[-0.6667, -0.3333, -0.6667]
[0.6667, -0.6667, -0.3333]
Matrix R:
[-3.0, 3.0, -0.6667]
[0.0, -3.0, -2.3333]
[0.0, 0.0, 0.3333]

Matrix:
[1, 1, 1]
[2, -2, 2]
[1, 1, -1]
Matrix Q:
[-0.4082, 0.5774, -0.7071]
[-0.8165, -0.5774, -0.0]
[-0.4082, 0.5774, 0.7071]
Matrix R:
[-2.4495, 0.8165, -1.633]
[0.0, 2.3094, -1.1547]
[0.0, 0.0, -1.4142]

Matrix:
[1, 1, -1]
[0, 1, 2]
[1, 1, 1]
Matrix Q:
[-0.7071, 0.0, -0.7071]
[-0.0, 1.0, 0.0]
[-0.7071, 0.0, 0.7071]
Matrix R:
[-1.4142, -1.4142, -0.0]
[0.0, 1.0, 2.0]
[0.0, 0.0, 1.4142]

Matrix:
[-1, -1, 1]
[1, 3, 3]
[-1, -1, 5]
[1, 3, 7]
Matrix Q:
[-0.5, -0.5, 0.5]
[0.5, -0.5, 0.5]
[-0.5, -0.5, -0.5]
[0.5, -0.5, -0.5]
Matrix R:
[2.0, 4.0, 2.0]
[0.0, -2.0, -8.0]
[0.0, 0.0, -4.0]

Matrix:
[1, 1, 1]
[2, 2, 0]
[3, 0, 0]
[0, 0, 1]
Matrix Q:
[-0.2673, -0.3586, 0.5963]
[-0.5345, -0.7171, -0.2981]
[-0.8018, 0.5976, 0.0]
[-0.0, -0.0, 0.7454]
Matrix R:
[-3.7417, -1.3363, -0.2673]
[0.0, -1.792

### Nhận xét:

Kết quả của cài đặt thủ công và sử dụng hàm `linalg.qr` từ thư viện *numpy* cho ra về bản chất là giống nhau, tuy nhiên bên cạnh đó còn có một vài khác biệt, đặc biệt là khác biệt về dấu. Một số lý do gây nên sự khác biệt này như sau:

- QR decompostion không phải là duy nhất, cùng một ma trận có thể phân tách thành nhiều cặp giá trị hợp lệ $Q$ và $R$. Việc khác biệt về dấu ở ma trận $Q$ kéo theo sự khác biệt về dấu ở ma trận $R$, điều này xảy ra là vì nếu $Q$ là ma trận trực giao đồng nghĩa với việc $-Q$ cũng là ma trận trực giao, và tương tự, nếu $R$ là tam giác trên thì $-R$ cũng sẽ là tam giác trên.

- Cài đặt thủ công sử dụng thuật toán Gram-Schmidt, thuật toán này cũng được sử dụng trong hàm cài đặt từ thư viện numpy, tuy nhiên `linalg.qr` còn sử dụng Householder Transformation, dẫn tới việc thực hiện các bước chuyển hóa ma trận giữa các ma trận khác nhau có thể khác nhau.

Về cơ bản, hàm thư viện sẽ có độ chính xác cao hơn cũng như tối ưu thời gian chạy do sử dụng kết hợp nhiều phương pháp khác nhau để phân rã QR.

# 3) Một vài ứng dụng của QR Decomposition
### **Giải hệ phương trình tuyến tính**:

Phân rã QR có thể giải được các hệ phương trình tuyến tính với dạng $Ax = b$. Cho $A = Q \cdot R$, hệ phương trình có thể được biến đổi thành dạng $QRx = b$. Nhân cả hai vế với $Q^T$, ta được $Rx = Q^{T}b$, với $R$ là ma trận tam giác trên, giúp tối ưu việc giải quyết bài toán.

### **Bài toán bình phương tối thiểu**:

Phân rã QR được sử dụng trong các bài toán bình phương tối thiểu, liên quan tới việc tối thiểu hóa tổng bình phương của các sai số giữa giá trị quan sát và giá trị dự đoán. Với $Ax = b$, trong đó $A$ là ma trận $m \times n$, với $m > n$, nghiệm bình phương tối thiểu có thể tìm được bằng phân tích $QR$.

### **Tính toán các giá trị riêng, vector riêng**:

Thuật toán QR là phương pháp cơ bản để tìm giá trị riêng và vector riêng của ma trận. Nó áp dụng phân tích QR lặp đi lặp lại để biến đổi ma trận thành dạng tam giác trên, từ đó có thể dễ dàng trích xuất giá trị riêng.

### **Phân tích thành phần chính (PCA)**:

Trực giao hóa các vector riêng của ma trận hiệp phương sai từ phân rã QR có thể được sử dụng để cung cấp một tập các thành phần chính không tương quan và sắp xếp chúng theo lượng phương sai mà chúng giải thích, từ đó hỗ trợ quá trình phân tích thành phần của dữ liệu.

### **Lý thuyết điều khiển**:

Trong lý thuyết điều khiển, phân tích QR được sử dụng trong biểu diễn trạng thái để biến đổi hệ thống thành dạng điều khiển được hoặc quan sát được, tạo điều kiện thuận lợi cho việc thiết kế bộ điều khiển và quan sát viên.

### **Xử lý tín hiệu**:

Phân tích QR được sử dụng trong nhiều ứng dụng xử lý tín hiệu, bao gồm lọc thích nghi, beamforming và các hệ thống MIMO. Nó giúp giải quyết các bài toán bình phương tối thiểu và ước lượng tham số tín hiệu.

# 4) Mô tả các hàm và ý tưởng thực hiện
## Ý tưởng thực hiện

Chương trình thực hiện phân rã QR dựa trên các ma trận của Bài 2 - Tuần 2 và trả về kết quả là ma trận $Q$ và $R$ tương ứng.

Trong đó sử dụng thuật toán phân rã QR để phân rã ma trận $A$ thành ma trận trực giao $Q$ và ma trận tam giác trên $R$. Trong quá trình đó, sử dụng giải thuật Gram-Schmidt để trực giao và trực chuẩn hóa các vector.

## Mô tả các hàm

1. `dot_product(v1, v2)`: tính tích vô hướng của vector $v1$ và $v2$.

2. `norm_product(vec)`: tính chuẩn (độ dài) của vector $vec$.

3. `check_zero(vec)`: kiểm tra vector có bằng vector không, trả về boolean, True nếu vector bằng vector không, False nếu không.

4. `get_col(matrix, i)`: lấy cột $i$ từ ma trận.

5. `projection(u,v)`: 

- Tính toán phép chiếu của vector $u$ lên vector $v$. 

- Cách hoạt động:
    - Tính tích vô hướng của $u$ và $v$.
    - Tính chuẩn của $v$.
    - Nếu chuẩn bằng 0, trả về vector có độ dài 0. Ngược lại, tính phép chiếu của u lên v và trả về kết quả.

6. `subtract_vector(v1, v2)`: Trừ $v1$ cho $v2$.

7. `transpose_matrix(matrix)`: Tính chuyển vị của một ma trận cho trước.

8. `round_matrix(matrix, decimals=4)`: làm tròn các phần tử của ma trận tới chữ số thập phân thứ 4, mục đích làm cho ma trận dễ đọc, thẩm mĩ hơn.

9. `gram_schmidt(vectors)`
- Thực hiện giải thuật Gram-Schmidth, trả về tập các vector trực giao.

- Cách hoạt động:
    - Khởi tạo danh sách chứa vector trực giao
    - Duyệt qua từng vector trong tập đầu vào, với mỗi vector, thực hiện vòng lặp áp dụng công thức tính vector trực giao ở trên.
    - Nếu vector khác vector 0, thêm vào danh sách vector trực giao. Nếu vector bằng 0, trả về vì điều đó có nghĩa là vector không độc lập tuyến tính.
    - Trả về danh sách vector trực giao.

10. `qr_decompostion(matrix)`:
- Thực hiện phân rã QR trên ma trận đầu vào. Nhận vào ma trận $A$ dưới dạng danh sách, mỗi danh sách con là một hàng của ma trận.Trả về 3 giá trị: boolean cho biết ma trận có khả nghịch hay không (có chéo hóa được hay không), ma trận $Q$ và ma trận $R$.
- Cách hoạt động:
    - Chuyển vị ma trận đầu vào $A$.
    - Thực hiện thuật toán Gram-Schmidt, tìm ma trận trực giao $Q$.
    - Tính toán ma trận $R$ bằng cách nhân $Q^T$ vào ma trận $A$.
    - Kiểm tra tính khả nghịch của ma trận bằng cách kiểm tra các phần tử trên đường chéo chính của $R$.
    - Trả về kết quả.
