<center><h1>TOÁN ỨNG DỤNG VÀ THỐNG KÊ</h1>
<h2>Đồ án Gram-Schmidt</h2>
<b>Họ và tên:</b> Nguyễn Trần Thiên Phú <br>
<b>MSSV:</b> 23127246</center>

## Giải thuật

### Phân rã QR với giải thuật Gram-Schmidt
Cho tập các vector $\boldsymbol{v}_1, \boldsymbol{v}_2, ..., \boldsymbol{v}_k \in \mathbb{R}^n$, **thuật giải Gram-Schmidt** (Gram-Schmidt algorithm) tìm họ trực chuẩn các vector $\boldsymbol{q}_1, \boldsymbol{q}_2, ..., \boldsymbol{q}_r \in \mathbb{R}^n$ là một cơ sở của $\mathrm{Span}\{\boldsymbol{v}_1, \boldsymbol{v}_2, ..., \boldsymbol{v}_k\}$. Thuật giải gồm các bước:


> **Bước 1.** Tạo tập $Q = \{\}$ chứa cơ sở kết quả.

> **Bước 2.** Đặt $i = 1$ và lặp lại các Bước 3-4 cho đến khi $i > k$.

> **Bước 3.** Tính 
> $$
\boldsymbol{q}_i = \boldsymbol{v}_i - \sum_{\boldsymbol{q}_j \in Q} \frac{\langle \boldsymbol{v}_i, \boldsymbol{q}_j \rangle}{\| \boldsymbol{q}_j \|^2}\boldsymbol{q}_j
$$

> **Bước 4.** Nếu $\boldsymbol{q}_i \neq 0$ thì thêm $\boldsymbol{q}_i$ vào $Q$. Tăng $i$ thêm $1$.

> **Bước 5.** Chuẩn hóa tạo hệ trực chuẩn
> $$
\boldsymbol{q}_i = \frac{\boldsymbol{q}_i}{\| \boldsymbol{q}_i \|}, \forall \boldsymbol{q}_i \in Q
$$

> **Bước 6.** Tạo ma trận R

In [7]:
def print_matrix(matrix):
    matrix = [[round(elem, 2) for elem in row] for row in matrix]

    str_matrix = [[str(item) for item in row] for row in matrix]

    num_cols = len(str_matrix[0])
    col_widths = [0] * num_cols
    for j in range(num_cols):
        max_len = max(len(row[j]) for row in str_matrix)
        col_widths[j] = max_len

    # In ma trận đã được định dạng
    num_rows = len(str_matrix)
    for i, row in enumerate(str_matrix):
        line_str = "  "
        
        if i == 0:
            line_str += '┌'
        elif i == num_rows - 1:
            line_str += '└'
        else:
            line_str += '│'
        
        line_str += ' '
        
        for j, element in enumerate(row):
            line_str += element.rjust(col_widths[j]) + '  '
            
        line_str = line_str.rstrip()
        line_str += ' '

        if i == 0:
            line_str += '┐'
        elif i == num_rows - 1:
            line_str += '┘'
        else:
            line_str += '│'
        
        print(line_str)

## Bài 1: Giải thuật Gram-Schmidt

In [8]:
def transpose(A):
    if not A:
        return []
    return [list(row) for row in zip(*A)]

def dot_product(v1, v2):
    return sum(x * y for x, y in zip(v1, v2))

def vector_norm(v):
    return dot_product(v, v) ** 0.5

def scalar_multiply(scalar, v):
    return [scalar * x for x in v]

def vector_subtract(v1, v2):
    return [x - y for x, y in zip(v1, v2)]

def Gram_Schmidt(A):
    A_cols = transpose(A)
    m, n = len(A), len(A_cols)

    Q_cols = []
    R = [[0.0] * n for _ in range(n)]

    for j in range(n):
        u = A_cols[j][:]

        for i in range(j):
            q_i = Q_cols[i]
            r_ij = dot_product(q_i, A_cols[j])
            R[i][j] = r_ij
            
            projection = scalar_multiply(r_ij, q_i)
            u = vector_subtract(u, projection)

        norm_u = vector_norm(u)
        
        if norm_u < 1e-10:
            raise ValueError("Ma trận đầu vào không độc lập tuyến tính !")

        R[j][j] = norm_u

        q_j = scalar_multiply(1.0 / norm_u, u)
        Q_cols.append(q_j)

    Q = transpose(Q_cols)
    
    return Q, R

A = [
    [1.0, -1.0, 2.0],
    [1.0, 0.0, -1.0],
    [-1.0, 1.0, 2.0],
    [0.0, 1.0, 1.0]
]

try:
    print("Matrix A:")
    print_matrix(A)
    print("-"*30)
    Q, R = Gram_Schmidt(A)   
    print("Matrix Q:")
    print_matrix(Q)
    print("-"*30)
    print("Matrix R:")
    print_matrix(R)

except ValueError as e:
    print(e)

Matrix A:
  ┌  1.0  -1.0   2.0 ┐
  │  1.0   0.0  -1.0 │
  │ -1.0   1.0   2.0 │
  └  0.0   1.0   1.0 ┘
------------------------------
Matrix Q:
  ┌  0.58  -0.26   0.77 ┐
  │  0.58   0.52  -0.26 │
  │ -0.58   0.26   0.52 │
  └   0.0   0.77   0.26 ┘
------------------------------
Matrix R:
  ┌ 1.73  -1.15  -0.58 ┐
  │  0.0   1.29   0.26 │
  └  0.0    0.0    3.1 ┘


## Bài 2: Mở rộng

#### So sánh giải thuật với hàm có sẵn trong thư viện NumPy

In [9]:
import numpy as np

# Sử dụng lại ma trận A từ cell trước
A = [
    [1.0, -1.0, 2.0],
    [1.0, 0.0, -1.0],
    [-1.0, 1.0, 2.0],
    [0.0, 1.0, 1.0]
]

# Phân rã QR bằng hàm có sẵn của NumPy
Q_lib, R_lib = np.linalg.qr(A)
print("\nMa trận Q (từ thư viện):")
print_matrix(Q_lib)
print("\nMa trận R (từ thư viện):")
print_matrix(R_lib)


Ma trận Q (từ thư viện):
  ┌ -0.58   0.26  -0.77 ┐
  │ -0.58  -0.52   0.26 │
  │  0.58  -0.26  -0.52 │
  └  -0.0  -0.77  -0.26 ┘

Ma trận R (từ thư viện):
  ┌ -1.73   1.15   0.58 ┐
  │   0.0  -1.29  -0.26 │
  └   0.0    0.0   -3.1 ┘


Nhận xét:
- Ma trận Q trong giải thuật bằng ma trận Q từ thư viện nhân -1, tương tự với ma trận R nên tích 2 ma trận Q, R vẫn bằng ma trận A

#### Ứng dụng của phân rã QR:

##### 1. Giải hệ phương trình tuyến tính
- **Ý tưởng:** Biến đổi hệ phương trình `Ax = b` thành `QRx = b`. Do `Q` là ma trận trực giao (`Q⁻¹ = Qᵀ`), ta có thể dễ dàng biến đổi nó thành `Rx = Qᵀb`.
- **Lợi ích:** Hệ `Rx = Qᵀb` rất dễ giải bằng phương pháp **thế ngược** (back substitution) vì `R` là ma trận tam giác trên. Đây là một phương pháp ổn định hơn so với khử Gauss trong một số trường hợp.

##### 2. Bài toán Bình phương Tối thiểu (Least Squares)
- **Ứng dụng:** Rất phổ biến trong **hồi quy tuyến tính** và khớp dữ liệu, nơi ta cần tìm `x` để tối thiểu hóa sai số `||Ax - b||`.
- **Lợi ích:** Thay vì giải qua phương trình chuẩn `AᵀAx = Aᵀb` (có thể gây mất mát độ chính xác), phân rã QR biến đổi bài toán thành tối thiểu hóa `||Rx - Qᵀb||`, một bài toán đơn giản và ổn định hơn về mặt số học.

##### 3. Tính Trị riêng (Thuật toán QR)
- **Ý tưởng:** **Thuật toán QR** là một phương pháp lặp để tìm tất cả các trị riêng của một ma trận.
- **Quy trình:**
  1. Bắt đầu với `A₀ = A`.
  2. Lặp lại: Phân rã `Aₖ = QₖRₖ` và tính `Aₖ₊₁ = RₖQₖ`.
- **Kết quả:** Dãy ma trận `Aₖ` sẽ hội tụ về một ma trận tam giác trên (hoặc ma trận đường chéo). Các phần tử trên đường chéo chính của ma trận hội tụ chính là các **trị riêng** của `A`.

## Ý tưởng thực hiện và mô tả các hàm

#### `Gram_Schmidt(A)`
**Ý tưởng:** Hàm này mô tả lại quá trình phân rã QR sử dụng các phép tính liên quan tới vector qua các hàm phụ:
- transpose(A): Đùng để tạo ra ma trận mới sao cho mỗi dòng là 1 cột của ma trận cũ
- dot_product(v1,v2): Tích vô hướng 2 vector v1,v2
- vector_norm(v): Độ dài vector v
- scalar_multiply(scalar,v): Tích 1 vector với 1 số nguyên
- vector_substract(v1,v2): Hiệu 2 vector <br>
**Mô tả hoạt động:** 
1. Đầu vào là ma trận A sau đó chuyển thành ma trận chứa các hàng là cột của ma trận A
2. Tính các vector cơ sở trực giao dựa vào công thức mô tả ở phần `Thuật toán` sau đó chuẩn hóa thành cơ sở trực chuẩn - Ma trận Q
3. Dựa trên các vector cơ sở trực chuẩn tạo ma trận R với các giá trị R[i][j] là tích vô hướng của 2 vector $\boldsymbol{q}_i$ and $\boldsymbol{v}_j$ với j > i để tạo ma trận đường chéo trên

