# ĐỀ KIỂM TRA THỰC HÀNH 1 
## Môn: Tối ưu hoá cho Khoa học dữ liệu
## Ngày: 09/10/2024
## Lớp: DHKHDL18A. Nhóm thực hành 3.
## Thời gian: 45 phút

### Câu 1. (6 điểm) ### 
Cho ma trận $A=\begin{bmatrix}3 & 0\\ 0 & 1 \end{bmatrix}$ và vector $b=(2;-1)$. Xét bài toán tối ưu sau 
$$\min_{x\in\mathbb{R}^2}f(x)=\dfrac{1}{2}x^TAx-b^Tx.$$

1. (2 điểm) Xác định điểm tối ưu $x^*$ và giá trị tối ưu $p^*$ của bài toán trên.


2. (2 điểm) Sử dụng thuật toán Gradient Descent, với giá trị $x$ ban đầu là $x^{(0)}=(0;1)$, sử dụng learning rate là $0.9$ và thực hiện tối đa $20$ vòng lặp. In ra giá trị của $x^{(k)}$ và $f(x^{(k)})$ tương ứng sau mỗi vòng lặp $k$. Từ đó vẽ đồ thị biểu thị cho sai số $|f(x^{(k)})-f(p^*)|$.


3. (2 điểm) Tìm learning rate theo phương pháp exact-line search trong thuật toán Gradient Descent của bài toán trên với điểm khởi tạo là $x^{(0)}=(0;1)$. Gọi điểm cập nhật trong trường hợp này là $x^{(k)}_{\text{exact}}$, vẽ đồ thị mô tả cho sai số $|f(x^{(k)}_{\text{exact}})-f(p^*)|$.  


In [None]:
import autograd.numpy as np
from autograd import grad
import matplotlib.pyplot as plt

# =========================
# 1. Khai báo bài toán
# =========================
def create_problem(A, b):
    """
    Tạo hàm f(x) = 1/2 x^T A x - b^T x
    """
    def f(x):
        return 0.5 * x @ A @ x - b @ x
    return f

# =========================
# 2. Gradient Descent (fixed lr)
# =========================
def gradient_descent(f, grad_f, x0, lr, max_iter):
    x = x0.copy()
    xs, fs = [x.copy()], [f(x)]
    
    for k in range(max_iter):
        x = x - lr * grad_f(x)
        xs.append(x.copy())
        fs.append(f(x))
        
        print(f"Iter {k+1:2d}: x = {x}, f(x) = {fs[-1]:.6f}")
        
    return np.array(xs), np.array(fs)

# =========================
# 3. Gradient Descent với Exact Line Search
# =========================
def gradient_descent_exact(A, f, grad_f, x0, max_iter):
    x = x0.copy()
    xs, fs = [x.copy()], [f(x)]
    
    for k in range(max_iter):
        g = grad_f(x)
        alpha = (g @ g) / (g @ A @ g)
        x = x - alpha * g
        
        xs.append(x.copy())
        fs.append(f(x))
        
        print(f"Iter {k+1:2d}: alpha = {alpha:.6f}, x = {x}, f(x) = {fs[-1]:.6f}")
        
    return np.array(xs), np.array(fs)

# =========================
# 4. MAIN – chạy bài toán
# =========================
if __name__ == "__main__":
    
    # ----- INPUT (chỉ cần đổi chỗ này) -----
    A = np.array([[3., 0.],
                  [0., 1.]])
    
    b = np.array([2., -1.])
    x0 = np.array([0., 1.])
    
    lr = 0.9
    max_iter = 20
    
    # ----- Tạo hàm và gradient -----
    f = create_problem(A, b)
    grad_f = grad(f)
    
    # ----- Nghiệm tối ưu -----
    x_star = np.linalg.solve(A, b)
    p_star = f(x_star)
    
    print("===== NGHIỆM GIẢI TÍCH =====")
    print("x* =", x_star)
    print("p* =", p_star)
    
    # ----- Gradient Descent thường -----
    print("\n===== GRADIENT DESCENT (FIXED LR) =====")
    xs_gd, fs_gd = gradient_descent(f, grad_f, x0, lr, max_iter)
    
    # ----- Exact Line Search -----
    print("\n===== GRADIENT DESCENT (EXACT LINE SEARCH) =====")
    xs_exact, fs_exact = gradient_descent_exact(A, f, grad_f, x0, max_iter)
    
    # =========================
    # 5. Vẽ đồ thị sai số
    # =========================
    err_gd = np.abs(fs_gd - p_star)
    err_exact = np.abs(fs_exact - p_star)
    
    plt.figure(figsize=(8, 5))
    plt.semilogy(err_gd, 'o-', label='GD – fixed lr')
    plt.semilogy(err_exact, 's-', label='GD – exact line search')
    plt.xlabel("Iteration k")
    plt.ylabel(r"$|f(x^{(k)}) - p^*|$")
    plt.title("So sánh tốc độ hội tụ")
    plt.grid(True)
    plt.legend()
    plt.show()


In [None]:
import autograd.numpy as np
from autograd import grad

# =====================================================
# 1. Định nghĩa bài toán f(x) = 1/2 x^T A x - b^T x
# =====================================================
def create_quadratic_problem(A, b):
    def f(x):
        return 0.5 * x @ A @ x - b @ x
    return f

# =====================================================
# 2. Exact Line Search – in rõ từng bước
# =====================================================
def exact_line_search_steps(A, f, grad_f, x0, max_iter=1):
    """
    Trình bày chi tiết từng bước tìm alpha theo exact line search
    """
    x = x0.copy()

    print("========== EXACT LINE SEARCH ==========")
    print(f"x^(0) = {x}")

    for k in range(max_iter):
        print(f"\n--- Bước lặp k = {k} ---")

        # Gradient
        g = grad_f(x)
        print("Gradient ∇f(x^k) = A x^k - b =", g)

        # Tử số
        numerator = g @ g
        print("Tử số  ∇f^T ∇f =", numerator)

        # Mẫu số
        Ag = A @ g
        denominator = g @ Ag
        print("Mẫu số  ∇f^T A ∇f =", denominator)

        # Learning rate exact
        alpha = numerator / denominator
        print("Learning rate α_exact =", alpha)

        # Cập nhật x
        x_new = x - alpha * g
        print("x^(k+1) = x^k − α ∇f =", x_new)

        # Giá trị hàm
        fx = f(x_new)
        print("f(x^(k+1)) =", fx)

        x = x_new

    return x

# =====================================================
# 3. MAIN – chỉ cần đổi dữ liệu đầu vào
# =====================================================
if __name__ == "__main__":

    # ----- INPUT -----
    A = np.array([[3., 0.],
                  [0., 1.]])
    b = np.array([2., -1.])
    x0 = np.array([0., 1.])

    # ----- Tạo hàm và gradient -----
    f = create_quadratic_problem(A, b)
    grad_f = grad(f)

    # ----- Chạy exact line search (1 bước như đề) -----
    exact_line_search_steps(A, f, grad_f, x0, max_iter=1)


1. (2 điểm) Xác định điểm tối ưu $x^*$ và giá trị tối ưu $p^*$ của bài toán trên.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# Định nghĩa ma trận A và vector b
A = np.array([[3,0],[0,1]])
b = np.array([2,-1])

# Hàm mục tiêu f(x)
def f(x):
    return 0.5 * x.T @ A @ x - b.T @ x

# Gradient của f(x)
def grad_f(x):
    return A @ x - b

# **Phần 1: Xác định điểm tối ưu x* và giá trị tối ưu p***

# Giải phương trình A*x* = b để tìm x*
x_star = np.linalg.solve(A, b)
f_star = f(x_star)

print("Phần 1:")
print(f"Điểm tối ưu x* = {x_star}")
print(f"Giá trị tối ưu p* = {f_star}\n")

Vậy điểm tối ưu của bài toán : $\displaystyle x^* = (\frac{2}{3}, -1)$ , giá trị tối ưu của bài toán là $p^* = \frac{-7}{6}$

2. (2 điểm) Sử dụng thuật toán Gradient Descent, với giá trị $x$ ban đầu là $x^{(0)}=(0;1)$, sử dụng learning rate là $0.9$ và thực hiện tối đa $20$ vòng lặp. In ra giá trị của $x^{(k)}$ và $f(x^{(k)})$ tương ứng sau mỗi vòng lặp $k$. Từ đó vẽ đồ thị biểu thị cho sai số $|f(x^{(k)})-f(p^*)|$.


In [None]:
# Khởi tạo
x_0 = np.array([0, 1])  # Giá trị ban đầu x(0)
learning_rate = 0.9  # Learning rate cố định
max_iter = 20  # Số vòng lặp tối đa

# Danh sách lưu trữ các giá trị x(k) và f(x(k))
x_vals = [x_0]
f_vals = [f(x_0)]

# Gradient Descent
x = x_0
for k in range(max_iter):
    grad = grad_f(x)  # Tính gradient tại x(k)
    x = x - learning_rate * grad  # Cập nhật giá trị của x(k)
    x_vals.append(x)
    f_vals.append(f(x))

# In kết quả của từng vòng lặp
print("Phần 2: Gradient Descent với learning rate = 1")
for k in range(max_iter + 1):
    print(f"Vòng lặp {k}: x = {x_vals[k]}, f(x) = {f_vals[k]}")

# Vẽ đồ thị sai số |f(x^k) - f(x*)| theo số vòng lặp
errors = [abs(f_val - f_star) for f_val in f_vals]

plt.figure(figsize=(10, 5))
plt.plot(range(max_iter + 1), errors, marker='o')
plt.title("Sai số |f(x^{(k)}) - f(x^*)| qua các vòng lặp")
plt.xlabel("Số vòng lặp k")
plt.ylabel("Sai số")
plt.grid(True)
plt.show()

3. (2 điểm) Tìm learning rate theo phương pháp exact-line search trong thuật toán Gradient Descent của bài toán trên với điểm khởi tạo là $x^{(0)}=(0;1)$. Gọi điểm cập nhật trong trường hợp này là $x^{(k)}_{\text{exact}}$, vẽ đồ thị mô tả cho sai số $|f(x^{(k)}_{\text{exact}})-f(p^*)|$.  

In [None]:
from sympy import symbols, diff, Matrix, solve, latex
from IPython.display import display, Markdown
# Khai báo các biến
x1, x2 = symbols('x1 x2')

# Ma trận A và vector b
A = Matrix([[3,0],[0,1]])
b = Matrix([2,-1])

# Hàm số f(x) = 1/2 * x^T * A * x - b^T * x
f = 1/2 * Matrix([x1, x2]).T * A * Matrix([x1, x2]) - b.T * Matrix([x1, x2])

# Tính đạo hàm của f theo từng biến
df_x1 = diff(f, x1)
df_x2 = diff(f, x2)

display(Markdown(f"Đạo hàm : ${latex(df_x1)}$"))
display(Markdown(f"Đạo hàm : ${latex(df_x2)}$"))

# Giải hệ phương trình đạo hàm bằng 0
sol = solve([df_x1, df_x2], [x1, x2])
sol, f.subs({x1: sol[x1], x2: sol[x2]})

In [None]:
s = symbols('s')
tk = Matrix([[x1],[x2]]) - s*Matrix([df_x1, df_x2])
tk

In [None]:
nghiem_s = solve(diff(f.subs({x1: tk[0], x2:tk[1]}),s))
nghiem_s[0]

In [None]:
nabla = '\u2207'
display(Markdown(f" Điểm s để f(x-s.{nabla}.f(x)) nhỏ nhất là : $\displaystyle {latex(nghiem_s[0][s])}$"))

In [None]:
nghiem_s[0][s].subs({x1 : 1 , x2: 0})

In [None]:
(f.subs({x1: tk[0], x2:tk[1]})).subs(*nghiem_s)

In [None]:
t = nghiem_s[0][s].subs({x1:1,x2:0})
t

Code tính vòng lặp

In [None]:
x_0 = np.array([0, 1])
max_iter = 20  # Giới hạn số vòng lặp xuống còn 20

# Hàm mục tiêu
def f(x):
    return 0.5 * x.T @ A @ x - b.T @ x

# Tính gradient
def grad_f(x):
    return A @ x - b

# Tìm điểm tối ưu p*
p_star = np.linalg.solve(A, b)
f_star = f(p_star)

# Hàm exact-line search để tìm learning rate tối ưu
def exact_line_search(grad):
    return grad.T @ grad / (grad.T @ A @ grad)  # Công thức tìm learning rate tối ưu

# Danh sách lưu trữ các giá trị x(k) và f(x(k)) với exact-line search
x_vals_exact = [x_0]
f_vals_exact = [f(x_0)]
learning_rates = []  # Danh sách lưu learning rates

x = x_0
for k in range(max_iter):
    grad = grad_f(x)  # Tính gradient tại x(k)
    lr_exact = exact_line_search(grad)  # Tìm learning rate tối ưu
    learning_rates.append(lr_exact)  # Lưu learning rate
    x = x - lr_exact * grad  # Cập nhật giá trị của x(k) với learning rate tối ưu
    x_vals_exact.append(x)
    f_vals_exact.append(f(x))

# In kết quả của từng vòng lặp với exact-line search
print("\nPhần 3: Exact-line Search")
for k in range(max_iter + 1):
    print(f"Vòng lặp {k}: x = {x_vals_exact[k]}, f(x) = {f_vals_exact[k]}")

# In ra bước nhảy tại mỗi vòng lặp
print("\nBước nhảy (learning rates) tại mỗi vòng lặp:")
for k in range(max_iter):
    print(f"Vòng lặp {k}: learning rate = {learning_rates[k]}")

In [None]:
# Vẽ đồ thị sai số |f(x^k_exact) - f(x*)| theo số vòng lặp
errors_exact = [abs(f_val - f_star) for f_val in f_vals_exact]

plt.figure(figsize=(10, 5))
plt.plot(range(max_iter + 1), errors_exact, marker='o')
plt.title("Sai số |f(x^{(k)}_{exact}) - f(x^*)| qua các vòng lặp")
plt.xlabel("Số vòng lặp k")
plt.ylabel("Sai số")
plt.grid(True)
plt.show()

### Câu 2. (4 điểm)
Bộ dữ liệu **Labeled Faces in the Wild (LFW)**: Bộ dữ liệu là tập hợp các bức ảnh JPEG của những người nổi tiếng được thu thập trên internet. Sử dụng lệnh sau để load bộ dữ liệu
```python
from sklearn.datasets import fetch_lfw_people
lfwPeople = fetch_lfw_people(data_home="./",min_faces_per_person=70, resize=0.4)
````
1. Hiển thị thông tin kích thước ảnh, số lượng ảnh, và số lượng nhãn (danh tính) trong bộ dữ liệu.
2. Chia dữ liệu thành 2 phần train/test (70/30) và chuẩn hóa dữ liệu
3. Xây dựng mô hình SVM sử dụng kernel ```sigmoid``` ({‘linear’, ‘poly’, ‘rbf’, ‘sigmoid’, ‘precomputed’})
4. Đánh giá mô hình: sử dụng accuracy, precision, recall, F1-score

1. Hiển thị thông tin kích thước ảnh, số lượng ảnh, và số lượng nhãn (danh tính) trong bộ dữ liệu.

In [None]:
import numpy as np
import matplotlib.pyplot as plt

from sklearn.datasets import fetch_lfw_people
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import (
    accuracy_score,
    precision_score,
    recall_score,
    f1_score,
    classification_report
)


In [None]:
# Load LFW dataset
lfwPeople = fetch_lfw_people(
    data_home="./",
    min_faces_per_person=70,
    resize=0.4
)

# Dữ liệu
X = lfwPeople.data          # (n_samples, n_features)
y = lfwPeople.target        # nhãn
target_names = lfwPeople.target_names
images = lfwPeople.images  # ảnh gốc (h, w)

# Thông tin
n_samples, n_features = X.shape
n_classes = len(target_names)
h, w = images.shape[1], images.shape[2]

print("===== THÔNG TIN BỘ DỮ LIỆU LFW =====")
print(f"Kích thước ảnh: {h} x {w}")
print(f"Số lượng ảnh: {n_samples}")
print(f"Số lượng nhãn (danh tính): {n_classes}")
print("Danh sách nhãn:", target_names)


In [None]:
# Chia dữ liệu train/test
X_train, X_test, y_train, y_test = train_test_split(
    X, y,
    test_size=0.3,
    random_state=42,
    stratify=y
)

# Chuẩn hóa dữ liệu
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

print("\n===== CHIA DỮ LIỆU =====")
print("Train size:", X_train_scaled.shape)
print("Test size :", X_test_scaled.shape)


In [None]:
# Khởi tạo mô hình SVM
svm_model = SVC(
    kernel="sigmoid",
    C=1.0,
    gamma="scale", # auto
    random_state=42
)

# Huấn luyện mô hình
svm_model.fit(X_train_scaled, y_train)

print("\n===== HUẤN LUYỆN MÔ HÌNH SVM =====")
print("Kernel sử dụng:", svm_model.kernel)


In [None]:
# Dự đoán
y_pred = svm_model.predict(X_test_scaled)

# Các chỉ số đánh giá
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average="weighted")
recall = recall_score(y_test, y_pred, average="weighted")
f1 = f1_score(y_test, y_pred, average="weighted")

print("\n===== ĐÁNH GIÁ MÔ HÌNH =====")
print(f"Accuracy : {accuracy:.4f}")
print(f"Precision: {precision:.4f}")
print(f"Recall   : {recall:.4f}")
print(f"F1-score : {f1:.4f}")

print("\n===== BÁO CÁO CHI TIẾT =====")
print(classification_report(y_test, y_pred, target_names=target_names))


## --------------------------------------- Hết --------------------------------------

### Lưu ý: sinh viên không được sử dụng internet. Giám thị không giải thích gì thêm.