In [1]:
import numpy as np
import time
from sklearn.model_selection import train_test_split
from scipy import stats

np.random.seed(42)

print("Chào mừng đến với bản demo Đánh giá Thuật toán Tìm kiếm!")

print("\n--- 1. Demo Các chỉ số Hiệu suất (Efficiency Metrics) ---")

def simple_query_processor():
    """Giả lập một truy vấn tốn thời gian (ví dụ: 30-80ms)."""
    sleep_time_sec = np.random.uniform(0.03, 0.08)
    time.sleep(sleep_time_sec)
    return sleep_time_sec

print("Đang đo 'Query Latency' (Độ trễ truy vấn)...")
start_time = time.time()
simple_query_processor()
end_time = time.time()

latency_ms = (end_time - start_time) * 1000
print(f"  - Query Latency: {latency_ms:.2f} ms")

print(f"  - Query Throughput (Ước tính): {1 / (latency_ms / 1000):.2f} queries/giây")


print("\n--- 2. Demo Huấn luyện/Kiểm thử & Thiết lập Tham số ---")

total_queries = 100
query_ids = np.arange(total_queries)

scores_A_all = np.random.rand(total_queries) * 0.4 + 0.3


optimal_alpha = 0.6
improvement = np.random.rand(total_queries) * 0.2
noise = (np.random.rand(total_queries) - 0.5) * 0.05
def get_scores_B(alpha, scores_A, improvement, noise):
    penalty = -((alpha - optimal_alpha)**2) * 0.5
    return np.clip(scores_A + alpha * improvement + noise + penalty, 0, 1)


train_ids, test_ids = train_test_split(query_ids, test_size=0.4, random_state=42)

print(f"Tổng số truy vấn: {total_queries}")
print(f"Số truy vấn trong Tập Training: {len(train_ids)}")
print(f"Số truy vấn trong Tập Testing: {len(test_ids)}")

print("\n**Đang 'tune' tham số 'alpha' trên TẬP TRAINING:**")
possible_alphas = [0.1, 0.2, 0.3, 0.4, 0.5, 0.6, 0.7, 0.8, 0.9]
best_alpha = -1
best_avg_score_train = -1

for alpha in possible_alphas:
    current_scores_B_train = get_scores_B(alpha, scores_A_all[train_ids], improvement[train_ids], noise[train_ids])
    avg_score = np.mean(current_scores_B_train)
    print(f"  Thử alpha = {alpha}, Điểm trung bình (training): {avg_score:.4f}")

    if avg_score > best_avg_score_train:
        best_avg_score_train = avg_score
        best_alpha = alpha

print(f"\n==> Tham số 'alpha' tốt nhất tìm được từ TẬP TRAINING là: {best_alpha}")


print("\n--- 3. Demo Kiểm định Ý nghĩa Thống kê (trên TẬP TEST) ---")

scores_A_test = scores_A_all[test_ids]

scores_B_test = get_scores_B(best_alpha, scores_A_all[test_ids], improvement[test_ids], noise[test_ids])

print(f"**So sánh hiệu quả trung bình trên TẬP TEST:**")
print(f"  Thuật toán A (Baseline): {np.mean(scores_A_test):.4f}")
print(f"  Thuật toán B (Đã tune): {np.mean(scores_B_test):.4f}")

print("\n**Thực hiện Kiểm định Ý nghĩa (Significance Test):**")

statistic, p_value = stats.ttest_rel(scores_B_test, scores_A_test, alternative='greater')

print(f"  Kết quả Paired T-test (one-sided):")
print(f"  T-statistic: {statistic:.4f}")
print(f"  P-value: {p_value:.6f}")

significance_level = 0.05
print(f"\n**Kết luận (với mức ý nghĩa α = {significance_level}):**")

if p_value <= significance_level:
    print(f"  VÌ: P-value ({p_value:.6f}) <= {significance_level} (α)")
    print("  KẾT LUẬN: Chúng ta BÁC BỎ giả thuyết H0.")
    print("  ==> Có bằng chứng thống kê đủ mạnh để nói rằng Thuật toán B HIỆU QUẢ HƠN Thuật toán A.")
else:
    print(f"  VÌ: P-value ({p_value:.6f}) > {significance_level} (α)")
    print("  KẾT LUẬN: Chúng ta KHÔNG THỂ bác bỏ giả thuyết H0.")
    print("  ==> Sự khác biệt về điểm trung bình có thể chỉ là do NGẪU NHIÊN.")
    print("  ==> Không đủ bằng chứng để nói B tốt hơn A.")

print("\n--- 4. Ghi chú về Online Testing (A/B Testing) ---")
print("Online testing (như A/B testing) không thể demo bằng script offline.")
print("Nó liên quan đến việc chia traffic người dùng thật làm 2 nhóm:")
print("  - Nhóm A (Control): Dùng thuật toán A (cũ).")
print("  - Nhóm B (Treatment): Dùng thuật toán B (mới).")
print("Sau đó, chúng ta so sánh các chỉ số (ví dụ: tỷ lệ nhấp chuột) giữa hai nhóm.")
print("Việc này đòi hỏi một hệ thống web/ứng dụng thực tế.")

Chào mừng đến với bản demo Đánh giá Thuật toán Tìm kiếm!

--- 1. Demo Các chỉ số Hiệu suất (Efficiency Metrics) ---
Đang đo 'Query Latency' (Độ trễ truy vấn)...
  - Query Latency: 49.29 ms
  - Query Throughput (Ước tính): 20.29 queries/giây

--- 2. Demo Huấn luyện/Kiểm thử & Thiết lập Tham số ---
Tổng số truy vấn: 100
Số truy vấn trong Tập Training: 60
Số truy vấn trong Tập Testing: 40

**Đang 'tune' tham số 'alpha' trên TẬP TRAINING:**
  Thử alpha = 0.1, Điểm trung bình (training): 0.3740
  Thử alpha = 0.2, Điểm trung bình (training): 0.4294
  Thử alpha = 0.3, Điểm trung bình (training): 0.4749
  Thử alpha = 0.4, Điểm trung bình (training): 0.5103
  Thử alpha = 0.5, Điểm trung bình (training): 0.5357
  Thử alpha = 0.6, Điểm trung bình (training): 0.5511
  Thử alpha = 0.7, Điểm trung bình (training): 0.5565
  Thử alpha = 0.8, Điểm trung bình (training): 0.5520
  Thử alpha = 0.9, Điểm trung bình (training): 0.5374

==> Tham số 'alpha' tốt nhất tìm được từ TẬP TRAINING là: 0.7

--- 3. De