In [None]:
# Cell 1: Imports
import json
import matplotlib.pyplot as plt
import os

# Cell 2: Parameters
# tags=["parameters"]
METRICS_PATH = '../data/processed/semi_metrics.json'

# Cell 3: Main Execution
print("--- BẮT ĐẦU: BÁO CÁO SEMI-SUPERVISED ---")

if not os.path.exists(METRICS_PATH):
    print("Không tìm thấy file kết quả. Hãy chạy semi_self_training.ipynb trước!")
else:
    # 1. Load metrics
    with open(METRICS_PATH, 'r') as f:
        metrics = json.load(f)
    
    acc_self = metrics['self_training_accuracy']
    acc_base = metrics['baseline_accuracy']
    
    print(f"Self-Training Acc: {acc_self:.4f}")
    print(f"Baseline Acc:      {acc_base:.4f}")
    
    # 2. Vẽ biểu đồ so sánh
    labels = ['Supervised (10% Data)', 'Self-Training (10% + Pseudo)']
    values = [acc_base, acc_self]
    
    plt.figure(figsize=(8, 6))
    bars = plt.bar(labels, values, color=['gray', 'green'])
    
    # Thêm số liệu lên cột
    for bar in bars:
        yval = bar.get_height()
        plt.text(bar.get_x() + bar.get_width()/2, yval + 0.005, f"{yval:.4f}", ha='center', va='bottom', fontsize=12)
        
    plt.ylim(0, 1.05) # Accuracy tối đa là 1
    plt.ylabel('Accuracy')
    plt.title('Hiệu quả của Semi-Supervised Learning (Self-Training)')
    plt.grid(axis='y', linestyle='--', alpha=0.7)
    
    # Lưu biểu đồ (tùy chọn)
    plt.savefig('../data/processed/semi_comparison_chart.png')
    plt.show()
    
    # 3. Kết luận
    improvement = (acc_self - acc_base) * 100
    print("\n--- NHẬN XÉT ---")
    if improvement > 0:
        print(f"Mô hình Self-Training đã cải thiện độ chính xác thêm {improvement:.2f}% so với việc chỉ dùng dữ liệu có nhãn ít ỏi.")
        print("Điều này chứng tỏ việc tận dụng dữ liệu không nhãn (unlabeled) thông qua giả nhãn (pseudo-labeling) có hiệu quả.")
    else:
        print("Mô hình Self-Training không cải thiện hoặc kém hơn Baseline.")
        print("Nguyên nhân có thể do ngưỡng tin cậy (threshold) quá thấp khiến nhiễu (noise) bị gán nhãn sai và đưa vào train lại.")