In [5]:
import pandas as pd
from sklearn import metrics

# Đường dẫn tới file CSV chứa nhãn
csv_path = '/Users/melancholy/Desktop/BASS/151507_BASS_labels.csv'

# Đọc dữ liệu
df = pd.read_csv(csv_path)

# Mã hóa nhãn thật (true_labels) thành số
true_labels_encoded, true_label_classes = pd.factorize(df['true_labels'])

# Lấy nhãn dự đoán
predicted_labels = df['predicted_labels']

# Tính toán các chỉ số
nmi = metrics.normalized_mutual_info_score(true_labels_encoded, predicted_labels)
hom = metrics.homogeneity_score(true_labels_encoded, predicted_labels)
com = metrics.completeness_score(true_labels_encoded, predicted_labels)

# Ghi kết quả ra file CSV
result_df = pd.DataFrame([{
    'NMI': nmi,
    'HOM': hom,
    'COM': com
}])
result_df.to_csv('/Users/melancholy/Downloads/151507_BASS_metrics.csv', index=False)

print("Done. Đã lưu kết quả tại: 151507_BASS_metrics.csv")


Done. Đã lưu kết quả tại: 151507_BASS_metrics.csv


In [9]:
import pandas as pd
from sklearn import metrics
import os

# Danh sách các dataset cần xử lý
dataset_ids = [str(i) for i in range(151507, 151511)] + [str(i) for i in range(151669, 151677)]

# Thư mục chứa các file BASS_labels
input_dir = '/Users/melancholy/Desktop/BASS'

# Danh sách lưu kết quả
results = []

for data_id in dataset_ids:
    try:
        csv_path = os.path.join(input_dir, f'{data_id}_BASS_labels.csv')
        df = pd.read_csv(csv_path)

        # Mã hóa nhãn thật (true_labels)
        true_labels_encoded, true_label_classes = pd.factorize(df['true_labels'])

        # Nhãn dự đoán
        predicted_labels = df['predicted_labels']

        # Tính toán các chỉ số
        nmi = metrics.normalized_mutual_info_score(true_labels_encoded, predicted_labels)
        hom = metrics.homogeneity_score(true_labels_encoded, predicted_labels)
        com = metrics.completeness_score(true_labels_encoded, predicted_labels)

        # Lưu kết quả
        results.append({
            'DataName': data_id,
            'Method': 'BASS',
            'NMI': nmi,
            'HOM': hom,
            'COM': com
        })

        print(f'✅ Done: {data_id}')

    except Exception as e:
        print(f'❌ Lỗi với {data_id}: {e}')

# Ghi toàn bộ kết quả vào file CSV
output_path = '/Users/melancholy/Downloads/bass_metrics.csv'
result_df = pd.DataFrame(results)
result_df.to_csv(output_path, index=False)

print("🎉 Hoàn tất. Đã lưu kết quả tại:", output_path)


✅ Done: 151507
✅ Done: 151508
✅ Done: 151509
✅ Done: 151510
✅ Done: 151669
✅ Done: 151670
✅ Done: 151671
✅ Done: 151672
✅ Done: 151673
✅ Done: 151674
✅ Done: 151675
✅ Done: 151676
🎉 Hoàn tất. Đã lưu kết quả tại: /Users/melancholy/Downloads/bass_metrics.csv


In [11]:
import pandas as pd

# Đọc hai file CSV
bass_df = pd.read_csv('/Users/melancholy/Downloads/bass_metrics.csv')
all_methods_df = pd.read_csv('/Users/melancholy/Desktop/metrics_all_methods.csv')

# Gộp hai bảng theo chiều dọc (thêm dòng)
merged_df = pd.concat([all_methods_df, bass_df], ignore_index=True)

# Ghi ra file mới
output_path = '/Users/melancholy/Downloads/metrics_combined.csv'
merged_df.to_csv(output_path, index=False)

print("✅ Đã gộp và lưu tại:", output_path)


✅ Đã gộp và lưu tại: /Users/melancholy/Downloads/metrics_combined.csv
