# 1. Ý tường và công thức
Thông thường để dễ so sánh hai giá trị độ chính xác (precision) và độ phủ (recall)
của những phương pháp với nhau người ta sử dụng một giá trị gọi là F-measure. F
measure là trung bình điều hòa (harmonic mean) của hai giá trị độ chính xác và độ phủ được tính bằng công thức:

F1 = 2 * (P * R) / (P + R)

# 2. Ví dụ demo cơ bản với bộ dữ liệu “Breast Cancer” của sklearn

In [1]:
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import precision_score, recall_score, f1_score
import numpy as np

In [2]:
data = load_breast_cancer()
X = data.data
y = data.target    # 1 = malignant, 0 = benign

In [3]:
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.3, random_state=42
)

In [4]:
model = LogisticRegression(max_iter=5000)
model.fit(X_train, y_train)

In [5]:
y_pred = model.predict(X_test)

In [6]:
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)

print("Precision:", precision)
print("Recall:", recall)

Precision: 0.9814814814814815
Recall: 0.9814814814814815


In [7]:
f1_manual = 2 * (precision * recall) / (precision + recall)
print("F1 (tính bằng công thức):", f1_manual)

F1 (tính bằng công thức): 0.9814814814814815


In [8]:
f1_lib = f1_score(y_test, y_pred)
print("F1 (sklearn):", f1_lib)

F1 (sklearn): 0.9814814814814815
