## Tải dữ liệu đã xử lý

### Subtask:
Tải dữ liệu đã xử lý từ tệp `pima-indians-diabetes_preprocessed.csv` vào DataFrame.


In [20]:
import pandas as pd

df_processed_model = pd.read_csv('pima-indians-diabetes_preprocessed.csv')

## Chuẩn bị dữ liệu cho mô hình

### Subtask:
Tách các đặc trưng (features) và biến mục tiêu (target).


In [21]:
X = df_processed_model.drop('Outcome', axis=1)
y = df_processed_model['Outcome']

## Chia dữ liệu

### Subtask:
Chia dữ liệu đã xử lý thành tập huấn luyện và tập kiểm tra.


In [22]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

## Thực hiện cross-validation

### Subtask:
Áp dụng cross-validation để đánh giá mô hình một cách mạnh mẽ hơn.


In [23]:
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import cross_val_score

model = LogisticRegression(max_iter=200)
scores = cross_val_score(model, X_train, y_train, cv=5, scoring='accuracy')
print("Cross-validation scores:", scores)

Cross-validation scores: [0.74796748 0.76422764 0.7804878  0.72131148 0.77868852]


## Huấn luyện mô hình cuối cùng

### Subtask:
Huấn luyện mô hình trên toàn bộ tập huấn luyện sau khi đã chọn mô hình và siêu tham số tối ưu (nếu có).


In [24]:
model = LogisticRegression(max_iter=200)
model.fit(X_train, y_train)

## Đánh giá mô hình cuối cùng

### Subtask:
Đánh giá hiệu suất của mô hình cuối cùng trên tập kiểm tra.


In [25]:
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score

y_pred = model.predict(X_test)

accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)

print(f'Accuracy: {accuracy:.4f}')
print(f'Precision: {precision:.4f}')
print(f'Recall: {recall:.4f}')
print(f'F1-score: {f1:.4f}')

Accuracy: 0.7987
Precision: 0.7708
Recall: 0.6491
F1-score: 0.7048


## Lưu kết quả đánh giá mô hình

### Subtask:
Lưu các chỉ số đánh giá hiệu suất mô hình vào một tệp.

In [26]:
results = {
    'Accuracy': accuracy,
    'Precision': precision,
    'Recall': recall,
    'F1 Score': f1
}

with open('model_evaluation_results.txt', 'w') as f:
    for key, value in results.items():
        f.write(f"{key}: {value:.4f}\n")

print("Kết quả đánh giá mô hình đã được lưu vào tệp 'model_evaluation_results.txt'.")

Kết quả đánh giá mô hình đã được lưu vào tệp 'model_evaluation_results.txt'.
