In [None]:
# คำสั่งที่ 1: โหลดและเตรียมข้อมูล
import pandas as pd
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split

#โหลดขเอมูลของการวิจัยโรคมะเร็ง
cancer = load_breast_cancer()

#ตารางข้อมูลที่ใช้ค่าของ feature มาเป็นหัวข้อคอลัมน์
cancer_df = pd.DataFrame(cancer.data, columns=cancer.feature_names)
cancer_df['target'] = cancer.target

#(x) ข้อมูลฟีเจอร์ทั้งหมด
#(y)  ค่าผลลัพธ์ที่พยายามเดา
X_cancer = cancer_df.drop('target', axis=1)
y_cancer = cancer_df['target']

#การแบ่งข้อมูลเป็น 70 - 30 (70 ฝึก) (30 ทบสอบ)
X_train_c, X_test_c, y_train_c, y_test_c = train_test_split(X_cancer, y_cancer, test_size=0.3, random_state=101)

#แสดงที่ถูกโหลดและแบ่งเรียบร้อย
print("Data loaded and split successfully.")
print("X_train_c shape:", X_train_c.shape)
print("X_test_c shape:", X_test_c.shape)
print("y_train_c shape:", y_train_c.shape)
print("y_test_c shape:", y_test_c.shape)

Data loaded and split successfully.
X_train_c shape: (398, 30)
X_test_c shape: (171, 30)
y_train_c shape: (398,)
y_test_c shape: (171,)


In [None]:
# คำสั่งที่ 2: ทำ Scaling และสร้างโมเดล
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

#(train คือการ คำนวณค่าเฉลี่ย)
#(test ใช้ค่าเดียวกับ train เพื่อทดสอบความถูกต้อง)
scaler_c = StandardScaler()
X_train_c_scaled = scaler_c.fit_transform(X_train_c)
X_test_c_scaled = scaler_c.transform(X_test_c)

#(n_neighbors=1) ให้ดูตัวอย่างที่ใกล้ที่สุดแค่ 1 ตัวอย่างเท่านั้น
#(fit คือการคำนวณค่าเฉลี่ย)
knn_cancer = KNeighborsClassifier(n_neighbors=1)
knn_cancer.fit(X_train_c_scaled, y_train_c)

print("Data scaled and model trained successfully.")

Data scaled and model trained successfully.


In [None]:
# คำสั่งที่ 3: ประเมินผลโมเดล
from sklearn.metrics import confusion_matrix, classification_report

# เดาผลจากกโทเดล knn ที่เราฝึกไปแล้วจะใช้ (X_test_c_scaled) เป็น input เพื่อเดาข้ออยู่ในกลุ่มไหน
y_pred_c = knn_cancer.predict(X_test_c_scaled)

#ทำนายถูกว่าจริงเป็น benign (True Positive)
#ทำนายถูกว่าจริงเป็น benign (True Positive)
print("Confusion Matrix:")
print(confusion_matrix(y_test_c, y_pred_c))

#บ่งบอกว่าโมเดลแม่นแค่ไหนในแต่ละ class
print("\nClassification Report:")
print(classification_report(y_test_c, y_pred_c))

Confusion Matrix:
[[ 61   5]
 [  3 102]]

Classification Report:
              precision    recall  f1-score   support

           0       0.95      0.92      0.94        66
           1       0.95      0.97      0.96       105

    accuracy                           0.95       171
   macro avg       0.95      0.95      0.95       171
weighted avg       0.95      0.95      0.95       171

