In [2]:
#นำเข้าไลบรารี
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import  accuracy_score, classification_report
from sklearn.datasets import load_iris

#โหลดชุดข้อมูล
iris = load_iris()
X = iris.data # Features
y = iris.target # Labels (0 = Setosa, 1 = Versicolor, 2 = Virginica)

#แปลงเป็น DataFrame เพื่อดูข้อมูล
df = pd.DataFrame(X, columns=iris.feature_names)
df['species'] = y
df.head()

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm),species
0,5.1,3.5,1.4,0.2,0
1,4.9,3.0,1.4,0.2,0
2,4.7,3.2,1.3,0.2,0
3,4.6,3.1,1.5,0.2,0
4,5.0,3.6,1.4,0.2,0


In [5]:
# แบ่งข้อมูลเป็น 80% train และ 20% test
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# ปรับขนาดข้อมูลให้เหมาะสม (Normalization)
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

In [4]:
# กำหนดค่า K
k = 5

# สร้างโมเดล KNN
knn = KNeighborsClassifier(n_neighbors=k)

# ฝึกโมเดล
knn.fit(X_train, y_train)

# ทำนายค่าบนชุดทดสอบ
y_pred = knn.predict(X_test)

In [6]:
# ความแม่นยำของโมเดล
accuracy = accuracy_score(y_test, y_pred)
print(f"Accuracy: {accuracy:.2f}")

# รายงานผลการจำแนกประเภท
print(classification_report(y_test, y_pred, target_names=iris.target_names))

Accuracy: 1.00
              precision    recall  f1-score   support

      setosa       1.00      1.00      1.00        10
  versicolor       1.00      1.00      1.00         9
   virginica       1.00      1.00      1.00        11

    accuracy                           1.00        30
   macro avg       1.00      1.00      1.00        30
weighted avg       1.00      1.00      1.00        30



In [7]:
# ทำนายค่าบนชุดทดสอบ
y_pred = knn.predict(X_test)

# แสดงผลลัพธ์
print("ค่าจริง (Actual):", y_test)
print("ค่าที่ทำนายได้ (Predicted):", y_pred)

ค่าจริง (Actual): [1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0]
ค่าที่ทำนายได้ (Predicted): [1 0 2 1 1 0 1 2 1 1 2 0 0 0 0 1 2 1 1 2 0 2 0 2 2 2 2 2 0 0]


In [8]:
# ข้อมูลใหม่ (sepal length, sepal width, petal length, petal width)
new_data = [[5.1, 3.5, 1.4, 0.2]] # ใส่ค่าที่ต้องการทดสอบ

# ทำการ Normalize ข้อมูลใหม่ก่อน (ต้องใช้ scaler ที่ fit มากับ Training Data)
new_data_scaled = scaler.transform(new_data)

# ทำนายคลาสของข้อมูลใหม่
new_prediction = knn.predict(new_data_scaled)

# แสดงผลลัพธ์
print("ข้อมูลใหม่:", new_data)
print("ผลลัพธ์ที่ทำนายได้", iris.target_names[new_prediction[0]])

ข้อมูลใหม่: [[5.1, 3.5, 1.4, 0.2]]
ผลลัพธ์ที่ทำนายได้ setosa


In [11]:
# ข้อมูลหลายชุดที่ต้องการทำนาย
new_samples = [
    [5.8, 2.7, 4.1, 1.0], # Versicolor ?
    [6.7, 3.1, 5.6, 2.4], # Virginica ?
    [5.0, 3.4, 1.5, 0.2] # Setosa ?
]

# ปรับขนาดข้อมูลใหม่ด้วย scaler
new_samples_scaler = scaler.transform(new_samples)

# ทำนายค่าของข้อมูลใหม่
predictions = knn.predict(new_samples_scaler)

#แสดงผลลัพธ์
for i, pred in enumerate(predictions):
    print(f"ข้อมูล: {new_samples[i]} ทำนายว่าเป็น {iris.target_names[pred]}")

ข้อมูล: [5.8, 2.7, 4.1, 1.0] ทำนายว่าเป็น versicolor
ข้อมูล: [6.7, 3.1, 5.6, 2.4] ทำนายว่าเป็น virginica
ข้อมูล: [5.0, 3.4, 1.5, 0.2] ทำนายว่าเป็น setosa
