In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.svm import SVC
from sklearn.metrics import classification_report, confusion_matrix
import joblib

# --- 1. Đọc dữ liệu ---
df = pd.read_csv("data.csv")

# Bỏ các hàng bị thiếu giá trị
df = df.dropna()

# --- 2. Mã hóa dữ liệu chữ thành số ---
encoder = LabelEncoder()

for col in ['AnimalName', 'symptoms1', 'symptoms2', 'symptoms3', 'symptoms4', 'symptoms5', 'Dangerous']:
    df[col] = encoder.fit_transform(df[col])

# --- 3. Tách biến đầu vào và đầu ra ---
X = df.drop('Dangerous', axis=1)
y = df['Dangerous']

# --- 4. Chia dữ liệu train/test ---
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

# --- 5. Chuẩn hóa dữ liệu ---
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# --- 6. Huấn luyện mô hình SVM ---
model = SVC(kernel='rbf', C=1, gamma='scale', random_state=42)
model.fit(X_train_scaled, y_train)

# --- 7. Đánh giá ---
y_pred = model.predict(X_test_scaled)
print("Confusion matrix:\n", confusion_matrix(y_test, y_pred))
print("\nClassification report:\n", classification_report(y_test, y_pred))

# --- 8. Lưu model và scaler ---
joblib.dump(model, "svm_animal_model.pkl")
joblib.dump(scaler, "scaler.pkl")

print("✅ Huấn luyện xong! Mô hình đã lưu thành công.")


Confusion matrix:
 [[  0   4]
 [  0 170]]

Classification report:
               precision    recall  f1-score   support

           0       0.00      0.00      0.00         4
           1       0.98      1.00      0.99       170

    accuracy                           0.98       174
   macro avg       0.49      0.50      0.49       174
weighted avg       0.95      0.98      0.97       174

✅ Huấn luyện xong! Mô hình đã lưu thành công.


  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))
  _warn_prf(average, modifier, f"{metric.capitalize()} is", len(result))


# Mục mới