In [136]:
import pandas as pd
# CSV 파일 로드 (파일 경로 수정 필수)
file_path = "./iris.csv"
df = pd.read_csv(file_path)

# 데이터 확인
print(df.head())
print(df.columns)

   SepalLength  SepalWidth  PetalLength  PetalWidth         Name
0          5.1         3.5          1.4         0.2  Iris-setosa
1          4.9         3.0          1.4         0.2  Iris-setosa
2          4.7         3.2          1.3         0.2  Iris-setosa
3          4.6         3.1          1.5         0.2  Iris-setosa
4          5.0         3.6          1.4         0.2  Iris-setosa
Index(['SepalLength', 'SepalWidth', 'PetalLength', 'PetalWidth', 'Name'], dtype='object')


In [138]:
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
from sklearn.preprocessing import StandardScaler

In [140]:
# 특성과 레이블 분리
X = df.iloc[:, :-1]  # 마지막 열을 제외한 모든 열 (특성)
y = df.iloc[:, -1]   # 마지막 열 (레이블)

# 데이터셋을 학습용(train)과 테스트용(test)으로 분리 (6:4 비율)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.4, random_state=42)

In [142]:
# SVM과 Logistic Regression만 정규화 적용
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)  # 학습 데이터 변환
X_test_scaled = scaler.transform(X_test)  # 테스트 데이터 변환

In [144]:
# 모델 리스트
models = {
    "Decision Tree": DecisionTreeClassifier(random_state=42),
    "Random Forest": RandomForestClassifier(random_state=42),
    "Support Vector Machine": SVC(random_state=42),
    "Logistic Regression": LogisticRegression(max_iter=200)
}

In [146]:
for name, model in models.items():
    if name in ["SVM", "Logistic Regression"]:
        model.fit(X_train_scaled, y_train)  # 정규화된 데이터 사용
        y_pred = model.predict(X_test_scaled)
    else:
        model.fit(X_train, y_train)  # 원본 데이터 사용
        y_pred = model.predict(X_test)

    accuracy = accuracy_score(y_test, y_pred)
    print(f"{name} 정확도: {accuracy:.4f}")

Decision Tree 정확도: 0.9667
Random Forest 정확도: 0.9833
Support Vector Machine 정확도: 1.0000
Logistic Regression 정확도: 0.9833
