In [7]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.tree import DecisionTreeClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.neighbors import KNeighborsClassifier
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score, confusion_matrix
from sklearn.preprocessing import StandardScaler

# 파일 경로 지정
file_path = r"C:\Gachon\3-1\인공지능개론\wine.csv"

# CSV 파일 읽기
df = pd.read_csv(file_path)

# 결측치 확인
print("\n결측치 확인:")
print(df.isnull().sum())


결측치 확인:
Wine                    0
Alcohol                 0
Malic.acid              0
Ash                     0
Acl                     0
Mg                      0
Phenols                 0
Flavanoids              0
Nonflavanoid.phenols    0
Proanth                 0
Color.int               0
Hue                     0
OD                      0
Proline                 0
dtype: int64


In [9]:
# 독립 변수와 종속 변수 분리
X = df.drop(columns='Wine')
y = df['Wine']

# 데이터 스케일링
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 훈련 세트와 테스트 세트로 분리
X_train, X_test, y_train, y_test = train_test_split(
    X_scaled, y, test_size=0.2, random_state=42
)

# 분류기 정의
classifiers = {
    "Random Forest": RandomForestClassifier(),
    "Decision Tree": DecisionTreeClassifier(),
    "Logistic Regression": LogisticRegression(max_iter=1000),
    "K-Nearest Neighbors": KNeighborsClassifier(),
    "Support Vector Machine": SVC()
}

# 각 모델 학습 및 평가
for model_name, clf in classifiers.items():
    print(f"\n{model_name} 모델:")
    clf.fit(X_train, y_train)                 # 모델 학습
    y_pred = clf.predict(X_test)              # 예측
    accuracy = accuracy_score(y_test, y_pred) # 정확도 계산
    print(f"정확도: {accuracy:.4f}")
    print("혼동 행렬:")
    print(confusion_matrix(y_test, y_pred))


Random Forest 모델:
정확도: 1.0000
혼동 행렬:
[[14  0  0]
 [ 0 14  0]
 [ 0  0  8]]

Decision Tree 모델:
정확도: 0.9444
혼동 행렬:
[[13  1  0]
 [ 0 14  0]
 [ 0  1  7]]

Logistic Regression 모델:
정확도: 1.0000
혼동 행렬:
[[14  0  0]
 [ 0 14  0]
 [ 0  0  8]]

K-Nearest Neighbors 모델:
정확도: 0.9444
혼동 행렬:
[[14  0  0]
 [ 1 12  1]
 [ 0  0  8]]

Support Vector Machine 모델:
정확도: 1.0000
혼동 행렬:
[[14  0  0]
 [ 0 14  0]
 [ 0  0  8]]
