In [4]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.svm import SVC
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 데이터 로드
file_path = "/Users/marchen/Desktop/programming/AI/Second week/mobile.csv"  # 파일 경로
df = pd.read_csv(file_path)

# 데이터 확인
print(df.head())  # 상위 5개 데이터
print(df.info())  # 나머지 데이터 타입 및 값 확인
print(f"총 데이터 개수: {df.shape[0]}")  # 데이터 개수 출력

# 입력(X)과 타겟(Y) 분리
X = df.iloc[:, :-1]   # 마지막 price_range 컬럼 제외한 입력 데이터
Y = df["price_range"] # 타겟 변수 (예측할 값)

# 데이터 스케일링 (SVM과 LR을 위해 StandardScaler 사용)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 훈련, 테스트 데이터
X_train, X_test, Y_train, Y_test = train_test_split(X_scaled, Y, test_size=0.2, random_state=42, stratify=Y)

# 모델
models = {
    "DT": DecisionTreeClassifier(),
    "RF": RandomForestClassifier(n_estimators=100),
    "SVM": SVC(kernel='rbf', C=1.0),
    "LR": LogisticRegression(max_iter=200)
}

# 모델 학습 및 평가
for name, model in models.items():
    model.fit(X_train, Y_train)  # 모델 학습
    Y_pred = model.predict(X_test)  # 예측
    accuracy = accuracy_score(Y_test, Y_pred)  # 정확도 계산

    print(f"{name} 예측값: {Y_pred[:5]}")  # 첫 5개 예측값 출력
    print(f"{name} 정확도: {accuracy:.4f}\n")  # 정확도 출력


   battery_power  blue  clock_speed  dual_sim  fc  four_g  int_memory  m_dep  \
0            842     0          2.2         0   1       0           7    0.6   
1           1021     1          0.5         1   0       1          53    0.7   
2            563     1          0.5         1   2       1          41    0.9   
3            615     1          2.5         0   0       0          10    0.8   
4           1821     1          1.2         0  13       1          44    0.6   

   mobile_wt  n_cores  ...  px_height  px_width   ram  sc_h  sc_w  talk_time  \
0        188        2  ...         20       756  2549     9     7         19   
1        136        3  ...        905      1988  2631    17     3          7   
2        145        5  ...       1263      1716  2603    11     2          9   
3        131        6  ...       1216      1786  2769    16     8         11   
4        141        2  ...       1208      1212  1411     8     2         15   

   three_g  touch_screen  wifi  price_