In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

# 데이터 로드
file_path = 'mushrooms.csv'  # 경로를 파일의 실제 경로로 변경하세요.
mushroom_data = pd.read_csv(file_path)

# 범주형 데이터를 숫자로 변환
label_encoder = LabelEncoder()
mushroom_data_encoded = mushroom_data.apply(label_encoder.fit_transform)

# 특성과 타겟 분리
X = mushroom_data_encoded.drop('class', axis=1)
y = mushroom_data_encoded['class']

# 훈련 세트와 테스트 세트로 분할 (70% 훈련, 30% 테스트)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# 로지스틱 회귀 모델 학습
log_reg = LogisticRegression(random_state=42, max_iter=1000)
log_reg.fit(X_train, y_train)

# 테스트 세트로 예측
y_pred = log_reg.predict(X_test)

# 정확도 계산
accuracy = accuracy_score(y_test, y_pred)
print(f"모델 정확도: {accuracy * 100:.2f}%")

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder, StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score
from sklearn.model_selection import GridSearchCV

# 데이터 로드
file_path = 'mushrooms.csv'  # 경로를 파일의 실제 경로로 변경하세요.
mushroom_data = pd.read_csv(file_path)

# 범주형 데이터를 숫자로 변환
label_encoder = LabelEncoder()
mushroom_data_encoded = mushroom_data.apply(label_encoder.fit_transform)

# 특성과 타겟 분리
X = mushroom_data_encoded.drop('class', axis=1)
y = mushroom_data_encoded['class']

# 특성 스케일링 (표준화)
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# 훈련 세트와 테스트 세트로 분할 (70% 훈련, 30% 테스트)
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

# 로지스틱 회귀 모델 (규제 파라미터 C 최적화)
param_grid = {'C': [0.01, 0.1, 1, 10, 100]}
grid_search = GridSearchCV(LogisticRegression(random_state=42, max_iter=1000), param_grid, cv=5)
grid_search.fit(X_train, y_train)

# 최적 모델로 예측
best_model = grid_search.best_estimator_
y_pred = best_model.predict(X_test)

# 정확도 계산
accuracy = accuracy_score(y_test, y_pred)
print(f"최적 모델의 정확도: {accuracy * 100:.2f}%")