<a href="https://colab.research.google.com/github/Minch13r/DeepLearn/blob/main/%EC%95%99%EC%83%81%EB%B8%94_%EC%98%88%EC%8B%9C.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [11]:
# 필요한 라이브러리 임포트
import numpy as np
from sklearn.datasets import make_classification
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier, GradientBoostingClassifier, VotingClassifier
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score

In [2]:
# 1. 데이터 생성
X, y = make_classification(
    n_samples=1000,  # 1000개의 샘플
    n_features=20,   # 20개의 특성
    n_classes=2,     # 이진 분류
    random_state=42
)

In [3]:
# 2. 데이터 분할
X_train, X_test, y_train, y_test = train_test_split(
    X, y,
    test_size=0.2,   # 테스트 데이터 20%
    random_state=42
)

In [4]:
# 3. 개별 모델 생성

In [5]:
# 3.1 랜덤 포레스트 모델
rf = RandomForestClassifier(
    n_estimators=100,    # 트리 100개 사용
    random_state=42
)

In [6]:
# 3.2 그래디언트 부스팅 모델
gb = GradientBoostingClassifier(
    n_estimators=100,    # 트리 100개 사용
    random_state=42
)

In [7]:
# 3.3 로지스틱 회귀 모델
lr = LogisticRegression(random_state=42)

In [8]:
# 4. 보팅 앙상블 모델 생성
voting_clf = VotingClassifier(
    estimators=[
        ('rf', rf),          # 랜덤 포레스트
        ('gb', gb),          # 그래디언트 부스팅
        ('lr', lr)           # 로지스틱 회귀
    ],
    voting='soft'    # 확률 기반 보팅
)

In [9]:
# 5. 모델 학습 및 평가를 위한 딕셔너리 생성
models = {
    'Random Forest': rf,
    'Gradient Boosting': gb,
    'Logistic Regression': lr,
    'Voting Ensemble': voting_clf
}


In [12]:
# 6. 각 모델 학습 및 평가
for name, model in models.items():
    # 모델 학습
    model.fit(X_train, y_train)

    # 예측
    y_pred = model.predict(X_test)

    # 정확도 계산
    accuracy = accuracy_score(y_test, y_pred)
    print(f"{name} 정확도: {accuracy:.4f}")

Random Forest 정확도: 0.9000
Gradient Boosting 정확도: 0.9150
Logistic Regression 정확도: 0.8550
Voting Ensemble 정확도: 0.8900


In [13]:
# 7. 실제 예측 예시
# 테스트 데이터의 첫 번째 샘플로 예측해보기
sample = X_test[0].reshape(1, -1)
for name, model in models.items():
    prediction = model.predict(sample)
    probability = model.predict_proba(sample)
    print(f"\n{name}:")
    print(f"예측 클래스: {prediction[0]}")
    print(f"클래스별 확률: {probability[0]}")


Random Forest:
예측 클래스: 1
클래스별 확률: [0.25 0.75]

Gradient Boosting:
예측 클래스: 1
클래스별 확률: [0.13416474 0.86583526]

Logistic Regression:
예측 클래스: 1
클래스별 확률: [0.35111201 0.64888799]

Voting Ensemble:
예측 클래스: 1
클래스별 확률: [0.24509225 0.75490775]
