In [2]:
import warnings
import pandas as pd
from sklearn.datasets import load_iris
from lightgbm import LGBMClassifier
from sklearn.model_selection import train_test_split

warnings.filterwarnings('ignore')

# 데이터 준비
iris = load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['species'] = iris.target

X = df.drop('species', axis=1)
y = df['species']

# 학습/테스트 데이터 분리
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42, stratify=y
)

# LightGBM 모델 정의
clf = LGBMClassifier(
    n_estimators=200,      # 트리 개수
    learning_rate=0.1,     # 학습률
    max_depth=5,           # 트리 최대 깊이
    reg_lambda=1.0,        # L2 규제
    random_state=100,
    verbose = -1
)

# 학습
clf.fit(X_train, y_train)

# 성능 평가
print("훈련 정확도:", clf.score(X_train, y_train))
print("테스트 정확도:", clf.score(X_test, y_test))

# Feature Importance 출력
for i, feature in enumerate(iris.feature_names):
    print(f'{feature} : {clf.feature_importances_[i]}')

훈련 정확도: 1.0
테스트 정확도: 0.9
sepal length (cm) : 323
sepal width (cm) : 342
petal length (cm) : 482
petal width (cm) : 318
