# **리그 오브 레전드 승률 예측 딥러닝 모델 학습**

**모듈 불러오기**

In [None]:
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
import xgboost as xgb
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score
import seaborn as sns
import joblib

**데이터셋 합치기**

In [None]:
# 빈 데이터프레임 생성
merged_df = pd.DataFrame()

# 파일들을 차례대로 읽어들여서 합침
for i in range(1, 8):
    filename = f"tsmd{i}.csv"
    filepath = f"{filename}" # 파일 경로 수정 필요
    df = pd.read_csv(filepath, encoding='utf-8')
    merged_df = pd.concat([merged_df, df], axis=0, ignore_index=True)

# 결과 출력
print(merged_df.head())

In [None]:
# 결과 출력

print(len(merged_df))
data = merged_df
# 카테고리형 데이터를 one-hot 인코딩
data = pd.get_dummies(data, columns=['blueFirstTowerLane', 'blueDragonType', 'redFirstTowerLane', 'redDragonType'])

data

**데이터셋 불러오기**

In [None]:
data.to_csv("temp.csv", header=True , index = False)

In [None]:
data = pd.read_csv('data.csv')

**데이터 전처리 및 데이터셋 분리**

In [None]:

# X, y 분리
X = data.drop(['gameId', 'timeStamp', 'blueWins'], axis=1)
y = data['blueWins']

# 학습 데이터와 테스트 데이터 분리
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


## **로지스틱 회귀**

In [None]:
# 로지스틱 회귀 모델 학습
lr_model = LogisticRegression()
lr_model.fit(X_train, y_train)

# 예측
y_pred = lr_model.predict(X_test)

# 정확도 측정
accuracy1 = accuracy_score(y_test, y_pred)
print('로지스틱 회귀 모델 정확도:', accuracy)

## **랜덤 포레스트**

In [None]:
# 랜덤 포레스트 모델 학습
rf_model = RandomForestClassifier()
rf_model.fit(X_train, y_train)

# 예측
y_pred = rf_model.predict(X_test)

# 정확도 측정
accuracy2 = accuracy_score(y_test, y_pred)
print('랜덤 포레스트 모델 정확도:', accuracy)

## **XGBoost**

In [None]:
# XGBoost 모델 학습
xgb_model = xgb.XGBClassifier()
xgb_model.fit(X_train, y_train)

# 예측
y_pred = xgb_model.predict(X_test)

# 정확도 측정
accuracy3 = accuracy_score(y_test, y_pred)
print('XGBoost 모델 정확도:', accuracy)

In [None]:


# 정확도 데이터프레임 생성
accuracy_df = pd.DataFrame({'Model': ['Logistic Regression', 'Random Forest', 'XGBoost'], 'Accuracy': [accuracy1, accuracy2, accuracy3]})

# 시각화
sns.set(style="whitegrid")
sns.barplot(x="Model", y="Accuracy", data=accuracy_df)
plt.ylim(0.6, 0.8) # y축 범위 지정
plt.title('Accuracy of League of Legends Win Prediction Models')
plt.show()

In [None]:
joblib.dump(lr_model, 'lr_model.pkl')
joblib.dump(rf_model, 'rf_model.pkl')
joblib.dump(xgb_model, 'xgb_model.pkl')