# 유저 아이템 획득 패턴 분석과 개선 전략

* 분석의 목적

** 영웅의 성장 레벨에 맞게 아이템을 획득 하였는가?

* 과정

** 로그 시뮬레이션과 시뮬레이션 결과에 따른 개선 방향

** 개선 전략에 필요한 사용자 로그 설계

** 부위별 아이템의 분포 확인

* 데이터 분석을 통해 확인: 전반적(부위, 등급등) 아이템 획득 분포 확인

* 의사결정: 아이템 등급 별 분포 개선

In [None]:
# 한글 글꼴 설치하기
!sudo apt-get install -y fonts-nanum
!sudo fc-cache -fv
!rm ~/.cache/matplotlib -rf

# [런타임]-[세션 다시 시작] 메뉴 // 재실행?

In [None]:
import pandas as pd
import matplotlib.pyplot as plt

In [None]:
# 한글 글꼴 설정하기
plt.rc('font', family = 'NanumGothic', size = 12)

# 음수 축 설정하기
plt.rc('axes', unicode_minus = False)

In [None]:
from google.colab import drive
drive.mount('/content/drive')

In [None]:
# 외부 데이터 불러오기(db_item.csv)
file_path = '/content/drive/MyDrive/파이썬데이터시각화/SpaceProbe_data/db_item.csv'

df = pd.read_csv(file_path, encoding='CP949', index_col='ItemID', usecols=['ItemID', 'ItemTier', 'HeroClassTypeList', 'EquipSlotType', 'GradeType'])
df

In [None]:
# 'ItemTier' col을 기준으로 그룹화하여 나머지 col의 갯수 구하기
df.groupby('ItemTier').count()

In [None]:
# 'GradeType' col을 기준으로 그룹화하여 나머지 col의 갯수 구하기
# 임시로 # 'GradeType' col이 index가 된다.(원본이 바뀌진 않는다.)
df.groupby('GradeType').count()

In [None]:
# 'HeroClassTypeList' col을 기준으로 그룹화하여 나머지 col의 갯수 구하기
df.groupby('HeroClassTypeList').count()

In [None]:
# 'EquipSlotType' col을 기준으로 그룹화하여 나머지 col의 갯수 구하기
df.groupby('EquipSlotType').count()

In [None]:
# 'GradeType' col을 기준으로 그룹화하여 'HeroClassTypeList'와 'EquipSlotType' col의 갯수 구하기
df.groupby('GradeType')[['HeroClassTypeList', 'EquipSlotType']].count()

In [None]:
# index 확인하기
df.index

In [None]:
# 'GradeType'이 임시로 index가 되므로, 현재 DataFrame을 'df_g'에 할당하고 그룹화된 데이터를 다른 DataFrame으로 생성한다.
df_g = df.groupby('GradeType')[['HeroClassTypeList', 'EquipSlotType']].count()
df_g

In [None]:
# df의 index 알아보기
df.index

In [None]:
# df_g의 index 알아보기
df_g.index

cmap(colormaps) 색상명 : https://matplotlib.org/stable/users/explain/colors/colormaps.html

In [None]:
# 산점도 그래프 만들기

# c : 색상
# scatter(x, y, c)
plt.scatter(df_g['HeroClassTypeList'], df_g['EquipSlotType'], c='#33FFCE')

# 텍스트 레이블 추가하기
# plt.text(x, y, 텍스트레이블) : x, y는 텍스트레이블 위치
# ha : 'left', 'center', 'right'
for i, val in enumerate(df_g.index):
    plt.text(df_g['HeroClassTypeList'][i], df_g['EquipSlotType'][i]+40, val, ha = 'center', color='red', fontdict={'size': 10})

plt.xlabel('HeroClassTypeList') # x축 레이블
plt.ylabel('EquipSlotType')     # y축 레이블
plt.show()