In [1]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
warnings.filterwarnings('ignore')

plt.rcParams["font.family"] = 'NanumGothic'

In [None]:
df_org = pd.read_csv("밀리시타 애정도 설문(응답) - 설문지 응답 시트1.csv")

In [None]:
df_org.head(1)

In [None]:
df_org.shape

In [None]:
df = df_org.copy()

In [None]:
color = '#673AB7'

# 담당 아이돌

## 담당 수

In [None]:
num_idol = df['당신의 담당 아이돌은 누구인가요?'].str.split(',').str.len().value_counts()

x_plot_min = 0
x_plot_max =15


fig, ax = plt.subplots(figsize=(12, 6), facecolor='white')
for location in ['right', 'top', 'left']:
    ax.spines[location].set_linewidth(0)
plt.bar(x=num_idol.index, height=num_idol.values, color=color, width=0.6)
plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(num_idol.index, num_idol.values):
    annot = f'{val}\n({val/len(df)*100:.1f}%)\n|'
    plt.annotate(text=annot, xy=(idx, val), ha='center', va='bottom', fontsize=13)

plt.grid(axis='y')
plt.xticks(range(x_plot_min, x_plot_max))
plt.yticks(range(0, max(num_idol) // 10 * 10 + 15, 10))
plt.ylim((0, max(num_idol) // 10 * 10 + 15))
plt.tick_params(length=0)
plt.title(f'담당하고 있는 아이돌의 수\n평균 {(num_idol[num_idol.index < 20] * num_idol[num_idol.index < 20].index).sum() / num_idol[num_idol.index < 20].sum():.2f}명', fontsize=18)
plt.show()

In [None]:
df[df['당신의 담당 아이돌은 누구인가요?'].str.split(',').str.len() >= 20].shape

## 합승 많은 아이돌

In [None]:
idols = ['하루카', '치하야', '미키', '유키호', '야요이', '마코토', '이오리', '타카네', '리츠코', '아즈사', '아미', '마미', '히비키',
        '미라이', '시즈카', '츠바사', '코토하', '엘레나', '미나코', '메구미', '마츠리', '세리카', '아카네', '안나', '로코', '유리코',
        '사요코', '아리사', '우미', '이쿠', '토모카', '에밀리', '시호', '아유무', '히나타', '카나', '나오', '치즈루', '코노미',
        '타마키', '후카', '미야', '노리코', '미즈키', '카렌', '리오', '스바루', '레이카', '모모코', '줄리아', '츠무기', '카오리']

df_idol_join = df[(df['당신의 담당 아이돌은 누구인가요?'].str.split(',').str.len() > 1) & (df['당신의 담당 아이돌은 누구인가요?'].str.split(',').str.len() < 20)]['당신의 담당 아이돌은 누구인가요?']

In [None]:
idol_join = {idol:0 for idol in idols}

for val in df_idol_join.values:
    val_idols = val.split(', ')
    for val_idol in val_idols:
        idol_join[val_idol] += 1

In [None]:
y = list(idol_join.keys())[::-1]
x = list(idol_join.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 20), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x) + 2

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 2))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)
plt.title(f'합승 수 많은 아이돌', fontsize=18)
plt.show()

## 서로 많이 담당되는 아이돌

In [None]:
from itertools import combinations

idol_cmb = list(combinations(idols, 2))
idol_cmb = [f'{i1}-{i2}' for i1, i2 in idol_cmb]

In [None]:
idol_cmb_dict = {cmb:0 for cmb in idol_cmb}

for val in df_idol_join.values:
    val_idols = val.split(', ')
    val_cmb = list(combinations(val_idols, 2))
    val_cmb = [f'{i1}-{i2}' for i1, i2 in val_cmb]
    for v_cmb in val_cmb:
        idol_cmb_dict[v_cmb] += 1

In [None]:
dict(filter(lambda x:x[1] > 2, idol_cmb_dict.items()))

In [None]:
dict(filter(lambda x:x[1] == 2, idol_cmb_dict.items()))

In [None]:
idol_cmb_dict['에밀리-츠무기']

In [None]:
idol_cmb_dict['이쿠-타마키']

In [None]:
idol_cmb_dict['안나-로코']

## 플레이 기간 - 담당 아이돌 평균

In [None]:
df_play_avg_idol = df[['당신의 담당 아이돌은 누구인가요?', '밀리시타를 얼마나 오랜 기간 플레이 중인가요?']]
df_play_avg_idol['담당수'] = df_play_avg_idol['당신의 담당 아이돌은 누구인가요?'].str.split(',').str.len()
df_play_avg_idol = df_play_avg_idol[df_play_avg_idol['담당수']<20]
df_play_avg_idol_group = df_play_avg_idol.groupby(['밀리시타를 얼마나 오랜 기간 플레이 중인가요?']).mean()[['담당수']]
df_play_avg_idol_group

In [None]:
y = list(df_play_avg_idol_group.index)[::-1]
x = list(df_play_avg_idol_group.iloc[:,0].values)[::-1]

fig, ax = plt.subplots(figsize=(12, 4), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x)+0.1

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val:.2f}명'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, int(x_plot_max)+1))
plt.yticks(y, fontsize=13)
plt.tick_params(length=0)

plt.title(f'평균 담당 아이돌 수', fontsize=18)
plt.show()

# 유입

In [None]:
def make_counts_etc(data, column_name, categories):
    """
    설문 항목에서 "기타" 부분을 하나로 묶어, 각 항목들의 개수를 세어주는 함수
    
    
    data: pd.DataFrame
    column_name: 열 이름
    categories: 항목 이름
    """
    import copy
    categories = copy.deepcopy(categories)
    
    if '기타' not in categories:
        categories.append('기타')
        
    counts = {cate:0 for cate in categories}
    etcs = []

    for val in data[column_name].values:
        val_tmp = val
        for cate in categories:
            if cate in val_tmp:
                counts[cate] += 1
                val_tmp = val_tmp.replace(cate, '')

        val_tmp = val_tmp.replace(',', '').strip()
        if len(val_tmp) > 0:
            counts['기타'] += 1
            etcs.append(val_tmp)
            
    return counts, etcs

In [None]:
in_values = ['그리마스', '아이돌마스터 애니(본가)', '아이돌마스터 애니(신데마스)', '아이돌마스터 애니(사이드엠)', '아이돌마스터 애니(U-149)',
            '아이돌마스터 애니(밀리언 라이브) 소식 (vs밀리애니)', '아케마스(2005) ~ 스텔라 스테이지(2017) 사이의 아이마스 콘솔 게임',
            '스탈릿 시즌(2021)', '밀리시타 한국 서버', '신데렐라 걸즈의 IP 게임 (데레스테 등)', '사이드엠 IP의 게임', 
            '샤이니 컬러즈 IP의 게임', '리듬 게임 찾다가', '씹덕 게임 찾다가', '커뮤니티(디시, 아카라이브 등) 유입 (타갤에서 짤이나 디시콘 등으로)',
            '기타']

in_counts, etcs = make_counts_etc(df, '밀리시타에 어떻게 유입되었나요?', in_values)

In [None]:
in_counts

In [None]:
for etc in etcs:
    print(etc)

- 친구, 지인 14
- 인방, 유튜브 8
- 노래 8
- 나무위키 2
- 배우기
- 동방이랑 페이트 맛보다가 3대장인 아이마스는 뭘까...하고 찍어먹으려다 풍덩빠죴음
- 떡인지
- 어쩌다 무료연 준다길래 듣고 시작함
- 믿갸지지 않겠지만 아이돌마스터 KR
- 군대에서 나온 소식듣고 전역후 짬짬히시작
- 태고의 달인 키라메키라리
- 아즈사씨를 보고 한눈에 반함
- 코로나 시기 할거없어서 애니마스보고 감동받아 조타를 찾아서 깔게됨
- 푸치마스
- 방도리하다가 옆집겜 나와서 출시일부터 달림
- 굿즈샵에서 아크릴 키링을 샀는데 그게 아카네였고 그대로 밀리 유입

In [None]:
y = list(in_counts.keys())[::-1]
x = list(in_counts.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 8), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
    
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x) + 10

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 10))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'유입 유형', fontsize=18)
plt.show()

# 애정도 점수

In [None]:
df_play = df_org.copy()

In [None]:
df_play['밀리시타에 대한 애정도를 숫자로 표현한다면?'].mean()

## 플레이 기간 - 애정도 관계

In [None]:
df_play_group = df_play.groupby(['밀리시타를 얼마나 오랜 기간 플레이 중인가요?']).mean()[['밀리시타에 대한 애정도를 숫자로 표현한다면?']]
df_play_group

In [None]:
y = list(df_play_group.index)[::-1]
x = list(df_play_group.iloc[:,0].values)[::-1]

fig, ax = plt.subplots(figsize=(15, 4), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = 10

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val:.2f}점'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max))
plt.yticks(y, fontsize=13)
plt.tick_params(length=0)

plt.title(f'애정도 평균 점수', fontsize=18)
plt.show()

In [None]:
pd.pivot_table(data=df_play, index='밀리시타를 얼마나 오랜 기간 플레이 중인가요?', columns='밀리시타에 대한 애정도를 숫자로 표현한다면?', aggfunc='count', values='타임스탬프').fillna(0).astype(int)

# 좋아하는 이유

In [None]:
like_values = ['아이돌이 예쁘고 귀여워서', '아이돌 및 이벤트 커뮤가 재미있어서', '일러스트 및 공식 만화(4컷, 오프샷 등) 퀄리티가 좋아서',
               '다양한 곡이 있어서, 노래가 좋아서', '리듬 게임에 흥미를 느껴서 (채보, 스코어링 등)', '꾸준한 곡 업데이트가 있어서', '기타']

like_counts, etcs = make_counts_etc(df, '밀리시타를 좋아하는 이유가 무엇인가요?', like_values)

In [None]:
like_counts

In [None]:
for etc in etcs:
    print(etc)

- 담당 14
    - 토요카와 후카
    - 미라이가 귀여워서
    - 치하야가 나오는 모바일게임이라
    - 타카네가 살아 움직이는 갓겜
- 솔로컴온
- 데레보단 과금 유도가 덜함
- 노래 좋고 리겜이여서 재밌음
- 안무
- 느긋함
- 이벤트 달리는게 재밌음
- 오토가 있어서
- 저는 밀리시타를 좋아하지 않습니다
- 아이돌마스터여서
- 의상 예쁜거도 많음

In [None]:
y = list(like_counts.keys())[::-1]
x = list(like_counts.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 5), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x) + 12

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 20))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'밀리시타를 좋아하는 이유', fontsize=18)
plt.show()

# 접었던 경험 - 애정도 관계

In [None]:
df.groupby(['밀리시타를 접고 복귀한 경험이 있나요?']).mean()[['밀리시타에 대한 애정도를 숫자로 표현한다면?']]

In [None]:
scores_dict = df.groupby(['밀리시타를 접고 복귀한 경험이 있나요?']).mean()['밀리시타에 대한 애정도를 숫자로 표현한다면?'].to_dict()

y = list(scores_dict.keys())[::-1]
x = list(scores_dict.values())[::-1]

fig, ax = plt.subplots(figsize=(8, 2), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = int(max(x)) + 1

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val:.2f}점'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 20))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'접었던 경험 - 애정도 관계', fontsize=18)
plt.show()

In [None]:
fig, ax = plt.subplots(figsize=(10, 6), facecolor='white')
for location in ['right', 'top', 'left']:
    ax.spines[location].set_linewidth(0)
ax = sns.countplot(x='밀리시타에 대한 애정도를 숫자로 표현한다면?', hue='밀리시타를 접고 복귀한 경험이 있나요?', data=df, palette=[color, 'violet'])
for container in ax.containers:
    ax.bar_label(container, fontsize=13)
plt.xlabel('애정도', fontsize=13)
plt.ylabel('')
plt.legend(fontsize=13, loc='upper left')
plt.tick_params(length=0)
plt.title('접고 복귀한 경험 - 애정도 관계', fontsize=18)
plt.show()

# 밀리시타를 접게 되는 이유

In [None]:
dislike_values = [
    '낮은 가챠 확률 (SHS, 한정 가챠(페어/염색) 등)', '높은 천장 가격 (300뽑)', '아이돌 차별 - SSR, 이벤트 등 의상', '아이돌 차별 - 헤어(SHS) 퀄리티 차이',
    '아이돌 차별 - 긴 이벤트 간격 (상위 기준)', '아이돌 차별 - 내부 컨텐츠 차별 (가챠 간격, 주년 키비주얼, 배역 투표 등)', '아이돌 차별 - 외부 컨텐츠 차별 (콜라보, VOY@GER 등 곡 참가, 스탈릿 시즌 등)',
    '운영 - 90%를 위한 운영 (성머 위주의 라이브 방송 등)', '운영 - 재투자 (밀리 애니 퀄리티, 노말 일러스트 굿즈 등)', '운영 - 재미 없는 이벤트 (노가다성)', 
    '운영 - 재미 없는 커뮤', '운영 - 모델링 등 그 외 인게임 문제', '씹타갤 영차 당해서 (갤질용)', '섭종까지 계속 할 예정이다.', '기타'
]

dislike_counts, etcs = make_counts_etc(df, '밀리시타를 접은 경험이 있다면/만약 접게 된다면 그 이유가 무엇이었나요/무엇일까요?', dislike_values)

In [None]:
dislike_counts

In [None]:
for etc in etcs:
    print(etc)

- 조타 15
- 군대 8
- 현생 8
- 운영 6
- 숙제처럼 느껴져서, 질려서 3
- 갤창나서, 투표범죄 2
- 리듬게임인데 쉬운 난이도 2
- 공부 2
- 노래 퀄리티가 안 좋아지면 2
- 아이디연동 2

- 굿슬립
- 안접음
- 아이돌삼국지 내주ㅜ
- 예전에 제대로 안 했음
- 이벤런 파킨
- 씹레랑 말딸하느라 접음 폰 기종이 예전꺼라 로딩때문에 접은것도 있고
- 히나타 SHS
- 치하야 가슴사이즈 증가
- 좆목
- 총체적 난국
- 연속으로 통상에 천장박고 현타옴

In [None]:
y = list(dislike_counts.keys())[::-1]
x = list(dislike_counts.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 8), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color)

x_plot_min = 0
x_plot_max = max(x) + 10

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 10))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'밀리시타를 접게 되는 이유', fontsize=18)
plt.show()

# 밀리시타를 접게 되는 가장 중요한 이유

In [None]:
dislike_values = [
    '낮은 가챠 확률 (SHS, 한정 가챠(페어/염색) 등)', '높은 천장 가격 (300뽑)', '아이돌 차별 - SSR, 이벤트 등 의상 퀄리티 차이', '아이돌 차별 - 헤어(SHS) 퀄리티 차이',
    '아이돌 차별 - 긴 이벤트 간격 (상위 기준)', '아이돌 차별 - 내부 컨텐츠 차별 (가챠 간격, 주년 키비주얼, 배역 투표 등)', '아이돌 차별 - 외부 컨텐츠 차별 (콜라보, VOY@GER 등 곡 참가, 스탈릿 시즌 등)',
    '운영 - 90%를 위한 운영 (성머 위주의 라이브 방송 등)', '운영 - 재투자 (밀리 애니 퀄리티, 노말 일러스트 굿즈 등)', '운영 - 재미 없는 이벤트 (노가다성)', 
    '운영 - 재미 없는 커뮤', '운영 - 모델링 등 그 외 인게임 문제', '씹타갤 영차 당해서 (갤질용)', '섭종까지 계속 할 예정이다.', '기타'
]

mst_dislike_counts, etcs = make_counts_etc(df, '위 질문 중 가장 중요한 이유 한 가지만 선택한다면?', dislike_values)

In [None]:
mst_dislike_counts

In [None]:
for etc in etcs:
    print(etc)

In [None]:
y = list(mst_dislike_counts.keys())[::-1]
x = list(mst_dislike_counts.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 8), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x) + 10

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 10))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'밀리시타를 접게 되는 가장 중요한 이유', fontsize=18)
plt.show()

## 플레이 기간 그룹별 가장 중요한 이유

In [None]:
df_play_group_ = df.copy().sort_values(by='밀리시타를 얼마나 오랜 기간 플레이 중인가요?')
for etc in etcs:
    df_play_group_['위 질문 중 가장 중요한 이유 한 가지만 선택한다면?'].replace({etc:'기타'}, inplace=True)
df_play_group_['위 질문 중 가장 중요한 이유 한 가지만 선택한다면?'].replace({'게임이 너무 느려요 ':'기타'}, inplace=True)
df_play_group_['위 질문 중 가장 중요한 이유 한 가지만 선택한다면?'] = pd.Categorical(df_play_group_['위 질문 중 가장 중요한 이유 한 가지만 선택한다면?'], dislike_values)
fig, ax = plt.subplots(figsize=(15, 8), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
b = sns.histplot(data=df_play_group_, 
             y='위 질문 중 가장 중요한 이유 한 가지만 선택한다면?',
             hue='밀리시타를 얼마나 오랜 기간 플레이 중인가요?', 
             multiple='stack', shrink=.6,)
b.set_yticklabels(labels=dislike_values, fontsize=13)
b.set_xlim((0, x_plot_max))
b.set_ylim((len(y)-0.5, -0.5))
plt.xlabel('')
plt.ylabel('')
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.tick_params(length=0)
plt.show()

# 계속하는 이유

In [None]:
continue_values = ['담당 아이돌이 있으니까', '담당 아이돌을 비롯한 여러 아이돌이 있으니까', '곡이 꾸준히 업데이트 되고 노래도 좋아서',
                   '아이마스 IP가 좋아서', '밀리시타보다 괜찮은 씹덕 리듬겜이 없어서', '금전적, 시간적 매몰 비용 때문에', 
                   '운영이 좋아질 거라는 믿음 때문에 (반남과 총괄에 대한 믿음)', '밀리 애니를 믿기 때문에', '유입된 지 얼마 되지 않아서',
                   '기타']

continue_counts, etcs = make_counts_etc(df, '위의 이유에도 불구하고 밀리시타 복귀/계속 하는 이유는?', continue_values)

In [None]:
continue_counts

In [None]:
for etc in etcs:
    print(etc)

In [None]:
y = list(continue_counts.keys())[::-1]
x = list(continue_counts.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 6), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x) + 10

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 10))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'밀리시타를 계속하는 이유', fontsize=18)
plt.show()

# 다른 게임 출시한다면

In [None]:
if_values = ['밀리시타는 계속 하면서, 다른 게임이 어떤 것이든 일단 해본다.',
             '밀리시타는 계속 하면서, 다른 게임의 장르나 퀄리티에 따라 결정한다.',
             '밀리시타만 계속 한다.', '다른 게임으로 넘어간다.', '기타']

if_counts, etcs = make_counts_etc(df, '밀리언 라이브 IP의 다른 게임이 출시한다면?', if_values)

In [None]:
if_counts

In [None]:
for etc in etcs:
    print(etc)

In [None]:
y = list(if_counts.keys())[::-1]
x = list(if_counts.values())[::-1]

fig, ax = plt.subplots(figsize=(15, 3), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = max(x) + 12

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val} ({val/len(df)*100:.1f}%)'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 15))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'밀리시타 IP 다른 게임이 출시된다면', fontsize=18)
plt.show()

## 다른 게임 출시한다면 - 애정도 관계

In [None]:
if_df = df_org.copy()

if_df.loc[~if_df['밀리언 라이브 IP의 다른 게임이 출시한다면?'].isin(if_values), '밀리언 라이브 IP의 다른 게임이 출시한다면?'] = '기타'

In [None]:
if_df_group = if_df.groupby(['밀리언 라이브 IP의 다른 게임이 출시한다면?']).mean()[['밀리시타에 대한 애정도를 숫자로 표현한다면?']].loc[if_values]
if_df_group

In [None]:
y = list(if_df_group.index)[::-1]
x = list(if_df_group.iloc[:,0].values)[::-1]

fig, ax = plt.subplots(figsize=(15, 3), facecolor='white')
for location in ['right', 'top', 'bottom']:
    ax.spines[location].set_linewidth(0)
plt.barh(y=y, width=x, color=color, height=0.6)

x_plot_min = 0
x_plot_max = 10

plt.xlim((x_plot_min, x_plot_max))

# annotate
for idx, val in zip(y, x):
    annot = f'─ {val:.2f}점'
    plt.annotate(text=annot, xy=(val, idx), ha='left', va='center', fontsize=13)

plt.grid(axis='x')
plt.xticks(range(x_plot_min, x_plot_max, 1))
plt.yticks(y, fontsize=13)
plt.ylim((-0.5, len(y)-0.5))
plt.tick_params(length=0)

plt.title(f'다른 게임 출시한다면 - 애정도 관계', fontsize=18)
plt.show()