# 연령대 분석

In [None]:
import pandas as pd
import warnings
warnings.filterwarnings("ignore")


import plotly.graph_objects as go
import matplotlib.pyplot as plt
import seaborn as sns
import missingno # 널값 바차트로 시각화

In [None]:
netflix = pd.read_csv('./use_df.csv')

In [None]:
netflix.columns

In [None]:
net_df = netflix[['Title', 'Series or Movie','VALUE', 'View Rating']]

In [None]:
net_df.isnull().sum()

In [None]:
net_df['View Rating'].value_counts()

다른 값에 영향을 주지 않기 위해서 0로 널값을 채움

In [None]:
net_df['View Rating'] = net_df['View Rating'].fillna( value = 0)

In [None]:
net_df.isnull().sum()

## 상위 20개의 영화와 tv 시청연령의 분포 차이가 있나?

In [None]:
df_m = net_df[net_df['Series or Movie'] == 'Movie'].sort_values(by = 'VALUE', ascending=False)
df_t = net_df[net_df['Series or Movie'] == 'TV'].sort_values(by = 'VALUE', ascending=False)

In [None]:
# 전체 tv show 시청 연령 분포

count_t = df_t['View Rating'].value_counts()
fig = go.Figure(data=[go.Bar(
    x = count_t.index,
    y = count_t,
    text = count_t,
    textposition='auto'
)])
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(title_text= 'What is the View Rating of a Tv show on Netflix?',
                  yaxis=dict(
                  title='count',
                  titlefont_size=14),
                  xaxis=dict(
                  title='Age',
                  titlefont_size=14))

In [None]:
# 전체 movie 시청연령 분포

count_m = df_m['View Rating'].value_counts()
fig = go.Figure(data=[go.Bar(
    x = count_m.index,
    y = count_m,
    text = count_m,
    textposition='auto'
)])
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(title_text= 'What is the View Rating of a Movie on Netflix?',
                  yaxis=dict(
                  title='count',
                  titlefont_size=14),
                  xaxis=dict(
                  title='Age',
                  titlefont_size=14))

In [None]:
df_m = df_m[:][:20]
df_t = df_t[:][:20]

In [None]:
count_t = df_t['View Rating'].value_counts()
fig = go.Figure(data=[go.Bar(
    x = count_t.index,
    y = count_t,
    text = count_t,
    textposition='auto'
)])
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(title_text= 'What is the View Rating of a top 20 Tv show on Netflix?',
                  yaxis=dict(
                  title='count',
                  titlefont_size=14),
                  xaxis=dict(
                  title='Age',
                  titlefont_size=14))

In [None]:
count_m = df_m['View Rating'].value_counts()
fig = go.Figure(data=[go.Bar(
    x = count_m.index,
    y = count_m,
    text = count_m,
    textposition='auto'
)])
fig.update_traces(texttemplate='%{text:.2s}', textposition='outside')
fig.update_layout(title_text= 'What is the View Rating of a top 20 Movie on Netflix?',
                  yaxis=dict(
                  title='count',
                  titlefont_size=14),
                  xaxis=dict(
                  title='Age',
                  titlefont_size=14))

영상물 등급제도 참조
- https://ko.wikipedia.org/wiki/%EC%98%81%EC%83%81%EB%AC%BC_%EB%93%B1%EA%B8%89_%EC%A0%9C%EB%8F%84
- G: General Audiences: 모든 관객 (모든 연령층 적합)
- PG: Parental Guidance Suggested: 부모 동반 (아동 관람 부적합)
- PG-13: Parental Strongly Cautioned: 부모 주의(부분적 13세 미만 부적합)
- R: Restricted: 제한 (17세 미만은 부모나 성인 보호자 동반 요망)
- NC-17: No One 17 And Under Admitted: 18세 미만은 관람할 수 없는 영화

- G, PG <- 12세 이하
- PG-13 <- 16세 이하
- R <- 17세
- NC-17 <- 21세

### 결론
- 영화같은 경우는 R, PG, PG-13과 같이 어린이들을 위한 전체 연령 컨텐츠들이 viewpoint 기준 상위 컨텐츠에 몰려있었고,
- tv_show같은 경우 연령제한이 있는 21세 이상 컨텐츠 TV-MA가 주로 이루었고, TV-PG 와 같이 연령제한이 좀 있는 컨텐츠들이 상위 컨텐츠에 있었다.

In [None]:
net_df = netflix[['Title', 'Series or Movie','VALUE', 'View Rating']]

In [None]:
plt.figure(figsize=(18,14),dpi = 350)
sns.barplot(y= net_df['View Rating'].value_counts()[:15].sort_values().index, x=net_df['View Rating'].value_counts()[:15].sort_values().values,palette='gnuplot_r');
plt.title('Top View Rating', color='purple', fontsize=30)
plt.xticks(net_df['View Rating'].value_counts()[:10].sort_values().values);
plt.ylabel('View Rating', fontsize=25);
plt.xlabel('View Rating counts', fontsize=25);