* 식품의약품안전처,「화장품산업현황」, 화장품 유형별 책임판매업체 생산실적
    * https://kosis.kr/statHtml/statHtml.do?orgId=145&tblId=DT_145011_A013&conn_path=I2

In [None]:
# 필요한 라이브러리 설치 및 임포트
# !pip install -Uq plotly

In [None]:
import pandas as pd
import plotly.express as px
import plotly.graph_objects as go

## 데이터 준비 및 기초 기술 통계 확인

In [None]:
df = pd.read_csv("data/cosmetic-production.csv", encoding="cp949")
df.shape

In [None]:
df.head()

In [None]:
df.columns = ['유형', '연도', '억원']
df.head()

In [None]:
df.info()

In [None]:
df.describe()

## plotly express를 활용한 데이터 시각화 

In [None]:
px.histogram(df, x='억원')

In [None]:
px.histogram(df, x='억원', histnorm="density")

In [None]:
# 빈도 시각화
px.histogram(df, x='유형')

## 코로나 전후의 연간 생산량 변화 분석

In [None]:
df.loc[df["연도"] > 2019, "코로나전후"] = "후"
df.loc[df["연도"] <= 2019, "코로나전후"] = "전"

In [None]:
df["코로나전후"].value_counts()

In [None]:
df.groupby(["연도", "유형"])["억원"].mean().unstack()

In [None]:
df.groupby(["연도", "유형"])["억원"].mean().unstack().style.background_gradient()

In [None]:
px.histogram(df, x='유형', y="억원", histfunc="avg", barnorm="fraction", 
             color="코로나전후", title="평균 생산량 억원 단위")

In [None]:
# histfunc 으로 연산 기능 
px.histogram(df, x='유형', y="억원", histfunc="avg", title="평균 생산량 억원 단위")

In [None]:
px.histogram(df, x='유형', y="억원", histfunc="sum", title="합계 생산량 억원 단위")

In [None]:
# 연간 생산량 막대 그래프
px.bar(df, x='연도', y='억원', title='연간 생산량 (억원)', color='유형')

In [None]:
# 연간 생산량 막대 그래프
px.bar(df, x='연도', y='억원', title='연간 생산량 (억원)', color='유형')

In [None]:
# 연간 생산량 선 그래프
px.line(df, x='연도', y='억원', title='연간 생산량 (억원)', color='유형')

## 서브플롯을 통한 시각화

In [None]:
# 연간 생산량 선 그래프
px.line(df, x='연도', y='억원', title='연간 생산량 (억원)', color='유형', 
        facet_col="유형", facet_col_wrap=4, height=500)

## 로그 스케일을 통한 변화량 비교

In [None]:
# 데이터 정렬 및 그룹화
df = df.sort_values(by=['유형', '연도'])
df['누적금액'] = df.groupby('유형')['억원'].cumsum()  # 누적 금액

In [None]:
# 누적 생산량 선 그래프
px.line(df, x='연도', y='누적금액', title='누적 생산량 (억원)', color='유형')

In [None]:
# 누적 생산량 선 그래프
px.line(df, x='연도', y='누적금액', title='누적 생산량 (억원)', color='유형', log_y=True)