# 방송 편성을 위한 일별 데이터 분석
> 방송 편성표를 짜기 위해서는 하루동안 어떤 상품군의 상품들이 광고되고 있는지, 시기에 따라 차이가 있는지도 알아볼 필요가 있다. datetime 라이브러리를 통해 특정한 하루의 데이터를 확인하고, 다음과 같은 내용을 확인해본다.

- 하루에 광고되는 상품들이 상품군별 균일하다고 볼 수 있는가?
- 시기에 따라 판매되는 상품들의 비중이 변화하는가?


> 상품군 일람

- 0: 주방
- 1: 가전
- 2: 의류
- 3: 속옷
- 4: 잡화
- 5: 농수축
- 6: 생활용품
- 7: 가구
- 8: 이미용
- 9: 건강기능
- 10: 침구

In [10]:
# 라이브러리 불러오기
import pandas as pd
import numpy as np
import datetime
import pickle
import sys

In [2]:
# 전처리한 데이터 불러오기
with open('dataframe_2.pkl', 'rb') as f:
    load_df=pickle.load(f)
    
load_df

Unnamed: 0,방송일시,노출(분),마더코드,상품코드,상품명,상품군,판매단가,취급액,성별 포함,년,월,일자,시,분,초
1,2019-01-01 06:00:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,2099000,1,2019,1,1,6,0,0
2,2019-01-01 06:00:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,4371000,2,2019,1,1,6,0,0
3,2019-01-01 06:20:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,3262000,1,2019,1,1,6,20,0
4,2019-01-01 06:20:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,6955000,2,2019,1,1,6,20,0
5,2019-01-01 06:40:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,6672000,1,2019,1,1,6,40,0
6,2019-01-01 06:40:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,9337000,2,2019,1,1,6,40,0
7,2019-01-01 07:00:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,6819000,2,2019,1,1,7,0,0
8,2019-01-01 07:20:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,15689000,2,2019,1,1,7,20,0
9,2019-01-01 07:40:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,25370000,2,2019,1,1,7,40,0
10,2019-01-01 08:00:00,20.0,100808,202377,CERINI by PAT 남성 소프트 기모 릴렉스팬츠,2,59900,16133000,1,2019,1,1,8,0,0


In [5]:
# 방송일자 추가
load_df = load_df[['방송일시', '노출(분)', '마더코드', '상품코드', '상품명', '상품군', '판매단가', '취급액', '성별 포함']]
load_df['방송일'] = load_df['방송일시'].dt.date

load_df.head(10)

Unnamed: 0,방송일시,노출(분),마더코드,상품코드,상품명,상품군,판매단가,취급액,성별 포함,방송일
1,2019-01-01 06:00:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,2099000,1,2019-01-01
2,2019-01-01 06:00:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,4371000,2,2019-01-01
3,2019-01-01 06:20:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,3262000,1,2019-01-01
4,2019-01-01 06:20:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,6955000,2,2019-01-01
5,2019-01-01 06:40:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,6672000,1,2019-01-01
6,2019-01-01 06:40:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,9337000,2,2019-01-01
7,2019-01-01 07:00:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,6819000,2,2019-01-01
8,2019-01-01 07:20:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,15689000,2,2019-01-01
9,2019-01-01 07:40:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,25370000,2,2019-01-01
10,2019-01-01 08:00:00,20.0,100808,202377,CERINI by PAT 남성 소프트 기모 릴렉스팬츠,2,59900,16133000,1,2019-01-01


In [11]:
# 1월 1일 데이터만 추출
df_190101 = load_df[load_df['방송일'] == datetime.date(2019,1,1)]  # datetime 자료형일 때는 datetime.date(년도, 월, 일)로 탐색
df_190101

Unnamed: 0,방송일시,노출(분),마더코드,상품코드,상품명,상품군,판매단가,취급액,성별 포함,방송일
1,2019-01-01 06:00:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,2099000,1,2019-01-01
2,2019-01-01 06:00:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,4371000,2,2019-01-01
3,2019-01-01 06:20:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,3262000,1,2019-01-01
4,2019-01-01 06:20:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,6955000,2,2019-01-01
5,2019-01-01 06:40:00,20.0,100346,201072,테이트 남성 셀린니트3종,2,39900,6672000,1,2019-01-01
6,2019-01-01 06:40:00,20.0,100346,201079,테이트 여성 셀린니트3종,2,39900,9337000,2,2019-01-01
7,2019-01-01 07:00:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,6819000,2,2019-01-01
8,2019-01-01 07:20:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,15689000,2,2019-01-01
9,2019-01-01 07:40:00,20.0,100305,200974,오모떼 레이스 파운데이션 브라,3,59000,25370000,2,2019-01-01
10,2019-01-01 08:00:00,20.0,100808,202377,CERINI by PAT 남성 소프트 기모 릴렉스팬츠,2,59900,16133000,1,2019-01-01


In [12]:
# 상품군별 균일함 확인
f_190101['상품군'].value_counts()

2    24
3    13
5     9
1     6
8     3
0     3
Name: 상품군, dtype: int64

## 시기에 따른 상품군 변화 확인

## 봄

In [21]:
df_190415 = load_df[load_df['방송일']== datetime.date(2019, 4, 15)]
df_190415

Unnamed: 0,방송일시,노출(분),마더코드,상품코드,상품명,상품군,판매단가,취급액,성별 포함,방송일
10671,2019-04-15 00:00:00,20.0,100374,201198,19 SS USPA 남성 화이트라벨 폴로셔츠 3종,2,79000,15664000,1,2019-04-15
10672,2019-04-15 00:00:00,20.0,100374,201199,19 SS USPA 여성 화이트라벨 폴로셔츠 3종,2,79000,13458000,2,2019-04-15
10673,2019-04-15 00:20:00,20.0,100155,200555,일시불 LG전자 매직스페이스 냉장고,1,1409000,7662000,0,2019-04-15
10674,2019-04-15 00:20:00,20.0,100155,200488,무이자 LG전자 매직스페이스 냉장고,1,1549000,8478000,0,2019-04-15
10675,2019-04-15 00:40:00,20.0,100155,200555,일시불 LG전자 매직스페이스 냉장고,1,1409000,7662000,0,2019-04-15
10676,2019-04-15 00:40:00,20.0,100155,200488,무이자 LG전자 매직스페이스 냉장고,1,1549000,25226000,0,2019-04-15
10677,2019-04-15 01:00:00,20.0,100155,200555,일시불 LG전자 매직스페이스 냉장고,1,1409000,3856000,0,2019-04-15
10678,2019-04-15 01:00:00,20.0,100155,200488,무이자 LG전자 매직스페이스 냉장고,1,1549000,8451000,0,2019-04-15
10679,2019-04-15 01:20:00,20.0,100362,201149,에이유플러스 슈퍼선스틱 1001(쇼퍼백),8,69900,7436000,0,2019-04-15
10680,2019-04-15 01:40:00,15.0,100362,201149,에이유플러스 슈퍼선스틱 1001(쇼퍼백),8,69900,6599000,0,2019-04-15


In [22]:
df_190415['상품군'].value_counts()

1    36
0    33
4    15
7     9
8     8
2     8
5     6
3     5
6     3
Name: 상품군, dtype: int64

## 여름

In [15]:
df_190810 = load_df[load_df['방송일'] == datetime.date(2019, 8, 10)]
df_190810

Unnamed: 0,방송일시,노출(분),마더코드,상품코드,상품명,상품군,판매단가,취급액,성별 포함,방송일
23556,2019-08-10 00:00:00,20.000000,100401,201285,골드파일 카로 여행가방 9종 세트,4,159000,7527000,0,2019-08-10
23557,2019-08-10 00:20:00,20.000000,100401,201285,골드파일 카로 여행가방 9종 세트,4,159000,7558000,0,2019-08-10
23558,2019-08-10 00:40:00,20.000000,100401,201285,골드파일 카로 여행가방 9종 세트,4,159000,14372000,0,2019-08-10
23559,2019-08-10 01:00:00,20.000000,100644,201964,사용불가미리구운 자연산 바다장어 9팩,5,49900,9151000,0,2019-08-10
23560,2019-08-10 01:20:00,20.000000,100644,201964,사용불가미리구운 자연산 바다장어 9팩,5,49900,17202000,0,2019-08-10
23561,2019-08-10 01:40:00,15.166667,100644,201964,사용불가미리구운 자연산 바다장어 9팩,5,49900,14997000,0,2019-08-10
23562,2019-08-10 06:00:00,20.000000,100284,200913,실크트리 풍기인견 썸머 풀코디 이지웨어세트,3,44000,12034000,0,2019-08-10
23563,2019-08-10 06:20:00,20.000000,100284,200913,실크트리 풍기인견 썸머 풀코디 이지웨어세트,3,44000,17917000,0,2019-08-10
23564,2019-08-10 06:40:00,20.000000,100284,200913,실크트리 풍기인견 썸머 풀코디 이지웨어세트,3,44000,33373000,0,2019-08-10
23565,2019-08-10 07:00:00,20.000000,100766,202239,참존 탑뉴스 지이링클 기초세트,8,59000,17476000,0,2019-08-10


In [16]:
df_190810['상품군'].value_counts()

0    18
4    17
1    16
2    15
5    12
8     6
3     6
Name: 상품군, dtype: int64

## 가을

In [27]:
df_191004 = load_df[load_df['방송일'] == datetime.date(2019, 10, 4)]
df_191004

Unnamed: 0,방송일시,노출(분),마더코드,상품코드,상품명,상품군,판매단가,취급액,성별 포함,방송일
29355,2019-10-04 00:00:00,20.000000,100266,200882,마리끌레르 파리컬렉션 리얼 하이드로 립스틱(마스카라),8,39900,25557000,0,2019-10-04
29356,2019-10-04 00:20:00,20.000000,100266,200882,마리끌레르 파리컬렉션 리얼 하이드로 립스틱(마스카라),8,39900,40469000,0,2019-10-04
29357,2019-10-04 00:40:00,20.000000,100266,200882,마리끌레르 파리컬렉션 리얼 하이드로 립스틱(마스카라),8,39900,50308000,0,2019-10-04
29358,2019-10-04 01:00:00,20.000000,100743,202181,도스문도스 카이만엠보 소가죽 토트백 2종,4,99900,8071000,0,2019-10-04
29359,2019-10-04 01:20:00,20.000000,100743,202181,도스문도스 카이만엠보 소가죽 토트백 2종,4,99900,18039000,0,2019-10-04
29360,2019-10-04 01:40:00,16.683333,100743,202181,도스문도스 카이만엠보 소가죽 토트백 2종,4,99900,26210000,0,2019-10-04
29361,2019-10-04 06:00:00,20.000000,100294,200955,세균싹 행주티슈,0,39900,7989000,0,2019-10-04
29362,2019-10-04 06:20:00,20.000000,100294,200955,세균싹 행주티슈,0,39900,16012000,0,2019-10-04
29363,2019-10-04 06:40:00,20.000000,100294,200955,세균싹 행주티슈,0,39900,21980000,0,2019-10-04
29364,2019-10-04 07:00:00,20.000000,100583,201791,임페리얼 남성 니트4종,2,79000,3503000,1,2019-10-04


In [28]:
df_191004['상품군'].value_counts()

0    39
4    23
2    12
5     9
8     6
6     6
1     6
9     2
Name: 상품군, dtype: int64