# 어떤 광고가 반응이 더 좋은가?

## 1. Loading data

#### 1) 필요한 라이브러리들을 호출

In [None]:
#데이터 분석에 필요한 패키지들을 파이썬으로 호출
import pandas as pd
import os
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline

#### 2) 필요 데이터 경로 지정

In [None]:
#분석에 필요한 데이터들을 파이썬으로 호출
impPath = os.path.expanduser("Week11Data/ab_test_imp.csv")
goalInfo = os.path.expanduser("Week11Data/ab_test_goal.csv")

#### 3) 각 변수별로 데이터 할당 

In [None]:
imp = pd.read_csv(impPath, sep=",")
goal = pd.read_csv(goalInfo, sep=",")

#### 4) 호출된 데이터 정보 확인

In [None]:
imp.info()
imp[:5]

In [None]:
goal.info()
imp[:5]

# 2. Data cleaning

#### 1) 각 데이터들을 결합

In [None]:
#두 데이터 결합하기 
ImpGoal = imp.merge(goal, on=["transaction_id"], how="outer")
ImpGoal.info()
ImpGoal[:5]

#### 2)일자별 정렬을 위한 날짜 처리

In [None]:
#ImpGoal 데이터프레임 내 "log_date_x"시리즈를 datetime 유형으로 변경
ImpGoal['log_date_x']=ImpGoal['log_date_x'].apply(lambda x: pd.to_datetime(str(x)))

#### 3)광고별 클릭률 지표 설정

In [None]:
#"is.goal" 시리즈를 만들고 "user_id_y"값이 "true"이면 0, 그렇지 않으면 1으로 표시
ImpGoal['is_goal'] = np.where(pd.isnull(ImpGoal["user_id_y"]) == True, 0, 1)

In [None]:
ImpGoal.info()
ImpGoal[:10]

# 3. Data analysis

#### 1)광고별 클릭률 확인

In [None]:
#광고A와 광고B의 각 클릭률 비교
ImpGoal["is_goal"].groupby(ImpGoal["test_case_x"]).mean()

#### 2) 각 광고별 클릭률 트렌드 확인

In [None]:
#"log_date_x" 기준에 따라 각 광고별 클릭률을 정렬
data = ImpGoal.groupby(["log_date_x", "test_case_x"])["is_goal"].mean()
data[:20]

# 4. Data Visualization

#### 1) 각 광고별 클릭률 트렌드 시각화

In [None]:
#unstack()함수를 이용해 완전한 데이터 정규화 수행
data = data.unstack("test_case_x")

In [None]:
data.info()
data.head()

In [None]:
#완성된 데이터를 이용해 시각화 수행
data.plot.line(figsize=(15,7), style="--", marker="o", markersize=10, linewidth=2)