# AB Testi ile Bidding Yöntemlerinin Dönüşümünün Karşılaştırılması

----

## İş Problemi

**Senaryo**

Facebook kısa süre önce mevcut "maximumbidding" adı verilen
teklif verme türüne alternatif olarak yeni bir teklif türü olan
"average bidding"’i tanıttı.

Müşterilerimizden biri olan bombabomba.com, bu yeni özelliği test
etmeye karar verdi ve average bidding'inmaximumbidding'den
daha fazla dönüşüm getirip getirmediğini anlamak için bir A/B
testi yapmak istiyor.

A/B testi 1 aydır devam ediyor ve bombabomba.com şimdi sizden
bu A/B testinin sonuçlarını analiz etmenizi bekliyor.
Bombabomba.com için nihai başarı ölçütü Purchase'dır. Bu
nedenle, istatistiksel testler için Purchase metriğine
odaklanılmalıdır.

## Veri Seti Hikayesi

*Amazon ürün verilerini içeren bu veri seti ürün kategorileri ile çeşitli metadataları içermektedir. Elektronik kategorisindeki en 
fazla yorum alan ürünün kullanıcı puanları ve yorumları vardır.*

In [2]:
### Değişkenler

##### Impression  : Reklam görüntüleme sayısı
##### Click : Görüntülenen reklama tıklama sayısı
##### Purchase : Tıklanan reklamlar sonrası satın alınan ürün sayısı
##### Earning : Satın alınan ürünler sonrası elde edilen kazanç 


## To do List:

**GÖREV 1**: Veriyi Hazırlama Analiz Etme

**GÖREV 2**: A/B Testinin Hipotezin Tanımlanması

**GÖREV 3**: Hipotez Testinin Gerçekleştirilmesi

**GÖREV 4**: Sonuçların Analizi


-----

### Veriyi Hazırlama ve Analiz Etme

In [55]:
# Pandas kütüphanesini import edelim;

import pandas as pd
import numpy as np
from scipy.stats import shapiro,levene,mannwhitneyu,ttest_ind
# pandas görüntü ayarlarını yapalım;

pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', None)
pd.set_option('display.float_format', lambda x: '%.3f' % x)


# veri setini çalışmaya dahil edelim;
control_group = pd.read_excel(r"C:\Users\kkakt\Desktop\AB_project\database\ab_testing.xlsx",sheet_name="Control Group")
test_group = pd.read_excel(r"C:\Users\kkakt\Desktop\AB_project\database\ab_testing.xlsx",sheet_name="Test Group")

df_control = control_group.copy()
df_test = test_group.copy()

In [57]:
# Kontrol grbunun analizini yapalım;

df_control.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
Impression,40.0,101711.449,20302.158,45475.943,85726.69,99790.701,115212.817,147539.336
Click,40.0,5100.657,1329.985,2189.753,4124.304,5001.221,5923.804,7959.125
Purchase,40.0,550.894,134.108,267.029,470.096,531.206,637.957,801.795
Earning,40.0,1908.568,302.918,1253.99,1685.847,1975.161,2119.803,2497.295


In [58]:
# Test grbunun önizlemesi ve analizini yapalım;

df_control.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
Impression,40.0,101711.449,20302.158,45475.943,85726.69,99790.701,115212.817,147539.336
Click,40.0,5100.657,1329.985,2189.753,4124.304,5001.221,5923.804,7959.125
Purchase,40.0,550.894,134.108,267.029,470.096,531.206,637.957,801.795
Earning,40.0,1908.568,302.918,1253.99,1685.847,1975.161,2119.803,2497.295


In [64]:
# veri setlerinin birleştirelim;
df_control["Group"] = "control"
df_test["Group"] = "test"

df = pd.concat([df_control,df_test],axis=0,ignore_index=True)

df

Unnamed: 0,Impression,Click,Purchase,Earning,Group
0,82529.459,6090.077,665.211,2311.277,control
1,98050.452,3382.862,315.085,1742.807,control
2,82696.024,4167.966,458.084,1797.827,control
3,109914.4,4910.882,487.091,1696.229,control
4,108457.763,5987.656,441.034,1543.72,control
5,77773.634,4462.207,519.67,2081.852,control
6,95110.586,3555.581,512.929,1815.007,control
7,106649.183,4358.027,747.02,1965.1,control
8,122709.717,5091.559,745.986,1651.663,control
9,79498.249,6653.846,470.501,2456.304,control


### A/B Testinin Hipotezin Tanımlanması

In [67]:
## Hipotezi tanımlayalım;

#HO : MU1 = MU2
#H1 : MU1 != MU2

#HO : control ve test grupları arasında anlamlı bir farklılık yoktur.
#H1 : control ve test grupları arasında anlamlı bir farklılık vardır.


# Kontrol ve test grubu için purchase (kazanç) ortalamalarını analiz edelim;
df.groupby("Group").agg({"Purchase":"mean"})

Unnamed: 0_level_0,Purchase
Group,Unnamed: 1_level_1
control,550.894
test,582.106


### Hipotez Testinin Gerçekleştirilmesi

In [75]:
## Varsayım kontrollerini yapalım;

# ilk olarak normal dağılım varsayımını yapalım; (shapiro)

#HO : dağılım normaldir.
#H1 : dağılım normal değildir.

# control sınıfının dağılımını incelemek için.
t_test,pvalue = shapiro(df.loc [df["Group"] == "control","Purchase"])
print("CONTROL SINIFI DAĞILIM VARSAYIMI ANALİZİ \n\nt_test: %.4f \np_value : %.4f\n-" % (t_test,pvalue))

# test sınıfının dağılımını incelemek için.
t_test,pvalue = shapiro(df.loc [df["Group"] == "test","Purchase"])
print("TEST SINIFI DAĞILIM VARSAYIMI ANALİZİ \n\nt_test: %.4f \np_value : %.4f" % (t_test,pvalue))

# P_value > 0.05 olduğu için HO hipotezini red edemiyoruz.
# Dağılım normaldir.

CONTROL SINIFI DAĞILIM VARSAYIMI ANALİZİ 

t_test: 0.9773 
p_value : 0.5891
-
TEST SINIFI DAĞILIM VARSAYIMI ANALİZİ 

t_test: 0.9589 
p_value : 0.1541


In [77]:
# 2. olarak varyans analizi kontrolü yapalım; (levene)

#HO : Varyans Homojendir.
#H1 : Varyans Homojen değildir.

t_test,pvalue = levene(df.loc [df["Group"] == "control","Purchase"],df.loc [df["Group"] == "test","Purchase"])
print("Varyans Analizi \n\nt_test: %.4f \np_value : %.4f\n-" % (t_test,pvalue))

# P_value > 0.05 olduğu için HO hipotezini red edemiyoruz.
# Varyans homojendir.

Varyans Analizi 

t_test: 2.6393 
p_value : 0.1083
-


In [78]:
# T örneklem testininin uygulamasını yapalım; 

#HO : control ve test grupları arasında anlamlı bir farklılık yoktur.
#H1 : control ve test grupları arasında anlamlı bir farklılık vardır.


# Normal dağılım sağlandığı için ttest_ind fonksiyonunu kullnacağız.
# Varyans homojenliği sağlandığı için =True olacak.


t_test,pvalue = ttest_ind(df.loc [df["Group"] == "control","Purchase"],df.loc [df["Group"] == "test","Purchase"],equal_var=True)
print("Varyans Analizi \n\nt_test: %.4f \np_value : %.4f\n-" % (t_test,pvalue))

# P value değeri < 0.05 sağlamadığı için HO red edilemez.
# Sonuç: control ve test grupları arasında anlamlı bir farklılık yoktur.

Varyans Analizi 

t_test: -0.9416 
p_value : 0.3493
-


## Sonuçların Analizi:

**Yöntem**:

*Hipotez sürecinde normallik varsayımı için shapiro, varyans homojenliği varsayımı için de levene testini uyguladım. İki varsayım da sağlandığı için parametrik test olarak Bağımsız T örneklem testini yani ttest_ind fonksiyonunu kullandım. Dağılım homojen olduğu için de equeal_var parametresini True olarak belirledim.*

**Tavsiye**:

*Bilimsel olarak kanıtlanıldığı gibi maximumbidding ve average biddng yöntemi arasında kayda değer bir farklılık bulunmamaktadır. İş tavsiyesi olarak kazanç sağlamayan yeni özelliğe daha fazla zaman ve sermaye yatırımı yapılmamalı proje iptal edilmelidir.*