# (İş Uygulaması: Web Sitesi İçerik Stratejisi)  
# Varyans Analizi  
Ana Sayfada geçirilen süre artırılmak isteniyor.

## Detatylar:  
* Bir web sitesi için başarı kriterleri: ortalama ziyaret süresi, hemen çıkış oranı vb.  
* Uzun zaman geçiren kullanıcılarn reklamlara daha fazla tıkladığı veya markaya olan bağlılıklarının arttığını biliniyor.  
* Buna yönelik olarak benzer haberler farklı resimler ya da formatlarla hazırlanarak oluşturulan test gruplarına gösteriliyor.  

### Haber Çeşitleri ve Grupları
A = Orijinal haber      
B = Yönlendirici haber    
C = İlgi Çekici haber  
  
#### Hipotezler  
H0: M1 = M2 = M3 (grup ortalamaları arasında istatistiksel olarak anlamlı bir farklılık yoktur.)  
H1: Gruplar arasında en az bir farklılık vardır.  

In [28]:
import pandas as pd

In [29]:
A = pd.DataFrame([28,33,30,29,28,29,27,31,30,32,28,33,25,29,27,31,31,30,31,34,30,32,31]) 
B = pd.DataFrame([31,32,30,30,33,32,34,27,36,30,31,30,38,29,30,34,34,31,35,35,33,30,28])
C = pd.DataFrame([40,33,38,41,42,43,38,35,39,39,36,34,35,40,38,36,39,36,33,35,38,35,40])

dfs = [A, B, C]

ABC = pd.concat(dfs, axis=1)
ABC.columns = ["GRUP_A", "GRUP_B", "GRUP_C"]
ABC.head()

Unnamed: 0,GRUP_A,GRUP_B,GRUP_C
0,28,31,40
1,33,32,33
2,30,30,38
3,29,30,41
4,28,33,42


## Varsayım Kontrolleri

1. Grupların bağımsızlığı varsayımı
2. Normallik Varsayımı (shapiro)
3. Varyans Homojenliği (levene test)

In [30]:
# 2. Normallik Varsayımı 

from scipy.stats import shapiro

In [31]:
shapiro(ABC["GRUP_A"])

ShapiroResult(statistic=0.9771647453308105, pvalue=0.8526690006256104)

In [32]:
shapiro(ABC["GRUP_B"])

ShapiroResult(statistic=0.9653159379959106, pvalue=0.5784821510314941)

In [33]:
shapiro(ABC["GRUP_C"])

ShapiroResult(statistic=0.9604302644729614, pvalue=0.4721103310585022)

pValue değeri > 0.05 olduğu için H0 hipotezi reddedilememiştir.

In [34]:
# 3. Varyans Homojenliği Testi (levene)

from scipy.stats import levene

In [35]:
levene(ABC["GRUP_A"], ABC["GRUP_B"], ABC["GRUP_C"])

LeveneResult(statistic=0.9446786090621706, pvalue=0.3939978753114075)

pValue değeri > 0.05 olduğu için varyans homojenliği sağlanmaktadır.

## Varyans Analizi: Hipotez Testinin Uygulanması

In [36]:
#Hipotez testi import işlemi

from scipy.stats import f_oneway

f_oneway(ABC["GRUP_A"], ABC["GRUP_B"], ABC["GRUP_C"])

F_onewayResult(statistic=53.46714172604916, pvalue=1.566295188711795e-14)

In [43]:
F_Test, pValue = f_oneway(ABC["GRUP_A"], ABC["GRUP_B"], ABC["GRUP_C"])

print('F_Test = %4.f, pValue = %4.f'  %  (F_Test, pValue))

F_Test =   53, pValue =    0


pValue < 0.05 olduğu için H0 hipotezi reddedilmiştir.  
Haber içerikleri arasında istatistiksel olarak anlamlı bir farklılık vardır.  

In [47]:
ABC.describe().T

Unnamed: 0,count,mean,std,min,25%,50%,75%,max
GRUP_A,23.0,29.956522,2.184205,25.0,28.5,30.0,31.0,34.0
GRUP_B,23.0,31.869565,2.701924,27.0,30.0,31.0,34.0,38.0
GRUP_C,23.0,37.521739,2.810202,33.0,35.0,38.0,39.5,43.0


GRUP_C incelendiğinde "İlgi Çekici Haber İçeriği" diğer haber içeriklerine kıyasla çok daha fazla dikkat çekmiştir.    

## NoneParametric Hipotez Testi

Varsaylım ki bir önceki bölümde sağlanan varsayımlar sağlanamadı.  
Bu testler sağlanamadığında None-parametric teste başvuracağız (Kruskal Wallis Testi)

In [48]:
from scipy.stats import kruskal

In [49]:
kruskal(ABC["GRUP_A"], ABC["GRUP_B"], ABC["GRUP_C"])

KruskalResult(statistic=41.41835051661897, pvalue=1.014190318754816e-09)

In [51]:
F_Test, pValue = kruskal(ABC["GRUP_A"], ABC["GRUP_B"], ABC["GRUP_C"])
print('F_Test = %4.f, pValue = %4.f ' % (F_Test,pValue))

F_Test =   41, pValue =    0 


Bir önceki bölümdeki sonucumuzun tekrar ortaya çıktığını ve H0 hipotezinin reddedildiğini görmekteyiz.  
Gruplar arasında anlamlı bir farklılık olduğu none-parametric testler ile de ortaya çıkmış oldu.  