# Анализ эксперимента

### Цель: оценить результат эксперимента (сравнить средние значения двух выборок) с помощью доверительного интервала.

In [25]:
%matplotlib inline
from matplotlib import pyplot as plt
from scipy import stats as st
import numpy as np
from numpy.random import binomial
from numpy.random import normal

## Сгенерируем семплы

Два набора данных, распределенных по биномиальному закону

In [26]:
P1 = 0.1
P2 = 0.11
N1 = 100
N2 = 100

In [27]:
sample1 = binomial(1, P1, N1)
sample2 = binomial(1, P2, N2)

In [28]:
mean1 = np.mean(sample1)
mean2 = np.mean(sample2)
diff = mean1 - mean2
print('mean1: %s' % mean1)
print('mean2: %s' % mean2)
print('mean1 - mean2: %s' % diff)

mean1: 0.05
mean2: 0.11
mean1 - mean2: -0.06


**Истинные вероятности отличаются на 0.01. Но в эксперименте получилось, что разность равна 0.03. Поэтому только на разность средних опираться нельзя, необходимо смотреть на распределения.**

## Оценим выборочное (pooled) среднее и дисперсию

Предполагаем, что выборки из одного и того же распределения. Считаем среднее и дисперсию для этого распределения.

In [29]:
P_pool = (np.sum(sample1 == 1) + np.sum(sample2 == 1)) / (N1 + N2) #доля успехов ("вероятность успеха")

#У вас:
std_pool = np.sqrt(P_pool * (1 - P_pool) / (N1 + N2))

#Мне кажется, что надо так:
std_pool = np.sqrt(mean1 * (1 - mean1) / N1 + mean2 * (1 - mean2) / N2)

In [30]:
confidence = 0.975
z = st.norm.ppf(confidence)
margin = z * std_pool
print('z: %s' % z)

z: 1.959963984540054


## Случайно ли различие в средних?

Гипотеза в том, что распределения одинаковы. Отвергаем её, если |diff| > margin.

In [31]:
print('margin: %s' % margin)
print('diff: %s' % diff)
print('Are they different (diff > margin)? -> %s' % (abs(diff) > margin))

margin: 0.07473607646437735
diff: -0.06
Are they different (diff > margin)? -> False


In [35]:
# TODO: при каком размере семплов различие в 1% будет значимым?

for i in range(10):
    print('iteration: %s' % i)
    for sample_size in np.arange(50,1000,10):
        sample1 = binomial(1, P1, sample_size)
        sample2 = binomial(1, P2, sample_size)
    
        mean1 = np.mean(sample1)
        mean2 = np.mean(sample2)
        diff = mean1 - mean2
    
        P_pool = (np.sum(sample1 == 1) + np.sum(sample2 == 1)) / (N1 + N2) #доля успехов ("вероятность успеха")
        std_pool = np.sqrt(mean1 * (1 - mean1) / N1 + mean2 * (1 - mean2) / N2)    
        margin = z * std_pool
    
        if abs(diff) > margin:
            print('sample size(N): %s' % sample_size)
            print('margin: %s' % margin)
            print('diff: %s' % diff)
            print('Are they different (diff > margin)? -> %s\n' % (abs(diff) > margin))
            break

iteration: 0
sample size(N): 60
margin: 0.07914361642937918
diff: 0.08333333333333333
Are they different (diff > margin)? -> True

iteration: 1
sample size(N): 110
margin: 0.0766167739411112
diff: -0.09999999999999999
Are they different (diff > margin)? -> True

iteration: 2
sample size(N): 80
margin: 0.09744540021162257
diff: -0.125
Are they different (diff > margin)? -> True

iteration: 3
sample size(N): 50
margin: 0.08808942511903534
diff: -0.22
Are they different (diff > margin)? -> True

iteration: 4
sample size(N): 70
margin: 0.0766797490164496
diff: -0.0857142857142857
Are they different (diff > margin)? -> True

iteration: 5
sample size(N): 190
margin: 0.08509588412144824
diff: -0.08947368421052632
Are they different (diff > margin)? -> True

iteration: 6
sample size(N): 80
margin: 0.07475374323890734
diff: -0.0875
Are they different (diff > margin)? -> True

iteration: 7
sample size(N): 50
margin: 0.07437540387654738
diff: 0.07999999999999999
Are they different (diff > margin)