In [0]:
import numpy as np
import matplotlib.pyplot as plt
import scipy.stats as sps

**Гипотеза 6.** Две независимые нормальные выборки, дисперсии равны, но не известны, т.е. $\sigma_x=\sigma_y$. Простая гипотеза против сложной.

Методы проверки: Линдли, модификация $H_0$, априор с атомом.

Проверяются двусторонние, односторонние альтернативы.

$$x_1, x_2, ..., x_n \ \sim \ \mathcal{N}(\theta_x, \sigma^2)$$
$$y_1, y_2, ..., y_m \ \sim \ \mathcal{N}(\theta_y, \sigma^2)$$
$$\delta = \theta_x - \theta_y$$

$$H_0: \delta=0 \  vs \  H_1:\  \delta\{\neq, <, >\}0$$

Будем использовать сопряженный априор

$$\theta_x \sim \mathcal{N}(\mu_1, \sigma_1^2)$$
$$\theta_y \sim \mathcal{N}(\mu_2, \sigma_2^2)$$
$$prior \ : \ \delta = \theta_x - \theta_y \sim \mathcal{N}(\mu_1 - \mu_2, \sigma_1^2+\sigma_2^2)$$

Также можем выбирать $\kappa$ - априорное число степеней свободы, и $med - $ априорную медиану для распределения на неизвестный параметр $\sigma$.

Пусть $m_1 = \frac{\sum x_i + \frac{\mu_1}{\sigma_1^2}}{N + \frac{1}{\sigma_1^2}}$, $m_2 = \frac{\sum y_i + \frac{\mu_2}{\sigma_2^2}}{M + \frac{1}{\sigma_2^2}}$, где $N, M$ - размеры выборок

$S_x^2, S_y^2$ - выборочные дисперсии (смещенные)

Пусть $\chi_{1, 0.5}^2 ( \approx 0.52)$ - 0.5 квантиль распределения хи-квадрат со степенью свободы 1.

$$posterior \ : \ \sqrt{\frac{N+M+\kappa}{\frac{1}{N + \frac{1}{\sigma_1^2}} + \frac{1}{M + \frac{1}{\sigma_2^2}}}}\frac{\delta - (m_1 - m_2)}{\sqrt{N * S_x^2 + M*S_y^2 + \chi_{1, 0.5}^2*med^2}} \ |\  (X, Y) \sim T_{N+M + \kappa}$$



Байесовский фактор для проверки гипотез:

$$B = \frac{P_0 / P_1}{\Pi_0 / \Pi_1}$$ где $\Pi_0, \Pi_1 - $ априорные вероятности первой гипотезы и альтернативы, $P_0, P_1$ - соответствующие апостериорные вероятности.




Методы проверки:
* **Модификация** $H_0$ : $\Theta_0 = \{(-\epsilon, \epsilon), (0, \epsilon), (-\epsilon, 0)\}$ в завивимости от альтернативы $\{\neq 0, >0, <0\}$
  
  Тогда плотность $p(x) = \int_{\Theta_0} q(t) p_t(x)dt + \int_{\Theta_1} q(t) p_t(x)dt $

  $P_0 = \frac{\int_{\Theta_0} q(t) p_t(x)dt}{p(x)} =  P_{posterior}(\Theta_0), P_1 = \frac{\int_{\Theta_1} q(t) p_t(x)dt}{p(x)} = P_{posterior}(\Theta_1)$
  
  $\Pi_0^{'} = \int_{\Theta_0} q(t) dt, \Pi_1^{'} = \int_{\Theta_1} q(t) dt$

  Априорные вероятности : $\Pi_0 = \frac{\Pi_0^{'}}{\Pi_0^{'} + \Pi_1^{'}}$, $\Pi_1 = \frac{\Pi_1^{'}}{\Pi_0^{'} + \Pi_1^{'}}$

  $HDR = (posterior_{\alpha / 2}, posterior_{1 - \alpha / 2})$, т.к posterior - имеет распределение стьюдента со сдвигом и масштабом

* **Метод Линдли**:
 
  HDR - аналогично, параметры апостериорного распределения - аналогично

* **Априор с атомом**: $H_0 : \delta=t_0(=0)  \  vs \  H_1:\  \delta\{\neq, <, >\}t_0$

  $P(\delta=0) = \Pi_0, \  P(\delta \in \Theta_1) = \frac{1 - \Pi_0}{\int_{\Theta_1}q(t)dt}$

  Плотность $p(x) =  \Pi_0 p_{t_0}(x) + (1 - \Pi_0)\int_{\Theta_1} q_1(t) p_t(x)dt = \Pi_0 p_{t_0}(x) + (1 - \Pi_0)\frac{\int_{\Theta_1} q(t) p_t(x)dt }{ \int_{\Theta_1} q(t) dt}$
  
  $P_0 = \frac{\Pi_0 p_{t0}(x)}{p(x)}, P_1 = \frac{(1 - \Pi_0) \int_{\Theta_1} q(t) p_t(x)dt}{p(x) \int_{\Theta_1} q(t) dt}$

  Байесовский фактор $B = \frac{p_{t_0}(x)}{\int_{\Theta_1} q(t) p_t(x)dt} =  \frac{p_{t_0}(x)}{p_1(x)}$ - отношение правдоподобия выборок. Будем использовать правдоподобие в точке $(\overline{X} - \overline{Y})$

  Назовем scale - масштаб апостериорного распределения Стьюдента на $\delta$

  Тогда $p_{t_0}(\overline{X} - \overline{Y})$ = плотность распр-я $\mathcal{N}(0, scale^2)$ в точке $(\overline{X} - \overline{Y})$ = плотность распр-я $\mathcal{N}(\overline{X} - \overline{Y}, scale^2)$ в точке $0$

   $p_1(\overline{X} - \overline{Y}) = $ вероятность $\Theta_1 $ при распределении
$\mathcal{N}(\overline{X} - \overline{Y}, scale^2)$


In [0]:
class Hypotheses2NormEqualSigmaUniformPrior():
  def __init__(self, alternative="<>"):
    assert alternative in ('<>', '<', '>')

    self.alternative=alternative

  def get_posterior(self, X, Y,
                      kappa=1, med=2, 
                      mu1=0, mu2=0, 
                      sigma1=1, sigma2=1):
    """
    return posterior distribution of delta
    """
    n = len(X)
    m = len(Y)

    chi = sps.chi2(df=1).ppf(0.5)

    self.df = n+m +kappa # степень свободы для апостериорного распределения

    #масштаб апостериорного распределения
    A1 = np.sum((X - X.mean())**2) + np.sum((Y - Y.mean())**2) + chi * med**2 #
    A2 = 1./(n + 1./sigma1**2) + 1./(m + 1./sigma2**2) # A1 и A2 - части масштаба
     
    self.scale = np.sqrt(A1 * A2 / self.df)
    
    #сдвиг апостериорного распределения
    m1 = (X.sum() + mu1 / sigma1**2) / (n + 1 / sigma1**2)
    m2 = (Y.sum() + mu2 / sigma2**2) / (m + 1 / sigma2**2)
    self.loc = m1 - m2

    return sps.t(df=self.df, loc=self.loc, scale=self.scale)


  def test(self, X, Y, method='Lindley', level=0.05, 
           kappa=1, med=2, mu1=0, mu2=0, sigma1=1, sigma2=1, eps=0.1,
           *args, **kwargs):
    """
    params:
    X, Y : numpy arrays 
      two samples from normal distributions
    method : in (Lindley, modify, atom) -
      method of hypotheses testing
    level : float
      significance level
    eps : float
      width of H0 if method==modify

    mu1 : float
      mean from prior normal distribution for theta_x - mean of X sample
    mu2 : float
      mean from prior normal distribution for theta_y - mean of Y sample
    
    sigma1 : float
      standart deviation from prior normal distribution for theta_x - mean of X sample
    sigma2 : float
      standart deviation --------------||-------------- Y sample

    med : float
      the prior median for the unknown standard deviation of samples  

    kappa: df for the inverse chi-squared distribution used 
                        for the unknown standard deviation of 
    returns:
    if method==modify
      it returns dict : 
          posterior_df, 
          posterior_loc, 
          posterior_scale - params of the posterior distribution
          HDR,
          Posterior H0 prob - posterior probability P(H0),
          Posterior H1 prob - posterior probability P(H1),
          BF - Bayesian factor
    if mehthod==Lindley:
      dict:
        posterior_df, 
        posterior_loc, 
        posterior_scale - params of the posterior distribution
        HDR
    if method==atom:
      dict:
        posterior_df, 
        posterior_loc, 
        posterior_scale - params of the posterior distribution,
        Posterior H0 prob - posterior probability P(H0),
        Posterior H1 prob - posterior probability P(H1),
        BF - Bayesian factor
    """
    assert method in ('modify', 'Lindley', 'atom')
    assert 0 < level < 1
    assert eps > 0

    self.level=level

    #априорное распределение
    prior = sps.norm(mu1 - mu2, np.sqrt(sigma1**2 + sigma2**2))

    #апостериорное расп-е
    posterior = self.get_posterior(X, Y, 
                       kappa, med, 
                       mu1, mu2,
                       sigma1, sigma2)

    if method=='Lindley' or method=='modify':
      HDR = (posterior.ppf(level/2.),
              posterior.ppf(1 - level/2.))
      
    if method == 'modify':
      if self.alternative== '<>':
        p0 = posterior.cdf(eps) - posterior.cdf(-eps)
        p1 = 1 - p0

        pi0 = prior.cdf(eps) - prior.cdf(-eps)
        pi1 = 1 - pi0
      if self.alternative== '<':
         p0 =  posterior.cdf(0) - posterior.cdf(-eps)
         p1 = posterior.cdf(-eps)

         pi0 =  prior.cdf(0) - prior.cdf(-eps)
         pi1 = prior.cdf(-eps)

      if self.alternative == '>':
        p0 =  posterior.cdf(eps) - posterior.cdf(0)
        p1 = 1 - posterior.cdf(eps)

        pi0 =  prior.cdf(eps) - prior.cdf(0)
        pi1 = 1 - prior.cdf(eps)

      denominator = p0 + p1

      p0 /= denominator
      p1 /= denominator

      return {"posterior_df":self.df, 
              "posterior_loc":self.loc, 
              "posterior_scale":self.scale, 
              "HDR":HDR,
              "Posterior H0 prob": p0,
              "Posterior H1 prob": p1,
              "BF" : (p0/p1)/(pi0/pi1)}

    if method == 'Lindley':
      return {"posterior_df":self.df, 
              "posterior_loc":self.loc, 
              "posterior_scale":self.scale, 
              "HDR":HDR}
          
    if method == 'atom':
      p0x = sps.norm(loc=0, scale=self.scale).pdf(X.mean() - Y.mean()) # правдоподобие выборки при H0: delta=0

      Pi0 = 0.5 # возьмем априорное P(delta=0) = 1/2

      p0 = Pi0*p0x
      if self.alternative== '<>':
        p1 = 1 - p0

        BF = p0x
      if self.alternative== '<':
        p1 = (1 - p0) / prior.cdf(0)

        BF = p0x / sps.norm(loc=X.mean() - Y.mean(), scale=self.scale).cdf(0)

      if self.alternative== '>':
        p1 = (1 - p0) / prior.sf(0)
        BF = p0x / sps.norm(loc=X.mean() - Y.mean(), scale=self.scale).sf(0)
      

      denominator = p0 + p1
      p0 /= denominator
      p1 /= denominator

      return {"posterior_df":self.df, 
              "posterior_loc":self.loc, 
              "posterior_scale":self.scale,
              "Posterior H0 prob": p0,
              "Posterior H1 prob": p1,
              "BF":BF}


Примеры работы

$x_1, x_2, .., x_{40} \sim \mathcal{N}(1, 2^2)$

$y_1, y_2, .., y_{30} \sim \mathcal{N}(1, 2^2)$

$H_0 \ : \ \delta = 0 \ vs \ H_1 : \delta \neq 0$

Допустим у нас изначально правильное априорное предположение о среднем, т.е. $\mu_1 = 1, \mu_2 = 1$  

Проверим с помощью модификации $H_0$ при $\epsilon = 0.05$

In [18]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(1, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<>')

stat_test.test(X, Y, method='modify', mu1=1, mu2=1, eps=0.05)

{'BF': 2.455108080555375,
 'HDR': (-0.7422880406180131, 1.3038407962348004),
 'Posterior H0 prob': 0.06651323822959421,
 'Posterior H1 prob': 0.9334867617704058,
 'posterior_df': 71,
 'posterior_loc': 0.2807763778083937,
 'posterior_scale': 0.5130859958890039}

Как мы можем видеть, $BF \approx 2.5$, т.е. наша статистика с большой увернностью не отвергает нулевую гипотезу, то есть подверждает априор


Пусть теперь $\mu_1=0, \mu_2=2$

In [16]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(1, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<>')

stat_test.test(X, Y, method='modify', mu1=0, mu2=2, eps=0.05)

{'BF': 7.277262484232637,
 'HDR': (-1.1543651484249025, 0.5202263687615784),
 'Posterior H0 prob': 0.0709161950775945,
 'Posterior H1 prob': 0.9290838049224055,
 'posterior_df': 71,
 'posterior_loc': -0.3170693898316619,
 'posterior_scale': 0.41991952844204505}

Значит, $BF \approx 7.3$. Наша уверенность в нулевой гипотезе была довольно маленькая $(\mu_1 - \mu_2 = 1)$, и она сильно выросла после эксперимента

В обоих случаях $\delta$ попадает в $95\% \  HDR$

Еще один эксперимент:


$x_1, x_2, .., x_{40} \sim \mathcal{N}(1, 2^2)$

$y_1, y_2, .., y_{30} \sim \mathcal{N}(2, 2^2)$

$H_0 \ : \ \delta = 0 \ vs \ H_1 : \delta > 0$

Априорные $\mu_1=1, \mu_2=1$

In [41]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(2, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<')

stat_test.test(X, Y, method='modify', mu1=1, mu2=1, eps=0.05)

{'BF': 0.310703704359267,
 'HDR': (-1.6903354509323665, 0.04502125382902067),
 'Posterior H0 prob': 0.008936699167821941,
 'Posterior H1 prob': 0.9910633008321781,
 'posterior_df': 71,
 'posterior_loc': -0.8226570985516728,
 'posterior_scale': 0.4351569691255008}

Тоже самое, только для атома (при априорной $\Pi_0 = P(\delta = 0) = 1/2$)

In [55]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(2, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<')

stat_test.test(X, Y, method='atom', mu1=1, mu2=1)

{'BF': 0.663487615211439,
 'Posterior H0 prob': 0.15081288127511236,
 'Posterior H1 prob': 0.8491871187248877,
 'posterior_df': 71,
 'posterior_loc': -0.42994297766719725,
 'posterior_scale': 0.5497021743073559}

Здесь, $BF \approx 0.3$(Для модификации), $BF \approx 0.6$(Для априора с атомом 0.5),  т.е. уверенности в нулевой гипотезе стало сильно меньше по сравнению с априорными знаниями. Но при этом $0 \in HDR$, т.е. мы не отвергли гипотезу.




Еще пример:

$x_1, x_2, .., x_{40} \sim \mathcal{N}(1, 2^2)$

$y_1, y_2, .., y_{30} \sim \mathcal{N}(3, 2^2)$

$H_0 \ : \ \delta = 0 \ vs \ H_1 : \delta > 0$

Априорные $\mu_1=0, \mu_2=5$

In [48]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(3, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<')

stat_test.test(X, Y, method='modify', mu1=0, mu2=5, eps=0.05)

{'BF': 4.6805604193222985,
 'HDR': (-2.244498313368603, -0.6505423753675109),
 'Posterior H0 prob': 0.00013573668525837485,
 'Posterior H1 prob': 0.9998642633147417,
 'posterior_df': 71,
 'posterior_loc': -1.4475203443680569,
 'posterior_scale': 0.3996994007036284}

То же самое методом Линдли:

In [65]:
stat_test.test(X, Y, method='Lindley', mu1=0, mu2=5)

{'HDR': (-2.883746443518306, -0.9961525546910344),
 'posterior_df': 71,
 'posterior_loc': -1.93994949910467,
 'posterior_scale': 0.47333187081836064}

Здесь мы отвергли гипотезу методом Линдли, т.к. 0 не лежит в $HDR$. Но при этом $BF \approx 3$, то есть уверенность в нулевой гипотезе выросла по сравнению с параметрами до начала эксперимента. Это потому что различие в средних $(\theta_x - \theta_y = -2)$ оказалось не такое серьезное, как мы в среднем априорно предполгали ($\mu_1 - \mu_2 = -5$)


Попробуем методом априора с атомом при $\Pi_0 = 1/2$

In [67]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(3, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<')

stat_test.test(X, Y, method='atom', mu1=0, mu2=5, eps=0.05)

{'BF': 0.0010810643126730858,
 'Posterior H0 prob': 0.0005403494143214587,
 'Posterior H1 prob': 0.9994596505856785,
 'posterior_df': 71,
 'posterior_loc': -1.861255403834445,
 'posterior_scale': 0.4844603066712844}

Здесь, у нас $BF << 1$, потому что несмотря на априорное различие в среднем ($\mu_1 - \mu_2 = -5$), засчет атомарной вероятности нулевой гипотезы априорно мы предполагаем,  что $P(\delta = 0) = 1/2$

Получается, что отношение априорных вероятностей гипотез равна 1, а отношение вер-тей после эксперимента сильно меньше, так как реально выборки имеют разные средние. 

Если бы мы взяли выборки из распределений с одним средним

$x_1, x_2, .., x_{40} \sim \mathcal{N}(1, 2^2)$

$y_1, y_2, .., y_{30} \sim \mathcal{N}(1, 2^2)$

то результат проверки с атомом $\Pi_0 = 1/2$ будет другой: $BF \approx 2.5$, то есть уверенность в гипотезе у нас вырастает.

In [68]:
X = sps.norm(1, 2).rvs(40)
Y = sps.norm(1, 2).rvs(30)

stat_test = Hypotheses2NormEqualSigmaUniformPrior(alternative='<')

stat_test.test(X, Y, method='atom', mu1=0, mu2=5, eps=0.05)

{'BF': 2.22494491530585,
 'Posterior H0 prob': 0.3992887572095373,
 'Posterior H1 prob': 0.6007112427904628,
 'posterior_df': 71,
 'posterior_loc': 0.007776595914997242,
 'posterior_scale': 0.46795607290623914}