# 二項分布と負の二項分布の片側検定のP値

* 黒木玄
* 2022-06-06

$
\newcommand\op{\operatorname}
\newcommand\Beta{\op{Beta}}
\newcommand\Binomial{\op{Binomial}}
\newcommand\NegativeBinomial{\op{NegativeBinomial}}
\newcommand\Bin{\op{Bin}}
\newcommand\NegBin{\op{NegBin}}
\newcommand\pmf{\op{pmf}}
\newcommand\pdf{\op{pdf}}
\newcommand\cdf{\op{cdf}}
\newcommand\ccdf{\op{ccdf}}
$

一般に次が成立している:

$$
\begin{aligned}
&
\frac{\int_0^p t^{k-1}(1-t)^{n-k}\,dt}{B(k, n-k+1)} =
\sum_{i=k}^n \binom{n}{i} p^i (1-p)^{n-i} =
\sum_{j=k}^n \binom{j-1}{k-1} p^k (1-p)^{j-k},
\\ &
\frac{\int_p^1 t^{k}(1-t)^{n-k-1}\,dt}{B(k+1, n-k)} =
\sum_{i=0}^k \binom{n}{i} p^i (1-p)^{n-i} =
\sum_{j=n+1}^\infty \binom{j-1}{(k+1)-1} p^{k+1} (1-p)^{j-(k+1)},
\\ &
\frac{\int_p^1 t^{k-1}(1-t)^{n-k-1}\,dt}{B(k, n-k)} =
\sum_{i=0}^{k-1} \binom{n-1}{i} p^i (1-p)^{(n-1)-i} =
\sum_{j=n}^\infty \binom{j-1}{k-1} p^k (1-p)^{j-k}.
\end{aligned}
$$

これは「試行回数 $n$, 成功回数 $k$」というデータについて, 以下のようになることを含む:

$$
\begin{aligned}
&
(\text{二項分布 $\Binomial(n, p)$ での仮説 $p\le p_0$ の片側検定のP値}) \\ &=
(\text{負の二項分布 $\NegativeBinomial(k, p)$ での仮説 $p\le p_0$ の片側検定のP値}) \\ &=
(\text{ベータ分布 $\Beta(k, n-k+1)$ 内で仮説 $p\le p_0$ が成立する確率})
\\ &
\quad
\\ &
(\text{二項分布 $\Binomial(n, p)$ での仮説 $p\ge p_0$ の片側検定のP値}) \\ &=
(\text{ベータ分布 $\Beta(k+1, n-k)$ 内で仮説 $p\ge p_0$ が成立する確率})
\\ &
\quad
\\ &
(\text{負の二項分布 $\NegativeBinomial(k, p)$ での仮説 $p\ge p_0$ の片側検定のP値}) \\ &=
(\text{ベータ分布 $\Beta(k, n-k)$ 内で仮説 $p\ge p_0$ が成立する確率}).
\end{aligned}
$$

これは以下が成立していることを意味している:

(1) 二項分布 $\Binomial(n, p)$ と負の二項分布 $\NegativeBinomial(k, p)$ のどちらにおいても, 仮説 $p\le p_0$ の片側検定のP値は, improper事前分布 $\Beta(0, 1)$ から定まる事後分布内でその仮説が成立する確率に等しい.

(2) 二項分布 $\Binomial(n, p)$ での仮説 $p\ge p_0$ の片側検定のP値は, improper事前分布 $\Beta(1, 0)$ から定まる事後分布内でその仮説が成立する確率に等しい.

(3) 負の二項分布 $\NegativeBinomial(k, p)$ での仮説 $p\ge p_0$ の片側検定のP値は, improper事前分布 $\Beta(0, 0)$ から定まる事後分布内で仮説 $p\ge p_0$ が成立する確率に等しい.

このとき, (2)と(3)が一致していないことに注意せよ.

In [1]:
using Distributions
#using StatsPlots

In [2]:
n, k, p = 12, 3, 0.5
@show n k p
println()

@show sum(binomial(n, i)*p^i*(1-p)^(n-i) for i in k:n)
@show sum(binomial(j-1, k-1)*p^k*(1-p)^(j-k) for j in k:n)
@show cdf(Beta(k, n-k+1), p)
println()

@show sum(binomial(n, i)*p^i*(1-p)^(n-i) for i in 0:k)
@show 1 - sum(binomial(j-1, (k+1)-1)*p^(k+1)*(1-p)^(j-(k+1)) for j in k+1:n)
@show ccdf(Beta(k+1, n-k), p)
println()

@show sum(binomial(n-1, i)*p^i*(1-p)^((n-1)-i) for i in 0:k-1)
@show 1 - sum(binomial(j-1, k-1)*p^k*(1-p)^(j-k) for j in k:n-1)
@show ccdf(Beta(k, n-k), p)
;

n = 12
k = 3
p = 0.5

sum((binomial(n, i) * p ^ i * (1 - p) ^ (n - i) for i = k:n)) = 0.980712890625
sum((binomial(j - 1, k - 1) * p ^ k * (1 - p) ^ (j - k) for j = k:n)) = 0.980712890625
cdf(Beta(k, (n - k) + 1), p) = 0.980712890625

sum((binomial(n, i) * p ^ i * (1 - p) ^ (n - i) for i = 0:k)) = 0.072998046875
1 - sum((binomial(j - 1, (k + 1) - 1) * p ^ (k + 1) * (1 - p) ^ (j - (k + 1)) for j = k + 1:n)) = 0.072998046875
ccdf(Beta(k + 1, n - k), p) = 0.072998046875

sum((binomial(n - 1, i) * p ^ i * (1 - p) ^ ((n - 1) - i) for i = 0:k - 1)) = 0.03271484375
1 - sum((binomial(j - 1, k - 1) * p ^ k * (1 - p) ^ (j - k) for j = k:n - 1)) = 0.03271484375
ccdf(Beta(k, n - k), p) = 0.03271484374999999


In [3]:
n, k, p = 12, 3, 0.5
@show n k p
println()

@show ccdf(Binomial(n, p), k-1)
@show cdf(NegativeBinomial(k, p), n-k)
@show cdf(Beta(k, n-k+1), p)
println()

@show cdf(Binomial(n, p), k)
@show ccdf(NegativeBinomial(k+1, p), (n+1)-1-(k+1))
@show ccdf(Beta(k+1, n-k), p)
println()

@show cdf(Binomial(n-1, p), k-1)
@show ccdf(NegativeBinomial(k, p), n-1-k)
@show ccdf(Beta(k, n-k), p)
;

n = 12
k = 3
p = 0.5

ccdf(Binomial(n, p), k - 1) = 0.980712890625
cdf(NegativeBinomial(k, p), n - k) = 0.980712890625
cdf(Beta(k, (n - k) + 1), p) = 0.980712890625

cdf(Binomial(n, p), k) = 0.072998046875
ccdf(NegativeBinomial(k + 1, p), ((n + 1) - 1) - (k + 1)) = 0.07299804687500007
ccdf(Beta(k + 1, n - k), p) = 0.072998046875

cdf(Binomial(n - 1, p), k - 1) = 0.03271484374999999
ccdf(NegativeBinomial(k, p), (n - 1) - k) = 0.03271484375000003
ccdf(Beta(k, n - k), p) = 0.03271484374999999


In [4]:
n, k, p = 24, 7, 0.5
@show n k p
println()

@show ccdf(Binomial(n, p), k-1)
@show cdf(NegativeBinomial(k, p), n-k)
@show cdf(Beta(k, n-k+1), p)
println()

@show cdf(Binomial(n, p), k)
@show ccdf(NegativeBinomial(k+1, p), (n+1)-1-(k+1))
@show ccdf(Beta(k+1, n-k), p)
println()

@show cdf(Binomial(n-1, p), k-1)
@show ccdf(NegativeBinomial(k, p), n-1-k)
@show ccdf(Beta(k, n-k), p)
;

n = 24
k = 7
p = 0.5

ccdf(Binomial(n, p), k - 1) = 0.9886720776557922
cdf(NegativeBinomial(k, p), n - k) = 0.9886720776557922
cdf(Beta(k, (n - k) + 1), p) = 0.9886720776557922

cdf(Binomial(n, p), k) = 0.03195732831954961
ccdf(NegativeBinomial(k + 1, p), ((n + 1) - 1) - (k + 1)) = 0.0319573283195496
ccdf(Beta(k + 1, n - k), p) = 0.03195732831954961

cdf(Binomial(n - 1, p), k - 1) = 0.01734483242034915
ccdf(NegativeBinomial(k, p), (n - 1) - k) = 0.017344832420349142
ccdf(Beta(k, n - k), p) = 0.01734483242034915
