# 標本標準偏差について

## 準備

1,2,3,4,5の中から$n$個の数字を取り出す。取り出した数字を順に$X_1$，$X_2$，$\cdots$，$X_n$とすると$X_i$は確率変数となる。

$X_i$はi.i.d（独立同分布）で

確率分布は

|$X_i$|1|2|3|4|5|計|
|:---:|:---:|:---:|:---:|:---:|:---:|:---:|
|$P$|1/5|1/5|1/5|1/5|1/5|1|

平均は

$E(X_i)=\dfrac{1+2+3+4+5}5=3$

分散は

$V(X_i)=\dfrac{4+1+0+1+4}5=2$

標準偏差は

$\sigma(X_i)=\sqrt{2}=1.4142135623730951...$

## 標本平均

$\displaystyle{\overline X=\dfrac1n\sum_{k=1}^nX_k}$

- 標本平均の平均$E(\overline X)=\mu = 3$ 
- 標本平均$\overline X$は不偏推定量である。（一致推定量でもある）
- 標本平均の分散$V(\overline X)=\dfrac{\sigma^2}{n}=\dfrac2n$
- 標本平均の標準偏差$\sigma(\overline X)=\dfrac{\sigma}{\sqrt n}=\sqrt{\dfrac2n}$

## 標本分散


$\displaystyle{S^2=\dfrac1n\sum_{k=1}^n\left(X_k-\overline X\right)^2}$


- 標本分散の平均$E(S^2)=\dfrac{n-1}{n}\sigma^2=\dfrac{2(n-1)}{n}$ 
- $\displaystyle{\lim_{n\to\infty}E(S^2)=\sigma^2}$ 
- 標本分散$S^2$は不偏推定量ではない。一致推定量である。
- 標本分散の平均の平方根 $\sqrt{E(S^2)}=\sqrt{\dfrac{n-1}{n}}\sigma=\sqrt{\dfrac{2(n-1)}{n}}$ 



 1,2,3,4,5の中から$n$個の数字を取り出す。
 
 取り出した数字を順に$X_1$，$X_2$，$\cdots$，$X_n$とすると$X_i$は確率変数となる。

 $X_1$，$X_2$，$\cdots$，$X_n$はi.i.d（独立同分布）で
 
 確率分布は




 |$X_i$|1|2|3|4|5|計|
 |:---:|:---:|:---:|:---:|:---:|:---:|:---:|
 |$P$|1/5|1/5|1/5|1/5|1/5|1|
 

平均は$E(X_i)=3$，
分散は$V(X_i)=2$，
標準偏差は$\sigma(X_i)=\sqrt{2}=1.41...$

標本平均は$\displaystyle{\overline X=\dfrac1n\sum_{k=1}^nX_k}$

標本分散は$\displaystyle{S^2=\dfrac1n\sum_{k=1}^n\left(X_k-\overline X\right)^2=\dfrac1n\sum_{k=1}^n{X_k}^2-\overline X^2}$

標本標準偏差は$\displaystyle{S=\sqrt{\dfrac1n\sum_{k=1}^n\left(X_k-\overline X\right)^2}}$

In [2]:
using Combinatorics #順列・組み合わせのパッケージ
using Distributions #統計のパッケージ

function  BiasedSampleVar(m,n)
    A = [i for i=1:m]
    X = repeat(A,inner=[n])
    Y = collect(multiset_permutations(X, n))
    L = length(Y)
    X̂ = [sum(Y[i])/n for i=1:L] #それそれの標本平均
    Z=[]
    for i=1:L
         append!(Z,sum((Y[i][j]- X̂[i])^2/n for j=1:n)) # S²
    end
    return Z 
end

for i=1:10
    map(sqrt,BiasedSampleVar(5,i)) |>mean|>println
end


0.0
0.8
1.051142216570546
1.160727480964246
1.220082779063528
1.2570091145131863
1.28214792720429


1.3003528582802548


1.3141406190845255


1.3249438223097685


In [4]:
using Combinatorics #順列・組み合わせのパッケージ
using Distributions #統計のパッケージ

function BiasedSampleVar(m,n)
    A = [i for i=1:m]
    X = repeat(A,inner=[n])
    Y = collect(multiset_permutations(X, n))
    L = length(Y)
    X̂ = [sum(y)/n for y in Y] #それそれの標本平均
    
    # Zのサイズを事前に計算して、動的なメモリアロケーションを避ける
    Z = Vector{Float64}(undef, L)
    
    for i=1:L
        Z[i] = sum((Y[i][j] - X̂[i])^2/n for j=1:n) # S²
    end
    return Z 
end

for i=1:10
    map(sqrt,BiasedSampleVar(5,i)) |> mean |> println
end


0.0
0.8
1.051142216570546
1.160727480964246
1.220082779063528
1.2570091145131863
1.28214792720429


1.3003528582802548


1.3141406190845255


1.3249438223097685


In [5]:
for i=1:10
    map(sqrt,BiasedSampleVar(5,i)) |> mean |> println
end

0.0
0.8
1.051142216570546
1.160727480964246
1.220082779063528
1.2570091145131863
1.28214792720429


1.3003528582802548


1.3141406190845255


1.3249438223097685


In [20]:
powerset([1,2,3],0,3)|>collect

8-element Vector{Vector{Int64}}:
 []
 [1]
 [2]
 [3]
 [1, 2]
 [1, 3]
 [2, 3]
 [1, 2, 3]

In [23]:
multiexponents(4, 3)|>collect

20-element Vector{Any}:
 [3, 0, 0, 0]
 [2, 1, 0, 0]
 [2, 0, 1, 0]
 [2, 0, 0, 1]
 [1, 2, 0, 0]
 [1, 1, 1, 0]
 [1, 1, 0, 1]
 [1, 0, 2, 0]
 [1, 0, 1, 1]
 [1, 0, 0, 2]
 [0, 3, 0, 0]
 [0, 2, 1, 0]
 [0, 2, 0, 1]
 [0, 1, 2, 0]
 [0, 1, 1, 1]
 [0, 1, 0, 2]
 [0, 0, 3, 0]
 [0, 0, 2, 1]
 [0, 0, 1, 2]
 [0, 0, 0, 3]

In [11]:
multiset_permutations([1,2,3,4],3)|>x->map(x,sum)

MethodError: MethodError: no method matching length(::typeof(sum))

Closest candidates are:
  length(!Matched::Union{Base.KeySet, Base.ValueIterator})
   @ Base abstractdict.jl:58
  length(!Matched::Union{LinearAlgebra.Adjoint{T, S}, LinearAlgebra.Transpose{T, S}} where {T, S})
   @ LinearAlgebra ~/.julia/juliaup/julia-1.9.2+0.aarch64.apple.darwin14/share/julia/stdlib/v1.9/LinearAlgebra/src/adjtrans.jl:295
  length(!Matched::Union{SparseArrays.FixedSparseVector{Tv, Ti}, SparseArrays.SparseVector{Tv, Ti}} where {Tv, Ti})
   @ SparseArrays ~/.julia/juliaup/julia-1.9.2+0.aarch64.apple.darwin14/share/julia/stdlib/v1.9/SparseArrays/src/sparsevector.jl:95
  ...


In [5]:
5^6

15625

In [7]:

for i=1:10
    BiasedSampleVar(5,i) |>mean|>println
end

0.0
1.0
1.3333333333333333
1.5
1.5999999999999994
1.6666666666666687
1.7142857142857142


1.75


1.7777777777777772


1.8


In [123]:
md"""

|母標準偏差$(std([1,2,3,4,5],corrected=false))|標本標準偏差の平均$E(S)$|
|:---:|:---:|
|$n=1$ |$(mean(map(sqrt,BiasedSampleVar(5,1))))|
|$n=2$ |$(mean(map(sqrt,BiasedSampleVar(5,2))))|
|$n=3$ |$(mean(map(sqrt,BiasedSampleVar(5,3))))|
|$n=4$ |$(mean(map(sqrt,BiasedSampleVar(5,4))))|
|$n=5$ |$(mean(map(sqrt,BiasedSampleVar(5,5))))|
|$n=6$ |$(mean(map(sqrt,BiasedSampleVar(5,6))))|
|$n=7$ |$(mean(map(sqrt,BiasedSampleVar(5,7))))|
|$n=8$ |$(mean(map(sqrt,BiasedSampleVar(5,8))))|
|$n=9$ |$(mean(map(sqrt,BiasedSampleVar(5,9))))|
|$n=10$ |$(mean(map(sqrt,BiasedSampleVar(5,10))))|


"""

| 母標準偏差1.4142135623730951 |  標本標準偏差の平均$E(S)$   |
|:-----------------------:|:------------------:|
|          $n=1$          |        0.0         |
|          $n=2$          |        0.8         |
|          $n=3$          | 1.051142216570546  |
|          $n=4$          | 1.160727480964246  |
|          $n=5$          | 1.220082779063528  |
|          $n=6$          | 1.2570091145131863 |
|          $n=7$          |  1.28214792720429  |
|          $n=8$          | 1.3003528582802548 |
|          $n=9$          | 1.3141406190845255 |
|         $n=10$          | 1.3249438223097685 |


In [None]:
using Combinatorics #順列・組み合わせのパッケージ
using Distributions #統計のパッケージ

function  BiasedSampleVar2(m,n)

    MIN = n
    MAX = m*n
    X = []
    Y = []
    for i=MIN:MAX
        partitions(i,n)*i
    A = [i for i=1:m]
    X = repeat(A,inner=[n])
    Y = collect(multiset_permutations(X, n))
    L = length(Y)
    X̂ = [sum(Y[i])/n for i=1:L] #それそれの標本平均
    Z=[]
    for i=1:L
         append!(Z,sum((Y[i][j]- X̂[i])^2/n for j=1:n)) # S²
    end
    return Z 
end

for i=1:10
    map(sqrt,BiasedSampleVar(5,i)) |>mean|>println
end

In [6]:
partitions(100,20) |> length

10474462

In [26]:
using MathLink

W`Integrate[Tan[3 x]/Tan[x],x]`

W"Integrate"(W"Times"(W"Tan"(W"Times"(3, W"x")), W"Power"(W"Tan"(W"x"), -1)), W"x")