## 標本分散と不偏分散の違い

### 標本分散（Sample Variance）
標本分散は、標本から計算される分散で、母集団全体の分散の推定に使用されますが、母集団の真の分散を過小評価する傾向があります。標本分散の公式は以下の通りです：

$$
s^2 = \frac{1}{n} \sum_{i=1}^n (x_i - \bar{x})^2
$$

ここで：
- $s^2$ は標本分散
- $n$ は標本サイズ（データポイントの数）
- $x_i$ は各データポイント
- $\bar{x}$ は標本平均

### 不偏分散（Unbiased Sample Variance）
不偏分散は、母集団の分散をより正確に推定するために標本分散を調整したものです。不偏分散の公式は以下の通りです：

$$
s^2 = \frac{1}{n-1} \sum_{i=1}^n (x_i - \bar{x})^2
$$

ここで：
- $s^2$ は不偏分散
- $n$ は標本サイズ（データポイントの数）
- $x_i$ は各データポイント
- $\bar{x}$ は標本平均

### 主な違い
1. **分母の違い**：
   - 標本分散では分母が $n$ であるのに対して、不偏分散では分母が $n-1$ です。不偏分散で $n-1$ を使用するのは、標本平均が母集団平均の推定値であるため、その推定によるバイアスを補正するためです。この補正は「Besselの補正」と呼ばれます。

2. **使用目的の違い**：
   - 標本分散は標本内でのデータの広がりを評価するのに対し、不偏分散は母集団の分散の推定に使用されます。

### 例
具体例を用いて説明します。

**標本データ**: $x = [2, 4, 6, 8, 10]$

#### 標本分散の計算
1. 標本平均を計算します：
$$
\bar{x} = \frac{2 + 4 + 6 + 8 + 10}{5} = 6
$$
2. 各データポイントと標本平均との差の二乗を求めます：
$$
(2-6)^2, (4-6)^2, (6-6)^2, (8-6)^2, (10-6)^2 = 16, 4, 0, 4, 16
$$
3. これらの合計を求めます：
$$
16 + 4 + 0 + 4 + 16 = 40
$$
4. 標本分散を計算します：
$$
s^2 = \frac{40}{5} = 8
$$

#### 不偏分散の計算
1. 標本平均と差の二乗の合計を計算します（これは既に求めています）：
$$
40
$$
2. 不偏分散を計算します：
$$
s^2 = \frac{40}{5-1} = 10
$$

この例からわかるように、標本分散は 8 ですが、不偏分散は 10 となり、標本分散の方がやや小さい値になります。不偏分散は母集団分散の推定値としてより適切な値を提供します。