# 2値ラベル系の問題

このページは試験対策そのものではなく、**理解の言語化（メタ認知の固定）**を目的としたメモ。
「陽性/陰性の検査」と「非復元抽出」の2系統をまとめて、**表とグラフ**で要点を固定する。


## 文章校正（前→後、理由つき）

| 校正前（原文） | 校正後（校正版） | 構成理由（何を直したか） |
| --- | --- | --- |
| OK。自分のために自分の言葉でもう一度説明する。 | OK。自分のために、自分の言葉で整理し直す。 | 冒頭を簡潔にし、以後の箇条書き構造に接続しやすくした。 |
| ⓪前提。指示関数が今回確率変数であるうえで以下が成り立つ | ⓪前提：各 $X_i$ は「関東なら1、非関東なら0」を返す **指示変数**である。この0/1性を土台にして、期待値が確率に直結する。 | 「指示関数」より試験・統計の文脈で通る「指示変数」に統一。前提が“何を可能にするか”を1行で明示。 |
| ①の性質は、ラベル自体がそれか否かの二値なので、指示変数が効く。 | ①（0/1性の効き）：ラベルが二値なので $X_i\in{0,1}$ となり、期待値を考えると「1になる場合の確率」だけが残る。 | ①の本体が「0/1だから期待値が確率へ潰れる」ことなので、そこを最短で言い切る形にした。 |
| これは別チャットのベイズの話と似てて、ラベル2値の重みがオールオアナッシング版。 | これは、二値分類やベイズで出る「重み付き平均」が、重みが0/1になった“オールオアナッシング版”だと思えばよい。 | 「似てる」の中身を明確化（重み付き平均→0/1重み）して、連想の足場を固くした。 |
| ただし、ペアを扱う以上、ベイズの時にやったような条件付は避けられない。 | ただしペア（$i
eq j$）を扱うときは、同時に1になる確率を数える必要があり、自然に「先に1つ決めて次を数える」形（条件付きの掛け算）になる。 | 「条件付きが避けられない」を、なぜ必要か（同時事象→順に数える）へ因果で繋いだ。 |
| しかしオールオアナッシングであるから、ラベル２値のモデル化が⓪指示変数という形を取った問題の為、②の同格性がシンプルに書ける（要はどいつもこいつもフラグが立ったイベントの数値だけが残る） | とはいえ 0/1 なので、ペアでも「両方1になる場合」だけを追えばよく、式の形が散らからない（フラグが立つケースだけ残る）。 | ②との混線を防ぐため、ここは①の帰結として閉じた。②は“位置の同格性”なので、役割を分離した。 |
| ②性質の対称性だが、これは⓪＋観測方法「無作為」に由来。 | ②（位置の同格性）：無作為抽出なので、抽出番号（位置ラベル）をどれにしても扱いが同じになる。 | 「対称性」の中身を「位置ラベルの同格性」と明示。以後の文が全部ここにぶら下がるようにした。 |
| 観測方法の無作為が、実質、並べたスロットのどこの位置を指定するかに言い換えられるのがポイント。 | 無作為抽出は「並べた位置（スロット）のどれを見ても同じ重み」という言い換えができる。 | “言い換え”を1文に圧縮し、比喩（スロット）を定義済みとして使える形に整えた。 |
| 重みが同じと言い換えられ、おかげで高校数学でよくやる「並べたものから選ぶ」思考が出来る。 | だから高校数学の「並べたものから位置を選ぶ」発想で、同型の事象が何通りあるか（個数）をそのまま数え上げに使える。 | “何ができるのか”を具体化：同型事象の個数→和が「個数×代表値」に潰れる、へ接続できるようにした。 |
| そこから同じ期待値を与える逆像（つまりイベント組み合わせ）が複数個ある話が出来る。それがこの対称性の正体。 | この同格性により、同じ値を持つ項が多数並ぶ状況が生まれ、総和が「個数×代表値」にまとまる。これがこの対称性の実務的な意味。 | 「逆像」は今回は禁止語に近い（測度論語彙に寄る）ので排除し、言いたい内容（同型事象が複数→個数×代表値）に直訳した。 |
| これは観測が一か所、つまり添え字一個iでも、観測がもう一個ふえjを導入して２か所の場所になっても成立する。 | この同格性は、1点観測（$X_i$）でも、2点観測（$X_iX_j$ のように2位置を見る）でも同様に使える。 | 「iだけ／iとj」の違いを、1点観測・2点観測という言葉で固定して読みやすくした。 |
| 追加。 観測方法の「非復元」は今回は分散の計算で効く。 | 追加：非復元は、2点観測の段階から「独立でない」ことを生み、共分散が0にならない（分散が復元より小さくなる）点で効く。 | 「分散で効く」に加え、どこから効き始めるか（2点観測の時点）と、結果（共分散≠0）を明示。 |
| ペアを扱うときは、条件付確率が出現するが、その集計時に②が必要 | ペアの確率を条件付きの掛け算で作った後、同格性②により「どのペアも同じ」として数え上げ（個数×代表値）に落とせる。 | 「条件付き→集計→②」の流れを因果で一本化。②の使い所を最終工程として明確化。 |
| 多分この理解でいいはず | 以上の整理で、①は“0/1で期待値が確率に潰れる性質”、②は“無作為抽出による位置ラベルの同格性（1点でも2点でも）”、非復元は“独立性を壊して共分散を生む”として役割分担できている。 | “多分”を、定義と役割分担の要約で締めて再利用できる文章にした。 |


## 校正版（全文を一続きで）

OK。自分のために、自分の言葉で整理し直す。
⓪前提：各 $X_i$ は「関東なら1、非関東なら0」を返す **指示変数**である。この0/1性を土台にして、期待値が確率に直結する。

①（0/1性の効き）：ラベルが二値なので $X_i\in{0,1}$ となり、期待値を考えると「1になる場合の確率」だけが残る。これは、二値分類やベイズで出る「重み付き平均」が、重みが0/1になった“オールオアナッシング版”だと思えばよい。
ただしペア（$i
eq j$）を扱うときは、同時に1になる確率を数える必要があり、自然に「先に1つ決めて次を数える」形（条件付きの掛け算）になる。とはいえ0/1なので、ペアでも「両方1になる場合」だけを追えばよく、式の形が散らからない（フラグが立つケースだけ残る）。

②（位置の同格性）：無作為抽出なので、抽出番号（位置ラベル）をどれにしても扱いが同じになる。無作為抽出は「並べた位置（スロット）のどれを見ても同じ重み」という言い換えができる。だから高校数学の「並べたものから位置を選ぶ」発想で、同型の事象が何通りあるか（個数）をそのまま数え上げに使える。この同格性により、同じ値を持つ項が多数並ぶ状況が生まれ、総和が「個数×代表値」にまとまる。これがこの対称性の実務的な意味。
この同格性は、1点観測（$X_i$）でも、2点観測（$X_iX_j$ のように2位置を見る）でも同様に使える。

追加：非復元は、2点観測の段階から「独立でない」ことを生み、共分散が0にならない（分散が復元より小さくなる）点で効く。ペアの確率を条件付きの掛け算で作った後、同格性②により「どのペアも同じ」として数え上げ（個数×代表値）に落とせる。
以上の整理で、①は“0/1で期待値が確率に潰れる性質”、②は“無作為抽出による位置ラベルの同格性（1点でも2点でも）”、非復元は“独立性を壊して共分散を生む”として役割分担できている。


## A) 整形（与件の型：解く前の準備）

### A0. 要約（1〜3行）

母集団10人（関東5・非関東5）から、**非復元**で5人を等確率に抽出。
$i$番目に選ばれた人が関東なら $X_i=1$、それ以外は $0$。
$E[X_i^2],\ E[X_iX_j]\ (i
eq j),\ \mathrm{Var}(ar X)$ を求める。

### A1. 変数・パラメータ表


In [None]:
import pandas as pd

params = pd.DataFrame([
    {"記号": "N", "意味": "母集団サイズ", "値域": "10", "離散/連続": "離散"},
    {"記号": "M", "意味": "関東出身者数", "値域": "5", "離散/連続": "離散"},
    {"記号": "n", "意味": "抽出数", "値域": "5", "離散/連続": "離散"},
    {"記号": "X_i", "意味": "i番目が関東なら1、非関東なら0", "値域": "{0,1}", "離散/連続": "離散"},
    {"記号": "\bar X", "意味": "標本平均 (1/5) Σ X_i", "値域": "[0,1]", "離散/連続": "離散"},
])
params


### A2. 求める量（出力）を1行で

[1] $E[X_i^2]$
[2] $E[X_iX_j]\ (i
eq j)$
[3] $\mathrm{Var}(ar X)$

### A3. 前提・条件（根拠つき）

* 母集団は10人、関東5・非関東5（問題文の列挙）
* **無作為・非復元**で5人抽出（問題文「無作為非復元抽出」）
* $X_i$ は $i$番目の指示変数（問題文の定義式）

### A4. 型宣言（どの型で行くか）

* 離散（指示変数）なので **確率で立てて $E[\cdot]$ を計算**。
* 非復元なので **$X_i$ と $X_j$ は独立ではない** → 共分散が出る。
* 分散は **$\mathrm{Var}(\sum)=\sum \mathrm{Var}+2\sum\sum \mathrm{Cov}$** を使う。

### A5. 最短ルート（3〜8行）

1. $X_i\in{0,1}$ より $X_i^2=X_i$ → $E[X_i^2]=E[X_i]=P(X_i=1)$
2. $E[X_iX_j]=P(X_i=1 \cap X_j=1)$（積は同時に1のときだけ1）
3. $\mathrm{Cov}(X_i,X_j)=E[X_iX_j]-E[X_i]E[X_j)$
4. $\mathrm{Var}(ar X)=rac{1}{n^2}\mathrm{Var}(\sum_{i=1}^n X_i)$
5. $\mathrm{Var}(\sum)=n\mathrm{Var}(X_1)+n(n-1)\mathrm{Cov}(X_1,X_2)$（対称性）

### A6. 記号固定（以後ブレない一覧）

以後使うのは **$N=10,\ M=5,\ n=5,\ X_i,\ ar X$** のみ。追加記号は出さない。


## B) PBT答案（写経用）

### B0. 入力→出力→型→式（フレーム）

* 入力：$N=10,\ M=5,\ n=5$、非復元抽出、$X_i\in{0,1}$
* 出力：[1] $E[X_i^2]$、[2] $E[X_iX_j]$、[3] $\mathrm{Var}(ar X)$
* 型：離散（確率→期待値）、分散は共分散分解
* 最初の一手：$E[X_i]=P(X_i=1)$、$E[X_iX_j]=P(X_i=1 \cap X_j=1)$

---

## [1] (E[X_i^2])

**（与件：$X_i\in{0,1}$ を使う → 二乗が潰れる）**
$X_i^2=X_i$ より
[
E[X_i^2]=E[X_i]=P(X_i=1).
]

**（与件：母集団10人中 関東5人、無作為抽出 → 比で出る）**
[
P(X_i=1)=rac{5}{10}=rac12.
]
したがって
[
oxed{E[X_i^2]=rac12}.
]

---

## [2] (E[X_iX_j]\ (i
eq j))

**（与件：指示変数の積 → 同時に1の確率）**
[
E[X_iX_j]=P(X_i=1 \cap X_j=1).
]

**（与件：非復元抽出 → 条件付きで順に掛ける）**
$i$番目が関東である確率は $5/10$。その後（非復元なので）残りは9人中関東4人。
[
P(X_i=1 \cap X_j=1)=rac{5}{10}\cdotrac{4}{9}=rac{20}{90}=rac{2}{9}.
]
よって
[
oxed{E[X_iX_j]=rac{2}{9}\ (i
eq j)}.
]

---

## [3] (\mathrm{Var}(ar X))

[
ar X=rac{1}{5}\sum_{i=1}^5 X_i
\quad\Rightarrow\quad
\mathrm{Var}(ar X)=rac{1}{25}\mathrm{Var}\left(\sum_{i=1}^5 X_iight).
]

### まず (\mathrm{Var}(X_i))

**（与件：[1]で $P(X_i=1)=1/2$ を得た → ベルヌーイの分散）**
[
\mathrm{Var}(X_i)=E[X_i^2]-(E[X_i])^2=rac12-\left(rac12ight)^2=rac14.
]

### 次に (\mathrm{Cov}(X_i,X_j)\ (i
eq j))

**（与件：[2]の結果を使う → 共分散定義）**
[
\mathrm{Cov}(X_i,X_j)=E[X_iX_j]-E[X_i]E[X_j]
=rac{2}{9}-rac12\cdotrac12
=rac{2}{9}-rac14
=-rac{1}{36}.
]

### (\mathrm{Var}(\sum X_i))

**（与件：非復元なので独立でない → 共分散分解）**
[
\mathrm{Var}\left(\sum_{i=1}^5 X_iight)
=\sum_{i=1}^5\mathrm{Var}(X_i)+2\sum_{1\le i<j\le 5}\mathrm{Cov}(X_i,X_j).
]
対称性より $\mathrm{Var}(X_i)=1/4$ は5個、$\mathrm{Cov}(X_i,X_j)=-1/36$ は組の数 ${5\choose2}=10$ 個。
[
\mathrm{Var}\left(\sum_{i=1}^5 X_iight)
=5\cdotrac14+2\cdot 10\cdot\left(-rac{1}{36}ight)
=rac54-rac{20}{36}
=rac{45-20}{36}
=rac{25}{36}.
]
したがって
[
\mathrm{Var}(ar X)=rac{1}{25}\cdotrac{25}{36}=oxed{rac{1}{36}}.
]


## C) CBT最短メモ（紙に吐く符号化）

(Ω) $N=10,\ M=5,\ n=5,\ X_i\in{0,1},\ ar X=rac1n\sum X_i$（非復元）
(E1) $E[X_i^2]=E[X_i]=P(X_i=1)=M/N=1/2$
(E2) $E[X_iX_j]=P(1\cap1)=rac{M}{N}rac{M-1}{N-1}=rac{5}{10}rac{4}{9}=rac{2}{9}$
(Cov) $\mathrm{Cov}=2/9-(1/2)^2=-1/36$
(VarSum) $n\cdot(1/4)+n(n-1)\cdot(-1/36)=5/4-20/36=25/36$
(Ans) $\mathrm{Var}(ar X)=\mathrm{VarSum}/n^2=(25/36)/25=1/36$

---

## D) 暗記1行（この問題タイプの最短恒等式）
[
oxed{\mathrm{Var}\left(\sum_{i=1}^n X_iight)=n\,\mathrm{Var}(X_1)+n(n-1)\,\mathrm{Cov}(X_1,X_2)}
]
（非復元＝独立でない、ここが出題点）

---

## E) 自己検算（30秒）

* 確率：$E[X_i^2]=1/2\in[0,1]$、$E[X_iX_j]=2/9\in[0,1]$ OK
* 共分散：非復元なら「片方が関東だと残り関東が減る」→ $\mathrm{Cov}<0$。$-1/36$ OK
* 分散：$\mathrm{Var}(ar X)=1/36\ge0$ OK
* 極限感：もし復元（独立）なら $\mathrm{Cov}=0$ で $\mathrm{Var}(ar X)=rac{1}{n}rac14=rac{1}{20}$。非復元ではそれより小さくなるべき → $1/36<1/20$ OK

---

## F) 次の周回の指示（演習を速く回すため）

* タグ：**有限母集団・非復元抽出・指示変数・負の共分散**
* 同型2問を回すときの差し替え箇所：

  1. $P(X_i=1)=M/N$、2) $P(X_i=1\cap X_j=1)=rac{M}{N}rac{M-1}{N-1}$、3) あとは共分散分解に流す
* 再質問の最短文（詰まったらここだけ聞け）：
  「なぜ $E[X_iX_j]=P(X_i=1\cap X_j=1)$ になる？ 指示変数の積の意味を1行で」


## 0) 共通骨格（ベイズ以外でも同じ）

あなたが作った骨格を最短で言い直すとこれ：

* **Ω**：登場人物（状態・観測・抽出結果・順序）を全部並べる箱
* **E**：問われている条件/出来事（部分集合）
* **差し替え**：Eを問題ごとに入れ替えるだけで同型処理
* **分解**：和（分割）か積（段階）かを決める
* **CBT**：重み付きの比（A,B または m）に圧縮

この骨格が刺さるのは「**観測・抽出・判定・制約**をイベントとして扱える問題」全部。


## 1) “二値ラベル系”以外にも効く（ラベルが増えても同じ）

「P と 1−P」じゃなくて「オールオアナッシング（0/1）」でも同じ。むしろ 0/1 はイベント設計と相性が良い。

* 0/1（指示変数）で書ける問題は、ほぼ全部
  * **E**：{I=1} や {I=0} の組み合わせ（∩）
  * **和**：場合分け（∪、または Σ）
  * **積**：段階（∩を条件側に押し込む）

二値に限らず、ラベルが3つ以上でも「分母が Σ になるだけ」で骨格は同じ。


## 2) 具体的にどの分野に効くか（パターン別）

### A. 検査・判定・分類（ベイズの親戚）

* 医療検査を2回/3回、スクリーニング→精密検査
* spam判定、故障診断、異常検知
* 重要なのは「状態D（真）」と「観測R（結果）」の分離
* **差し替え**：E＝{陽}, {陽陽}, {陰陽}…を入れ替えるだけ

### B. 抽出・サンプリング（非復元抽出、層化、検閲）

* 非復元抽出（超幾何、有限母集団補正）
* 層化抽出（層ごとのΩ、Eを層で差し替え）
* **差し替え**：E＝{成功k個}、{特定の構成} など
* 二値じゃなくても指示変数で統一できる

### C. カウント・順列組合せ（“数え上げ→確率”の核）

* サイコロ/カード/並べ方/重複ありなし
* 「確率」は最後に割るだけで、まずはΩを定義して |E|/|Ω| へ
* **差し替え**：E＝条件を満たす並び、条件を満たす集合

### D. 条件付き期待値・分散（分割と共分散）

* Eを「条件の集合」として分割し、期待値や分散を組み立てる
* 非独立（共分散≠0）が出る場面でも、
  * まずΩで登場人物を確定
  * 次にEで“どの組が同時に起きるか”を確定
  * それを ΣVar + 2ΣCov の型に落とす
* **差し替え**：E＝{i=j}, {i
eq j}, {同じ層}…みたいな局所条件

### E. 確率過程・逐次観測（漸化式が真価を発揮）

* マルコフ連鎖、更新、フィルタ（状態推定）
* ここはあなたが作った「q_i 更新」「L_i 当てはまり」が直撃で刺さる
* **差し替え**：E_{1:i}＝観測列、条件は過去を含む


## 3) “P と 1−P”じゃなくて「オールオアナッシング」問題への接続

あなたが言う「Pと1−Pじゃない」問題は、たいていこう：

* 確率値を直接持たず、**指示変数 I\in{0,1}** で持つ
* 目的が (P(I=1)) ではなく、
  * (E[I]), (Var(I)), (Var(\sum I)) など
* あるいは「成功/失敗」だけじゃなく構成が複数（k個成功等）

ここでも骨格は同じ：

* Ω：抽出結果や並びを含む結果空間
* E：I=1 となる条件（部分集合）
* P(E) から E[I]=P(E) に落ちる（0/1の利点）


## 4) “次に何をすればいいか”の目安（最短合格向け）

ベイズの骨格を本当に武器化するなら、次はこの順が最短：

1. **数え上げ型（|E|/|Ω|）** を 5問
   → ΩとEの設計が一番鍛えられる

2. **非復元抽出（共分散補正 or FPC）** を 5問
   → “独立じゃない”を E と Cov で処理する練習

3. **逐次観測（更新式）** を 3問
   → q_i / L_i の「差し替え」が完全に反射化する

ここまでやると「Ω→E差し替え→和/積→圧縮」が分野横断で固定される。

必要なら、あなたが言っている「オールオアナッシング」っぽい別チャットの問題文（そのまま）を貼れば、上の分類のどれに該当するかタグ付けして、**ΩとEの定義だけ**を最短で作って見せる。そこで「差し替え点」が確定するので、以後は同型を高速で回せる。


無駄じゃない。あなたの言う「PBTで理解を焼き付ける写経」と「CBTで最速に符号化して紙に吐く手順」は別物で、**両方を分けて持つのが最短**。

以下、**CBT用（紙に最短で書く符号化テンプレ）**を作る。
（「自分だけが読めれば良い」前提で、丸括弧ラベル多め／式は最短。）

---

# CBT最短テンプレ（2値D版：紙に吐く用）

## 0) 最初に1行だけ（登場人物の整列）

（Ωは“自分の頭を整えるスイッチ”として1行だけ）
[
(\Omega_i)\ \{(d,r_{1:i})\},\ d\in{1,0},\ p=P(d=1),\ 1-p=P(d=0)
]

## 1) その場のイベント（差し替え点）

[
(E)\ E=E_{1:i}=igcap_{k=1}^{i}\{r_k=	ext{与えられた値}\}
]

## 2) 与件落とし（ここだけ手を動かす）

[
(A)\ A:=P(E\mid d=1),p
]
[
(B)\ B:=P(E\mid d=0),(1-p)
]

## 3) 答

[
(	ext{Ans})\ P(d=1\mid E)=rac{A}{A+B}
]

### さらに短縮（m型：電卓メモリー感）

[
(m)\ m:=rac{B}{A}
\quad\Rightarrow\quad
(	ext{Ans})=rac{1}{1+m}
]

---

# 問2を「CBT符号化」で解く実演（あなたの型で）

## (Ω)

[
(\Omega_2)\ \{(d,r_1,r_2)\},\ d\in{1,0}
]

## (E)

[
(E_2)\ E=\{r_1=1\}\cap\{r_2=1\}
]

## (与件 → (P(E\mid d)) へ最短で落とす)

[
p=10^{-3},\quad 1-p=0.999
]
[
P(r_1=1\mid d=1)=0.999,\quad P(r_1=1\mid d=0)=0.001
]
[
P(r_2=1\mid r_1=1,d=1)=0.95,\quad P(r_2=1\mid r_1=1,d=0)=0.05
]

[
P(E\mid d=1)=0.999\cdot0.95
]
[
P(E\mid d=0)=0.001\cdot0.05
]

## (A)(B)

[
(A)\ A=(0.999\cdot0.95)\cdot10^{-3}
]
[
(B)\ B=(0.001\cdot0.05)\cdot0.999
]

## (m) で即潰す（最速）

[
(m)\ m=rac{B}{A}
=rac{0.001\cdot0.05\cdot0.999}{0.999\cdot0.95\cdot10^{-3}}
=rac{0.05}{0.95}=rac{1}{19}
]

## (Ans)

[
(	ext{Ans})=rac{1}{1+m}
=rac{1}{1+1/19}=rac{19}{20}=0.95
]

---

# これが“歴戦の猛者CBT”の中身

* **Eだけ差し替える**
* 分母は作らない（**A,B or m だけ**）
* 係数（(p,1-p)）は必ず A,B に吸収（書き漏れ防止）
* (\cap) だけで押し切る（カンマ記法に逃げない）

---

必要なら、あなたが送ってた「問1の符号化テンプレ」の書式（丸括弧のラベル名や改行位置）に完全に寄せて、**問1・問2を同一フォーマットで並べた“写経シート”**も作れる。


## 図表: 陽性/陰性と非復元抽出の可視化

### 1) 検査（陽性/陰性）の簡易モデル

感度・特異度・事前確率から、陽性/陰性の事後確率（PPV/NPV）を計算して棒グラフで確認する。


In [None]:
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

# 例: 感度=0.99, 特異度=0.99, 事前確率=0.001
sensitivity = 0.99
specificity = 0.99
prevalence = 0.001

p_pos = sensitivity * prevalence + (1 - specificity) * (1 - prevalence)
ppv = sensitivity * prevalence / p_pos

p_neg = (1 - sensitivity) * prevalence + specificity * (1 - prevalence)
npv = specificity * (1 - prevalence) / p_neg

pd.DataFrame([
    {"項目": "陽性の事後確率(PPV)", "値": ppv},
    {"項目": "陰性の事後確率(NPV)", "値": npv},
])


In [None]:
labels = ["PPV", "NPV"]
values = [ppv, npv]

plt.figure(figsize=(6, 4))
plt.bar(labels, values, color=["#f28e2b", "#4e79a7"])
plt.ylim(0, 1)
plt.title("検査結果の事後確率（陽性/陰性）")
plt.ylabel("確率")
plt.grid(axis="y", alpha=0.3)
plt.show()


### 2) 非復元抽出（分散の差）

復元（独立）と非復元で、標本平均の分散がどう変わるかを可視化する。


In [None]:
N = 10
M = 5
p = M / N
ns = np.arange(1, N + 1)

# 復元（独立）: Var(平均)=p(1-p)/n
var_with_replacement = p * (1 - p) / ns

# 非復元: 有限母集団補正 (N-n)/(N-1)
var_without_replacement = var_with_replacement * (N - ns) / (N - 1)

plt.figure(figsize=(7, 4))
plt.plot(ns, var_with_replacement, marker="o", label="復元（独立）")
plt.plot(ns, var_without_replacement, marker="s", label="非復元")
plt.title("標本平均の分散（復元 vs 非復元）")
plt.xlabel("標本サイズ n")
plt.ylabel("Var(平均)")
plt.xticks(ns)
plt.grid(True, alpha=0.3)
plt.legend()
plt.show()
