### 1. エントロピー (Entropy)

エントロピーは、与えられた確率分布の不 certaintyを測定します。定義は以下の通りです：

$$
H(X) = -\sum_{i=1}^{n} P(x_i) \log_2 P(x_i)
$$

ここで、$ X $ は離散的な確率変数で、$ x_i $ はその取り得る値の一つです。

### 2. 初期確率 (Initial Probabilities)

初期確率は、すべてのケースが等しい確率で起こると仮定しています。例えば、$ n $ 個のケースがある場合：

$$
P(\text{case}_i) = \frac{1}{n} \quad \text{for all } i
$$

### 3. 選択肢の確率 (Choice Probabilities)

選択肢の確率は、各ケースに対する条件付き確率と初期確率を用いて計算されます。例えば、選択肢 $ c_j $ の確率は：

$$
P(c_j) = \sum_{i=1}^{n} P(c_j | \text{case}_i) \cdot P(\text{case}_i)
$$

### 4. 事後確率 (Posterior Probabilities)

選択肢 $ c_j $ が与えられた場合の、各ケースの事後確率は：

$$
P(\text{case}_i | c_j) = \frac{P(c_j | \text{case}_i) \cdot P(\text{case}_i)}{P(c_j)}
$$

### 5. 事後エントロピー (Conditional Entropy)

選択肢 $ c_j $ に対する事後エントロピーは：

$$
H(X | c_j) = -\sum_{i=1}^{n} P(\text{case}_i | c_j) \log_2 P(\text{case}_i | c_j)
$$

### 6. 全体の事後エントロピー (Total Conditional Entropy)

全体の事後エントロピーは、各選択肢に対する事後エントロピーの期待値です：

$$
H(X | C) = \sum_{j} P(c_j) \cdot H(X | c_j)
$$

### 7. 情報利得 (Information Gain)

情報利得は、初期エントロピーから事後エントロピーを引いた値です：

$$
\text{IG}(C; X) = H(X) - H(X | C)
$$

### 具体的な計算手順

1. **初期確率の計算**：
   $$
   P(\text{case}_i) = \frac{1}{n} \quad \text{for all } i
   $$
   
2. **選択肢の確率の計算**：
   $$
   P(c_j) = \sum_{i=1}^{n} P(c_j | \text{case}_i) \cdot P(\text{case}_i)
   $$

3. **事後確率の計算**：
   $$
   P(\text{case}_i | c_j) = \frac{P(c_j | \text{case}_i) \cdot P(\text{case}_i)}{P(c_j)}
   $$

4. **各選択肢に対する事後エントロピーの計算**：
   $$
   H(X | c_j) = -\sum_{i=1}^{n} P(\text{case}_i | c_j) \log_2 P(\text{case}_i | c_j)
   $$

5. **全体の事後エントロピーの計算**：
   $$
   H(X | C) = \sum_{j} P(c_j) \cdot H(X | c_j)
   $$

6. **情報利得の計算**：
   $$
   \text{IG}(C; X) = H(X) - H(X | C)
   $$

これらの式を用いて、コードは情報利得を計算しています。具体的には、初期確率に基づくエントロピーと、選択肢に対する条件付き確率から導出される事後エントロピーを計算し、その差を情報利得としています。

### 例示

例えば、3つのケース（りんご、バナナ、スイカ）と5つの選択肢（はい、多少はい、わからない、多少いいえ、いいえ）がある場合、以下のような計算を行います。
質問は、たとえば"赤いですか？"だったとします。

1. **初期確率**：
   $$
   P(\text{りんご}) = P(\text{バナナ}) = P(\text{スイカ}) = \frac{1}{3}
   $$

2. **選択肢の確率**：
   例えば、選択肢 "はい" の確率は：
   $$
   P(\text{はい}) = P(\text{はい} | \text{りんご}) \cdot P(\text{りんご}) + P(\text{はい} | \text{バナナ}) \cdot P(\text{バナナ}) + P(\text{はい} | \text{スイカ}) \cdot P(\text{スイカ})
   $$

3. **事後確率**：
   例えば、選択肢 "はい" が与えられたときのりんごの事後確率は：
   $$
   P(\text{りんご} | \text{はい}) = \frac{P(\text{はい} | \text{りんご}) \cdot P(\text{りんご})}{P(\text{はい})}
   $$

4. **事後エントロピー**：
   例えば、選択肢 "はい" に対する事後エントロピーは：
   $$
   H(X | \text{はい}) = -\sum_{i \in \{\text{りんご}, \text{バナナ}, \text{スイカ}\}} P(\text{case}_i | \text{はい}) \log_2 P(\text{case}_i | \text{はい})
   $$

5. **全体の事後エントロピー**：
   $$
   H(X | C) = \sum_{j \in \{\text{はい}, \text{多少はい}, \text{わからない}, \text{多少いいえ}, \text{いいえ}\}} P(c_j) \cdot H(X | c_j)
   $$

6. **情報利得**：
   $$
   \text{IG}(C; X) = H(X) - H(X | C)
   $$
   
   ここで、$ H(X) $は初期エントロピーで、等確率の場合：
   $$
   H(X) = -\sum_{i=1}^{3} \frac{1}{3} \log_2 \frac{1}{3} = \log_2 3
   $$

これらの計算を通じて、情報利得が導出されます。

In [None]:
import math

CHOICES = ["はい", "多分はい", "わからない", "多分いいえ", "いいえ"]


def calculate_entropy(probs):
    """Calculate the entropy of a list of probabilities."""
    return -sum(p * math.log2(p) for p in probs.values() if p > 0)


def initial_probabilities(cases):
    """Calculate the prior probabilities assuming uniform distribution."""
    num_cases = len(cases)
    prob = 1 / num_cases
    return {case: prob for case in cases}


def calculate_choice_probs(conditional_choice_probs, initial_case_probs):
    """Calculate the probabilities for each choice."""
    choice_probs = {choice: 0 for choice in CHOICES}

    for case in conditional_choice_probs:
        for choice, probs in conditional_choice_probs[case].items():
            choice_probs[choice] += probs * initial_case_probs[case]

    return choice_probs


def calculate_posterior_entropy(conditional_choice_probs, initial_case_probs, choice_probs):
    """Calculate the weighted sum of entropies for each choice."""
    H_posterior = 0

    for choice in CHOICES:
        if choice_probs[choice] == 0:
            continue  # Skip if this choice has zero probability

        posterior_probs = {}
        for case in conditional_choice_probs.keys():
            cond_prob = conditional_choice_probs[case].get(choice, 0)
            prior_prob = initial_case_probs[case]
            posterior_prob = (cond_prob * prior_prob) / choice_probs[choice]
            posterior_probs[case] = posterior_prob

        # Calculate entropy for this choice's posterior distribution
        ent = calculate_entropy(posterior_probs)
        H_posterior += ent * choice_probs[choice]

    return H_posterior


def calculate_information_gain(question_data):
    """Calculate the information gain for a given question and probability data."""
    cases = list(question_data['probs'].keys())
    initial_case_probs = initial_probabilities(cases)

    H_initial = calculate_entropy(initial_case_probs)

    choice_probs = calculate_choice_probs(
        question_data['probs'], initial_case_probs)

    H_posterior = calculate_posterior_entropy(
        question_data['probs'], initial_case_probs, choice_probs)

    information_gain = H_initial - H_posterior
    return information_gain


# Define the question and probabilities using dictionaries for clarity
question_data = {
    'question': '赤いですか？',
    'probs': {
        'りんご': {'はい': 0.7, '多分はい': 0.2, 'わからない': 0.05, '多分いいえ': 0.03, 'いいえ': 0.02},
        'ばなな': {'はい': 0.0, '多分はい': 0.1, 'わからない': 0.2, '多分いいえ': 0.3, 'いいえ': 0.4},
        'スイカ': {'はい': 0.5, '多分はい': 0.1, 'わからない': 0.2, '多分いいえ': 0.1, 'いいえ': 0.1}
    }
}

question_data2 = {
    'question': '種の色は黒ですか？',
    'probs': {
        'りんご': {'はい': 0.7, '多分はい': 0.2, 'わからない': 0.05, '多分いいえ': 0.03, 'いいえ': 0.02},
        'スイカ': {'はい': 0.8, '多分はい': 0.1, 'わからない': 0.05, '多分いいえ': 0.05, 'いいえ': 0.0}
    }
}

# Calculate and print the information gain
info_gain = calculate_information_gain(question_data)
print(f"Information Gain: {info_gain}")

Information Gain: 0.4626097187381275
