# Softmax 函數互動式示範 - 理解「贏者通吃」效應

By 油成

（心得於頁尾）

## 📚 什麼是 Softmax？

Softmax 是機器學習中非常重要的激活函數，特別在多分類問題中。它能將任意實數向量轉換為機率分布。

**數學公式：**
$$\text{softmax}(x_i) = \frac{e^{x_i}}{\sum_{j=1}^{n} e^{x_j}}$$

其中：
- $x_i$ 是輸入向量的第 i 個元素
- $e$ 是自然對數的底數（約 2.718）
- 分母是所有元素指數的總和

**重要特性：**
1. 輸出值都在 0 到 1 之間
2. 所有輸出值的總和等於 1
3. 具有「贏者通吃」效應：最大的輸入值會得到不成比例的大輸出

## 💻 第一步：安裝必要的套件

In [2]:
# 老師的四行固定引入
%matplotlib inline
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

In [3]:
from ipywidgets import interact, FloatSlider
import warnings
warnings.filterwarnings('ignore')

# 設置中文字體顯示
plt.rcParams['font.sans-serif'] = ['SimHei', 'DejaVu Sans']
plt.rcParams['axes.unicode_minus'] = False

print("✅ 套件安裝完成！")

✅ 套件安裝完成！


## 🔧 第二步：實作 Softmax 函數

In [4]:
def softmax(x):
    """
    計算 softmax 函數

    參數:
        x: 輸入向量 (list 或 numpy array)

    返回:
        softmax 輸出向量
    """
    x = np.array(x, dtype=float)

    # 數值穩定性技巧：減去最大值以避免溢出
    x_shifted = x - np.max(x)

    # 計算指數
    exp_x = np.exp(x_shifted)

    # 計算 softmax
    softmax_output = exp_x / np.sum(exp_x)

    return softmax_output

def print_softmax_analysis(inputs):
    """
    詳細分析 softmax 的計算過程
    """
    inputs = np.array(inputs, dtype=float)
    outputs = softmax(inputs)

    print(f"📊 Softmax 分析")
    print(f"{'='*50}")
    print(f"輸入值: {inputs}")
    print(f"輸出值: {outputs}")
    print(f"輸出總和: {np.sum(outputs):.6f}")
    print()

    # 顯示每個元素的詳細計算
    print("🔍 詳細計算過程：")
    x_shifted = inputs - np.max(inputs)
    exp_values = np.exp(x_shifted)
    sum_exp = np.sum(exp_values)

    for i, (orig, shifted, exp_val, prob) in enumerate(zip(inputs, x_shifted, exp_values, outputs)):
        print(f"元素 {i+1}: {orig:.2f} → e^{shifted:.2f} = {exp_val:.4f} → {exp_val:.4f}/{sum_exp:.4f} = {prob:.4f}")

    print()

    # 分析贏者通吃效應
    max_idx = np.argmax(inputs)
    max_input = inputs[max_idx]
    max_output = outputs[max_idx]

    print("🏆 贏者通吃分析：")
    print(f"最大輸入值: {max_input:.2f} (第 {max_idx+1} 個元素)")
    print(f"對應輸出機率: {max_output:.4f} ({max_output*100:.2f}%)")

    # 計算輸入差異 vs 輸出差異的放大效果
    if len(inputs) >= 2:
        sorted_indices = np.argsort(inputs)[::-1]  # 降序排列
        first_idx, second_idx = sorted_indices[0], sorted_indices[1]

        input_diff = inputs[first_idx] - inputs[second_idx]
        output_ratio = outputs[first_idx] / outputs[second_idx]

        print(f"輸入差異: {input_diff:.2f}")
        print(f"輸出比例: {output_ratio:.2f} (第一名是第二名的 {output_ratio:.2f} 倍)")

# 測試函數
test_inputs = [2.0, 1.0, 0.1]
print("🧪 測試 Softmax 函數：")
print_softmax_analysis(test_inputs)

🧪 測試 Softmax 函數：
📊 Softmax 分析
輸入值: [2.  1.  0.1]
輸出值: [0.65900114 0.24243297 0.09856589]
輸出總和: 1.000000

🔍 詳細計算過程：
元素 1: 2.00 → e^0.00 = 1.0000 → 1.0000/1.5174 = 0.6590
元素 2: 1.00 → e^-1.00 = 0.3679 → 0.3679/1.5174 = 0.2424
元素 3: 0.10 → e^-1.90 = 0.1496 → 0.1496/1.5174 = 0.0986

🏆 贏者通吃分析：
最大輸入值: 2.00 (第 1 個元素)
對應輸出機率: 0.6590 (65.90%)
輸入差異: 1.00
輸出比例: 2.72 (第一名是第二名的 2.72 倍)


# 心得

- By 油成
- 使用 AI: Claude Sonnet 4。

在操作的過程中，Claude 二話不說就開始為我生成程式碼，並且提到他會分段設計，並且加入詳細說明。隨後，回應包涵了程式特點，以及在 Canvas 裡建立了數段程式碼，由於回應的內容不像是下載 ipynb 的格式，我請他教我整理到 jupyter notebook。

實作程式碼的部分，Claude 定義了數個 function 來模組化功能，這很像我們應用數學系軟體實作的課程內容，將設計好的數學公式，轉換成程式內的運算式來執行。設計 softmax 計算過程的部分，設計了數個數學公式來表達元素與機率，並且用到降序排列，代表著找出哪個位置的數字最大（第一名），以及第二大 aka 第二名，比較這兩個數字 softmax 後的放大效應，貌似有點像極限裡的沒有上介的發散。

[🔗 檢視 Claude 對話長截圖](https://blog.imych.one/2025-fall-taica-generative-ai/assignment0916/claude-coding.png)