<a href="https://colab.research.google.com/github/wcliao1962/2025_DL/blob/master/Softmax.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

**Softmax 函數** 是一種常用的激活函數，通常用於多分類問題的最後一層。它將輸入的向量轉換為一個概率分佈，使得每個元素的值在 0 到 1 之間，並且所有元素的總和為 1。

---

### **Softmax 函數的定義**
對於一個輸入向量 $ z = [z_1, z_2, \dots, z_n] $，Softmax 函數的計算公式如下：

$$
\text{Softmax}(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{n} e^{z_j}}
$$

其中：
- $ z_i $ 是輸入向量的第 $ i $ 個元素。
- $ e^{z_i} $ 是 $ z_i $ 的指數。
- $ \sum_{j=1}^{n} e^{z_j} $ 是所有元素的指數之和。

---

### **Softmax 的 Python 實現**
以下是 Softmax 函數的 Python 實現：



In [None]:
import numpy as np

def softmax(z):
    # 避免數值溢出：減去最大值
    exp_z = np.exp(z - np.max(z, axis=-1, keepdims=True))
    return exp_z / np.sum(exp_z, axis=-1, keepdims=True)

---

### **Softmax 的計算示例**
假設輸入向量為 $ z = [2.0, 1.0, 0.1] $，我們來計算 Softmax 的輸出。

1. 計算指數：
   $
   e^{2.0} = 7.389, \quad e^{1.0} = 2.718, \quad e^{0.1} = 1.105
   $

2. 計算指數之和：
   $
   7.389 + 2.718 + 1.105 = 11.212
   $

3. 計算 Softmax：
   $
   \text{Softmax}(z_1) = \frac{7.389}{11.212} \approx 0.659
   $
   $
   \text{Softmax}(z_2) = \frac{2.718}{11.212} \approx 0.242
   $
   $
   \text{Softmax}(z_3) = \frac{1.105}{11.212} \approx 0.099
   $

最終輸出為：
$
\text{Softmax}(z) = [0.659, 0.242, 0.099]
$

---

### **Softmax 的性質**
1. **輸出是概率分佈**：
   - 每個元素的值在 0 到 1 之間。
   - 所有元素的總和為 1。

2. **放大差異**：
   - Softmax 會放大輸入向量中的較大值，使其對應的概率更高。

3. **數值穩定性**：
   - 在實現時，通常會減去輸入向量中的最大值（`z - max(z)`），以避免指數運算時的數值溢出。

---

### **批次輸入的 Softmax**
如果輸入是一個批次的多個向量（例如形狀為 `(batch_size, n)` 的矩陣），Softmax 會對每個向量獨立計算。

例如：
```python
z = np.array([[2.0, 1.0, 0.1],
              [1.0, 2.0, 0.1]])  # 形狀 (2, 3)

softmax(z)
```
輸出：
```
array([[0.659, 0.242, 0.099],
       [0.242, 0.659, 0.099]])
```

---

### **總結**
Softmax 函數是深度學習中常用的激活函數，特別適用於多分類問題。它的輸出是一個概率分佈，可以直觀地解釋為每個類別的概率。如果你有其他問題，歡迎隨時問我！😊

In [None]:
z = np.array([[2.0, 1.0, 0.1],
              [1.0, 2.0, 0.1]])  # 形狀 (2, 3)

softmax(z)

array([[0.65900114, 0.24243297, 0.09856589],
       [0.24243297, 0.65900114, 0.09856589]])