<a href="https://colab.research.google.com/github/BrianChuan/TAICA_AI-Text-and-Image/blob/main/%E5%8C%97%E7%A7%91%E5%A4%A7_111360205_%E5%AD%90%E5%9B%9B%E4%B9%99_%E8%AC%9D%E9%80%B2%E6%AC%8A_week3_SoftMax.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 認識 Softmax

這份 Colab 筆記本旨在幫助我們理解 Softmax 函式的特性，特別是它如何透過指數運算來「放大」最大值，從而產生「贏者通吃」的效果。這在機器學習中非常重要，常用於多類別分類問題的輸出層。

---

### 步驟 1：引入必要的套件

在開始之前，我們先載入幾個常用的 Python 套件。

In [None]:
%matplotlib inline
# 強制讓圖顯示在這個網頁，不再開新視窗

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from ipywidgets import interact, IntSlider, FloatSlider, Layout

## 讓colab繪圖可以顯示中文文字
> 從google drive讀取台北黑體的字體檔案，讓matplotlib繪圖時可以呈現中文文字。

In [None]:
#--------------------------------
# colab繪圖顯示繁體中文
#--------------------------------
import matplotlib
# 先下載台北黑體字型
!wget -O taipei_sans_tc_beta.ttf https://drive.google.com/uc?id=1eGAsTN1HBpJAkeVM57_C7ccp7hbgSz3_&export=download import matplotlib
# 新增字體
matplotlib.font_manager.fontManager.addfont('taipei_sans_tc_beta.ttf')
# 將 font-family 設為 Taipei Sans TC Beta
# 設定完後，之後的圖表都可以顯示中文了
matplotlib.rc('font', family='Taipei Sans TC Beta')

/bin/bash: line 1: import: command not found
--2025-09-15 13:16:47--  https://drive.google.com/uc?id=1eGAsTN1HBpJAkeVM57_C7ccp7hbgSz3_
Resolving drive.google.com (drive.google.com)... 74.125.203.139, 74.125.203.113, 74.125.203.138, ...
Connecting to drive.google.com (drive.google.com)|74.125.203.139|:443... connected.
HTTP request sent, awaiting response... 303 See Other
Location: https://drive.usercontent.google.com/download?id=1eGAsTN1HBpJAkeVM57_C7ccp7hbgSz3_ [following]
--2025-09-15 13:16:47--  https://drive.usercontent.google.com/download?id=1eGAsTN1HBpJAkeVM57_C7ccp7hbgSz3_
Resolving drive.usercontent.google.com (drive.usercontent.google.com)... 142.251.8.132, 2404:6800:4008:c15::84
Connecting to drive.usercontent.google.com (drive.usercontent.google.com)|142.251.8.132|:443... connected.
HTTP request sent, awaiting response... 200 OK
Length: 20659344 (20M) [application/octet-stream]
Saving to: ‘taipei_sans_tc_beta.ttf’


2025-09-15 13:16:49 (65.5 MB/s) - ‘taipei_sans_tc_beta.ttf’

### 步驟 2：建立 Softmax 函式
Softmax 函式的數學公式為：
$$ S(x_i) = \frac{e^{x_i}}{\sum_{j} e^{x_j}} $$
其中 $x_i$ 是輸入向量中的第 $i$ 個元素，$e$ 是自然對數的底數。

我們現在來撰寫這個函式。為了確保數值穩定性（避免數值溢位），我們會在計算指數前先減去輸入向量中的最大值。

In [None]:
def softmax(x):
    """
    計算 softmax 函式，並包含數值穩定性處理。

    Args:
        x (numpy.ndarray): 輸入的數值陣列。

    Returns:
        numpy.ndarray: 經過 softmax 運算後的結果。
    """
    # 數值穩定性處理：減去最大值以避免指數溢位
    e_x = np.exp(x - np.max(x))
    return e_x / e_x.sum()

### 3. 觀察 Softmax 的「贏者通吃」效果
現在，我們使用 ipython 的 interact 功能來建立一個互動式介面。你可以調整三個輸入數字的值，並即時觀察 Softmax 運算後的結果。

請注意觀察：

- 當某個數字明顯高於其他數字時，它在 Softmax 運算後的結果會變得非常接近 1。

- 即使數值之間的差異很小，Softmax 運算後，最大的數值所對應的結果也會被顯著放大。

In [None]:
def observe_softmax(value1, value2, value3):
    """
    觀察 softmax 運算結果的函式。

    Args:
        value1 (float): 輸入的第一個數字。
        value2 (float): 輸入的第二個數字。
        value3 (float): 輸入的第三個數字。
    """
    input_values = np.array([value1, value2, value3])
    softmax_result = softmax(input_values)

    # 顯示結果
    print(f"原始輸入： {input_values}")
    print(f"Softmax 結果： {softmax_result}")

    # 可視化結果
    labels = ['Value 1', 'Value 2', 'Value 3']
    plt.figure(figsize=(8, 5))
    plt.bar(labels, softmax_result)
    plt.title('Softmax 運算結果')
    plt.xlabel('數值')
    plt.ylabel('機率')
    plt.ylim(0, 1)
    plt.show()

interact(
    observe_softmax,
    value1=FloatSlider(min=-10, max=10, step=0.1, value=5, description='數值 1', layout=Layout()),
    value2=FloatSlider(min=-10, max=10, step=0.1, value=2, description='數值 2', layout=Layout()),
    value3=FloatSlider(min=-10, max=10, step=0.1, value=-1, description='數值 3', layout=Layout())
);

interactive(children=(FloatSlider(value=5.0, description='數值 1', max=10.0, min=-10.0), FloatSlider(value=2.0, …

### 4. 了解 Softmax 加入 溫度 (Temperature, t) 參數的用途與影響
`溫度(Temperature)` 是一個超參數，用於調整 Softmax 輸出分佈的「銳利度」(sharpness)。修改 Softmax 公式如下：
$$ S(x_i) = \frac{e^{x_i/t}}{\sum_{j} e^{x_j/t}} $$

- 當 t > 1 時：分佈會變得更平緩，所有類別的機率差異縮小，輸出的機率會更平均。

- 當 t < 1 時：分佈會變得更尖銳，「贏者通吃」的效果會被放大，最高分所對應的機率會更接近 1。

In [None]:
def observe_softmax_with_temperature(value1, value2, value3, t):
    """
    觀察包含溫度參數的 softmax 運算結果。

    Args:
        value1 (float): 輸入的第一個數字。
        value2 (float): 輸入的第二個數字。
        value3 (float): 輸入的第三個數字。
        t (float): Softmax 溫度參數。
    """
    # Softmax 函式，包含溫度 t
    def softmax_with_t(x, t):
        e_x = np.exp(x / t - np.max(x / t))
        return e_x / e_x.sum()

    input_values = np.array([value1, value2, value3])
    if t <= 0:
        print("溫度 t 必須大於 0。")
        return

    softmax_result = softmax_with_t(input_values, t)

    # 顯示結果
    print(f"原始輸入： {input_values}")
    print(f"溫度 (t)： {t}")
    print(f"Softmax 結果： {softmax_result}")

    # 可視化結果
    labels = ['Value 1', 'Value 2', 'Value 3']
    plt.figure(figsize=(8, 5))
    plt.bar(labels, softmax_result)
    plt.title(f'Softmax 運算結果 (Temperature = {t})')
    plt.xlabel('數值')
    plt.ylabel('機率')
    plt.ylim(0, 1)
    plt.show()

interact(
    observe_softmax_with_temperature,
    value1=FloatSlider(min=-10, max=10, step=0.1, value=5, description='數值 1', layout=Layout(width='auto')),
    value2=FloatSlider(min=-10, max=10, step=0.1, value=2, description='數值 2', layout=Layout(width='auto')),
    value3=FloatSlider(min=-10, max=10, step=0.1, value=-1, description='數值 3', layout=Layout(width='auto')),
    t=FloatSlider(min=0.1, max=5, step=0.1, value=1.0, description='溫度 t', layout=Layout(width='auto'))
);

interactive(children=(FloatSlider(value=5.0, description='數值 1', layout=Layout(width='auto'), max=10.0, min=-1…