# 01. Xavier Initialization

Xavier初期化（Glorot初期化）は、重みの初期値設定手法です。

## Xavier Uniform

$$
W \sim U\left[-\sqrt{\frac{6}{n_{in} + n_{out}}}, \sqrt{\frac{6}{n_{in} + n_{out}}}\right]
$$

## Xavier Normal

$$
W \sim N\left(0, \sqrt{\frac{2}{n_{in} + n_{out}}}\right)
$$

ここで:
- $n_{in}$: 入力ユニット数
- $n_{out}$: 出力ユニット数

## 目的

- 勾配の消失爆発を防ぐ
- 各層の出力分散を保つ

In [None]:
import numpy as np
from notebook_setup import test

@test("10_weight_initialization.test_01_xavier", filter_name="uniform")
def xavier_uniform(n_in: int, n_out: int) -> np.ndarray:
    """
    Xavier Uniform初期化
    
    Parameters
    ----------
    n_in  : int - 入力ユニット数
    n_out : int - 出力ユニット数
    
    Returns
    -------
    W : np.ndarray : shape (n_in, n_out)
    """
    W = None
    
    # ここにコードを記述
    # ---------------------------------------- #
    limit = np.sqrt(6.0 / (n_in + n_out))
    W = np.random.uniform(-limit, limit, size=(n_in, n_out)).astype(np.float32)
    # ---------------------------------------- #
    
    return W

In [None]:
import numpy as np
from notebook_setup import test

@test("10_weight_initialization.test_01_xavier", filter_name="normal")
def xavier_normal(n_in: int, n_out: int) -> np.ndarray:
    """
    Xavier Normal初期化
    
    Parameters
    ----------
    n_in  : int - 入力ユニット数
    n_out : int - 出力ユニット数
    
    Returns
    -------
    W : np.ndarray : shape (n_in, n_out)
    """
    W = None
    
    # ここにコードを記述
    # ---------------------------------------- #
    std = np.sqrt(2.0 / (n_in + n_out))
    W = np.random.normal(0, std, size=(n_in, n_out)).astype(np.float32)
    # ---------------------------------------- #
    
    return W