# CMA-ES 参数计算公式

## 1. **种群大小 ($\lambda$)**

$$
\lambda = 4 + \left\lfloor 3 \log(\text{dim}) \right\rfloor
$$

- 其中，$\text{dim}$ 是问题的维度（即决策变量的个数）。
- 该公式根据维度大小来选择种群的数量，随着维度增加，种群大小也会增大。

## 2. **步长 ($\sigma$)**

$$
\sigma = 0.3 \cdot \text{median}(x_{\text{range}}^{(2)} - x_{\text{range}}^{(1)})
$$

- 其中，$x_{\text{range}}$ 是决策变量的范围，$\text{median}(x_{\text{range}}^{(2)} - x_{\text{range}}^{(1)})$ 计算每个维度的范围的中位数。
- 步长 $\sigma$ 设置为该中位数的 30%，这帮助控制搜索的步幅。

## 3. **父代数量 ($\mu$)**

$$
\mu = \left\lfloor \frac{\lambda}{2} \right\rfloor
$$

- $\mu$ 是每代用来生成新解的父代解的数量，通常是种群大小的一半。

## 4. **选择权重 ($w_i$)**

$$
w_i = \log\left( \mu + \frac{1}{2} \right) - \log(i), \quad i = 1, 2, \dots, \mu
$$
$$
\text{weights} = \frac{w}{\sum w}
$$

- 这里 $w_i$ 是父代解 $i$ 的对数权重，较好的解会获得更高的权重。
- 归一化后，所有权重之和为 1。

## 5. **有效选择数量 ($\mu_{\text{eff}}$)**

$$
\mu_{\text{eff}} = \frac{\left( \sum_{i=1}^{\mu} w_i \right)^2}{\sum_{i=1}^{\mu} w_i^2}
$$

- $\mu_{\text{eff}}$ 是有效选择数量，反映了选择的有效性。较高的 $\mu_{\text{eff}}$ 表示有效的父代解更多。

## 6. **进化路径更新常数 ($c_{\text{c}}$)**

$$
c_{\text{c}} = \frac{4 + \frac{\mu_{\text{eff}}}{\text{dim}}}{\text{dim} + 4 + \frac{2 \mu_{\text{eff}}}{\text{dim}}}
$$

- 该常数控制了进化路径更新的速度。较高的 $c_{\text{c}}$ 表示进化路径的更新对搜索过程的影响更大。

## 7. **协方差更新常数 ($c_{\text{s}}$)**

$$
c_{\text{s}} = \frac{\mu_{\text{eff}} + 2}{\text{dim} + \mu_{\text{eff}} + 5}
$$

- $c_{\text{s}}$ 控制协方差矩阵的更新频率，较高的值使得更新更频繁。

## 8. **学习率 ($c_1$ 和 $c_{\mu}$)**

$$
c_1 = \frac{2}{(\text{dim} + 1.3)^2 + \mu_{\text{eff}}}
$$

$$
c_{\mu} = \min\left( 1 - c_1, \frac{2 \left( \mu_{\text{eff}} - 2 + \frac{1}{\mu_{\text{eff}}} \right)}{(\text{dim} + 2)^2 + \mu_{\text{eff}}} \right)
$$

- $c_1$ 是更新协方差矩阵时的学习率。
- $c_{\mu}$ 是加权平均的学习率，控制协方差矩阵的更新平滑度。

## 9. **步长调整参数 ($\text{damps}$)**

$$
\text{damps} = 1 + 2 \cdot \max\left(0, \sqrt{\frac{\mu_{\text{eff}} - 1}{\text{dim} + 1}} - 1 \right) + c_{\text{s}}
$$

- $\text{damps}$ 是步长调整因子，根据父代解的质量动态调整步长。

## 10. **理想收敛路径长度 ($\chi_N$)**

$$
\chi_N = \sqrt{\text{dim}} \left( 1 - \frac{1}{4 \cdot \text{dim}} + \frac{1}{21 \cdot \text{dim}^2} \right)
$$

- $\chi_N$ 是理想的收敛路径长度，表示理想情况下，解从初始位置收敛到最优解所需的路径长度。

## 11. **进化路径和协方差矩阵初始化**

- **进化路径**：初始化为零向量：

$$
\mathbf{p}_c = \mathbf{0}
$$

$$
\mathbf{p}_s = \mathbf{0}
$$

- **协方差矩阵**：初始化为单位矩阵：

$$
\mathbf{B} = I
$$

$$
\mathbf{D} = \mathbf{1}
$$

$$
\mathbf{C} = \mathbf{B} \cdot \text{diag}(\mathbf{D}^2) \cdot \mathbf{B}^T
$$

$$
\mathbf{C}^{-1/2} = \mathbf{B} \cdot \text{diag}(\mathbf{D}^{-1}) \cdot \mathbf{B}^T
$$

## 12. **均值初始化 ($\mathbf{x}_{\text{mean}}$)**

$$
\mathbf{x}_{\text{mean}} = \left( x_{\text{range}}^{(2)} - x_{\text{range}}^{(1)} \right) \cdot \text{rand}(1, \text{dim}) + x_{\text{range}}^{(1)}
$$

- $\mathbf{x}_{\text{mean}}$ 是初始均值，它在决策变量的范围内随机初始化。

## 13. **缩放因子 ($\gamma_y$)**

$$
\gamma_y = \sqrt{\text{dim}} + \frac{2 \cdot \text{dim}}{\text{dim} + 2}
$$

- $\gamma_y$ 是缩放因子，调整步长的适应性，帮助算法根据问题的维度缩放搜索步长。

## 14. **最大步长变化限制 ($\Delta \sigma_{\text{max}}$)**

$$
\Delta \sigma_{\text{max}} = 1
$$

- $\Delta \sigma_{\text{max}}$ 是步长变化的最大限制，用于控制步长的变化幅度。
