# 💡 MosaicPi_Guide: **"Linear Algebra in MosaicPi"**

> All code and examples are shared to help researchers, students, and engineers understand the reasoning behind DDDA — and to make it easy to apply dimensional analysis to your own data.  
> This notebook serves as an entry-level guide for teaching, validating physical models, and enabling domain-specific knowledge engineering through data-driven dimensional reasoning.

---

## 🎯 What You'll Learn

**MosaicPi中的线性代数应用**

This notebook introduces the **fundamental concepts of linear algebra** that are widely used in applied mathematics, data science, physics, and engineering. The focus is on building an intuitive understanding alongside practical computations using NumPy.

1. **物理模型，隐函数，流形**  
   Understand why we reduce variables and how dimensional consistency enables model generalization.

2. **变量组合**  
   Encode physical units of input quantities using base units and build the D-matrix.

3. **变量组合评估**  
   Discover dimensionless groups by solving linear algebraic equations on the D-matrix.

4. **显式化策略可视化**  
   Learn to assess whether derived groups make physical and computational sense.

5. **不确定性定量化**  
   Set the stage for further steps in the DDDA pipeline including Pi-group selection, uncertainty quantification, and regime detection.

---

## 👤 Author

- **Name**: Jiashun Pang  
- **Created**: August 2025  
- **Affiliation**: MosaicPi, open research notebook  
- **Notebook Focus**:  
  A hands-on exploration of dimensional analysis — from aggregated raw quantities to symbolic Pi-group discovery and preparation for downstream DDDA tasks.

---

📌 *This notebook is designed to be accessible for learners new to dimensional analysis, while also laying the foundation for advanced applications in the full MosaicPi pipeline.*

---

# 8. 拓展主题（选学）

## 8.1 QR 分解：数值解线性系统与最小二乘

* **定义**：$A\in\mathbb{R}^{m\times n}\ (m\ge n)$，$A=QR$，$Q^\top Q=I$，$R$ 上三角。
* **算法**：经典/改进 Gram–Schmidt（CGS/MGS）、Householder 反射（推荐，稳健）、Givens 旋转（稀疏/逐元素消元）。
* **应用**：

  * 过约束最小二乘：解 $Ax\approx b$ → $Rx=Q^\top b$ 回代。
  * 条件数友好：避免正规方程 $A^\top A$ 的条件数平方。
* **与第 6/7 章连接**：最小二乘的数值主力；相对 SVD 更快但略逊稳健；配合条件数与秩判定使用。
* **注意**：列主元/列重排（Rank-Revealing QR, RRQR）可做近似秩判定与变量选择（连到 PCA/变量筛选）。

## 8.2 LU 分解：高效解方程组（多右端）

* **定义**：经置换 $P$ 后 $PA=LU$，$L$ 下三角、$U$ 上三角；常用 **部分主元**（partial pivoting）。
* **应用**：

  * 重复求解 $Ax=b_k$（多 RHS）时一次分解多次回代最高效。
  * 稀疏问题：稀疏 LU（需要填充控制与重排序）。
* **与第 7 章连接**：稳定性依赖主元策略；病态问题需配合缩放/预处理或改走 QR/SVD。
* **注意**：正规方程不建议用 LU；对称正定矩阵优先用 **Cholesky**（$A=LL^\top$）。

## 8.3 Schur 分解：特征值稳定计算的骨干

* **复 Schur**：$A=Q\,T\,Q^*$，$Q$ 酉，$T$ 上三角（对角即特征值）。
* **实 Schur**：$A=Q\,T\,Q^\top$，$T$ 为准上三角（含 $2\times2$ 实块代表复共轭对）。
* **算法**：Hessenberg 约化 + QR 迭代（隐式移位）。
* **应用**：

  * 光谱计算的数值稳健基石；后续可做不变子空间、稳定性边界、矩阵函数 $f(A)$（在 Schur 形式上更安全）。
* **与第 4/5/7 章连接**：

  * 对称/正规矩阵：Schur 退化为正交/酉对角化（回到谱定理）。
  * 稳定性分析：比“只看特征值”更安全（非正规矩阵用伪谱/子空间角度）。
* **注意**：Schur 给的是**相似上三角**，非对角；但足以稳定读谱与构造 $f(A)$。

## 8.4 张量分解（SVD 的高维推广）：高维数据建模

* **对象**：$\mathcal{X}\in\mathbb{R}^{I_1\times I_2\times\cdots\times I_N}$（$N\ge3$）。
* **常见模型**：

  * **CP/Parafac**：$\mathcal{X}\approx \sum_{r=1}^R a^{(1)}_r\circ a^{(2)}_r\circ\cdots\circ a^{(N)}_r$（秩 $R$）。
  * **Tucker/HOSVD**：$\mathcal{X}\approx \mathcal{G}\times_1 U^{(1)}\times_2\cdots\times_N U^{(N)}$（多模秩）。
  * **TT（Tensor Train）/MPS**：线性链结构，适合超高维缩放。
* **算法**：ALS（交替最小二乘）、HOSVD/HOOI、随机化张量分解、正则/稀疏/非负约束（NCP/NN-Tucker）。
* **应用**：

  * 多通道实验/传感（时间×空间×频段）、CFD 三维时空场压缩、视频/图像序列去噪、变量/模态发现。
  * 作为 PCA 的多维推广：保留各模态结构（比把张量展平再做 SVD 更保真）。
* **与第 5/6/7 章连接**：

  * PCA ⇢ HOSVD（各模态 SVD）；
  * 低秩近似与去噪（对应第 5 章低秩重构）；
  * 条件数/病态：CP 可能退化，需正则化与秩选择（交叉验证、信息准则）。
* **注意**：

  * **秩选择**是核心难点；CP 可能出现“退化/发散”需加惩罚或约束；数据缩放与缺失值需稳健化（Robust/Impute）。

---

## 8.5 何时用谁：快速决策表

| 任务           | 首选               | 备选/说明                          |
| ------------ | ---------------- | ------------------------------ |
| 过约束最小二乘      | **QR**           | SVD（病态/稳健），RRQR（秩&变量筛）         |
| 多 RHS 线性方程   | **LU/Cholesky**  | 预处理共轭梯度（SPD 稀疏大规模）             |
| 稳定算特征值/不变子空间 | **Schur（QR 迭代）** | Lanczos/Arnoldi（大型稀疏），对称情形用谱分解 |
| 高维数据降维/去噪    | **HOSVD/HOOI**   | CP（可解释）、TT（超高维）                |

---

## 8.6 实践清单（与前文管线的衔接）

1. **缩放与无量纲化**（承第 5/6/7 章）：先统一尺度再分解。
2. **秩/维度选择**：碎石图、累计解释方差、CV、信息准则（AIC/BIC），张量用多模能量与重构误差。
3. **稳定性**：优先 QR/SVD；特征问题走 Schur；张量分解加正则与早停。
4. **结果解释**：

   * QR/RRQR → 变量子集与秩；
   * Schur/谱 → 稳定模式/不变子空间；
   * 张量分解 → 跨模态主方向与可解释因子。
5. **报告指标**：重构误差、条件数/有效秩、残差统计、正则/超参、收敛曲线。

---

## 8.7 常见坑与对策

* 正规方程导致条件数平方 → 用 QR/SVD。
* LU 无主元不稳 → 用部分/完全主元；SPD 用 Cholesky。
* 非正规矩阵只看特征值误判稳定性 → 辅以 Schur/伪谱与子空间角度。
* CP 秩选过大出现退化 → 加 $\ell_2/\ell_1$ 正则、非负约束、早停或改 Tucker/TT。

---

