# 💡 MosaicPi_Guide: **"Linear Algebra in MosaicPi"**

> All code and examples are shared to help researchers, students, and engineers understand the reasoning behind DDDA — and to make it easy to apply dimensional analysis to your own data.  
> This notebook serves as an entry-level guide for teaching, validating physical models, and enabling domain-specific knowledge engineering through data-driven dimensional reasoning.

---

## 🎯 What You'll Learn

**MosaicPi中的线性代数应用**

This notebook introduces the **fundamental concepts of linear algebra** that are widely used in applied mathematics, data science, physics, and engineering. The focus is on building an intuitive understanding alongside practical computations using NumPy.

1. **物理模型，隐函数，流形**  
   Understand why we reduce variables and how dimensional consistency enables model generalization.

2. **变量组合**  
   Encode physical units of input quantities using base units and build the D-matrix.

3. **变量组合评估**  
   Discover dimensionless groups by solving linear algebraic equations on the D-matrix.

4. **显式化策略可视化**  
   Learn to assess whether derived groups make physical and computational sense.

5. **不确定性定量化**  
   Set the stage for further steps in the DDDA pipeline including Pi-group selection, uncertainty quantification, and regime detection.

---

## 👤 Author

- **Name**: Jiashun Pang  
- **Created**: August 2025  
- **Affiliation**: MosaicPi, open research notebook  
- **Notebook Focus**:  
  A hands-on exploration of dimensional analysis — from aggregated raw quantities to symbolic Pi-group discovery and preparation for downstream DDDA tasks.

---

📌 *This notebook is designed to be accessible for learners new to dimensional analysis, while also laying the foundation for advanced applications in the full MosaicPi pipeline.*

---

# 3. Eigenvalues and Eigenvectors

## (1) Definition

* **Eigenvalue problem**:

  $$
  A v = \lambda v,\quad v \neq 0
  $$

  * $v$: eigenvector
  * $\lambda$: eigenvalue

* Interpretation: applying $A$ to vector $v$ only scales it (no rotation).

“本征”这个词来自物理和数学里的一个翻译习惯，对应的英文是 **eigen-**（源自德语 *eigen*，意思是“自己的、固有的、intrinsic”）。

---

### 常见用法

* **本征值** → **eigenvalue**
* **本征向量** → **eigenvector**
* **本征频率** → **eigenfrequency**（系统固有的振动频率）
* **本征态** → **eigenstate**（量子力学里，一个哈密顿算符的本征态）

---

### 直观理解

“本征”强调的是：

* 这是系统/矩阵 **自身固有的性质**，不依赖于外部坐标的选择。
* 在这些方向/状态下，系统的表现是“纯粹的”，不会被额外混合或旋转。

比如：

* 在结构力学里，梁的 **本征模态**（eigenmode）就是它天然会振动的模式。
* 在矩阵分解里，特征向量（本征向量）就是矩阵天然的、不被扭曲的方向。

---

## (2) Characteristic Equation

* Solve eigenvalues from

  $$
  \det(A - \lambda I) = 0
  $$
* Eigenvectors come from solving
  $(A - \lambda I)v = 0$.

---

**特征方程的由来**

特征值定义是：

$$
A\mathbf{v} = \lambda \mathbf{v}, \quad \mathbf{v} \neq 0
$$

等价于：

$$
(A - \lambda I)\mathbf{v} = 0
$$

想要有非零解 $\mathbf{v}$，就必须满足：

$$
\det(A - \lambda I) = 0
$$

所以 **特征方程** $\det(A - \lambda I) = 0$ 的意义是：
找到那些让 $A - \lambda I$ **不可逆（singular）** 的 $\lambda$，也就是存在“零化”的方向。

---

**直观理解**

* **det=0 的含义**
  行列式为 0，说明这个线性变换“把空间压扁了”，至少有一个方向上的体积被压缩到零（线性相关）。
  所以在这个方向上，矩阵 $A - \lambda I$ 不能把所有向量映射开，它让某些非零向量 $\mathbf{v}$ 变成了零。

* **$A - \lambda I$ 的含义**
  $A$ 表示原来的变换，$\lambda I$ 表示在所有方向上做均匀拉伸（或压缩）。
  两者相减 = 看看在某个候选“均匀拉伸强度” $\lambda$ 下，是否有某些方向能完全抵消（让向量变为 0）。

---

**更形象的说法**

你说的“$\lambda I$ 抵消 A 的拉伸”已经很接近，但可以更精确地说成：

* 我们在试探：是否存在某个方向 $\mathbf{v}$，使得矩阵 $A$ 的作用恰好等于在该方向上的均匀拉伸 $\lambda I$ 的作用。
* 如果有，那么在这个方向上，$A$ 和 $\lambda I$ **抵消**，于是 $(A - \lambda I)\mathbf{v}=0$。
* det=0 就是说：这种“抵消”真的存在，系统有解。

---

**总结（更标准的表述）**

* $\det(A-\lambda I)=0$ 并不是说“总体矩阵没有变化”，而是说：
  **在某个方向上，矩阵 $A$ 的作用和纯粹的拉伸 $\lambda$ 完全一致，于是相减后让该方向消失（零化）。**
* 所以：

  * 特征值 = 这个方向上的拉伸强度 $\lambda$
  * 特征向量 = 在这个方向上被零化的非零解 $\mathbf{v}$

---

## (3) Properties of Eigenvalues and Eigenvectors

* $A\in \mathbb{R}^{n\times n}$ has at most $n$ eigenvalues.
* Eigenvalues can be real or complex.
* **Trace** and **determinant**:

  * $\mathrm{tr}(A)=\sum \lambda_i$
  * $\det(A)=\prod \lambda_i$
* Multiplicities: algebraic (from polynomial) vs. geometric (dimension of eigenspace).

---
### 1. **数量限制**

* 对于一个 $A \in \mathbb{R}^{n \times n}$，它的 **特征多项式** 是：

  $$
  p(\lambda) = \det(A - \lambda I)
  $$

  这是一个 $n$ 次多项式。
* 根据代数基本定理，它最多有 **n 个根**（计重数），即 **至多 n 个特征值**。

👉 所以在一个 $n \times n$ 矩阵中，你不会得到超过 $n$ 个特征值。

---

### 2. **实数与复数特征值**

* 如果 $A$ 是实矩阵，它的特征值可以是 **实数**，也可以是 **复数共轭对**。
* 特殊情况：

  * 对称矩阵（symmetric matrix）：特征值一定是实数。
  * 正交矩阵（orthogonal matrix）：特征值模长为 1，可能是复数（例如旋转矩阵，特征值在单位圆上）。

👉 物理上：

* 实特征值 → “拉伸/压缩”方向。
* 复特征值 → “旋转+缩放”模式。

---

### 3. **迹 (Trace) 和 行列式 (Determinant)**

* **迹**：

  $$
  \mathrm{tr}(A) = \sum_{i=1}^n \lambda_i
  $$

  矩阵对角线元素的和 = 特征值的代数和。

  * 几何意义：矩阵对体积的“总伸缩率之和”。
  * 物理例子：速度梯度张量的迹就是散度 $\nabla \cdot u$。

* **行列式**：

  $$
  \det(A) = \prod_{i=1}^n \lambda_i
  $$

  特征值的乘积等于行列式。

  * 几何意义：矩阵对体积的整体缩放比例。
  * 例子：如果 $\det(A)=0$，说明至少有一个特征值是 0 → 存在“压扁”的方向。

👉 直观比喻：

* 迹 = 系统的“总能量/拉伸总和”。
* 行列式 = 系统的“总体积缩放因子”。

---

### 4. **代数重数 vs. 几何重数**

* **代数重数 (algebraic multiplicity)**

  * 某个特征值 $\lambda$ 在特征多项式中的根的次数。
  * 比如 $(\lambda-2)^3$，说明特征值 2 的代数重数是 3。

* **几何重数 (geometric multiplicity)**

  * 对应于特征空间的维度，即有多少条线性无关的特征向量。

* 性质：

  $$
  1 \leq \text{geometric multiplicity} \leq \text{algebraic multiplicity}
  $$

👉 举例：

* 对角矩阵 $\begin{bmatrix}2&0\\0&2\end{bmatrix}$：特征值 2，代数重数=2，几何重数=2（有两个独立方向）。
* 缺陷矩阵 $\begin{bmatrix}2&1\\0&2\end{bmatrix}$：特征值 2，代数重数=2，但几何重数=1（只有一个方向），不可对角化。

---

### ✅ 总结表

| 性质       | 数学表述                              | 直观解释        | 物理类比           |
| -------- | --------------------------------- | ----------- | -------------- |
| **数量**   | 至多 n 个特征值                         | 多项式根的个数     | 系统最多有 n 个“主模式” |
| **实/复**  | 实矩阵 → 实数或复数对                      | 伸缩 or n旋转+伸缩 | 主应力 vs 振荡模式    |
| **迹**    | $\mathrm{tr}(A) = \sum \lambda_i$ | 总体伸缩率       | 散度、能量守恒        |
| **行列式**  | $\det(A) = \prod \lambda_i$       | 体积缩放因子      | 系统整体放大/压缩      |
| **代数重数** | 根的次数                              | 出现多少次       | 理论上的自由度        |
| **几何重数** | 特征空间维数                            | 多少个独立方向     | 实际的自由度         |

---


## (4) Diagonalization（对角化）

* If $A$ has $n$ linearly independent eigenvectors:

  $$
  A = P \Lambda P^{-1}
  $$

  * $P$: matrix of eigenvectors.
  * $\Lambda = \mathrm{diag}(\lambda_1,\ldots,\lambda_n)$.
* Not all matrices are diagonalizable.

---
### A. 定义与形式

若 $A\in\mathbb{F}^{n\times n}$（$\mathbb{F}=\mathbb{R}$ 或 $\mathbb{C}$）存在 **$n$ 个线性无关的特征向量**，则

$$
A = P\,\Lambda\,P^{-1},
$$

其中 $P=[v_1\ \cdots\ v_n]$ 为特征向量矩阵，$\Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n)$ 为特征值组成的对角矩阵。
这时称 $A$ **可对角化（diagonalizable）**。

---

### B. 判定与等价条件（核心结论）

1. **几何/代数重数判据**（在 $\mathbb{C}$ 上）：
   对每个特征值 $\lambda$，几何重数 $g_\lambda=\dim\ker(A-\lambda I)$ 与代数重数 $a_\lambda$ 满足

   $$
   1\le g_\lambda\le a_\lambda.
   $$

   $A$ 可对角化 ⇔ **对每个 $\lambda$，都有 $g_\lambda=a_\lambda$**，且所有特征值的几何重数之和为 $n$。

2. **极小多项式判据**：
   在代数闭域（如 $\mathbb{C}$）上，$A$ 可对角化 ⇔ **极小多项式无重根**。

3. **特征值互异的充分性**：
   若 $A$ 的 $n$ 个特征值两两不同（互异），则 $A$ 必可对角化。

4. **实/复域区别**：

   * 在 $\mathbb{R}$ 上要求“实特征值+实特征向量”才可在 **实域** 对角化；若出现复共轭对，只能在 $\mathbb{C}$ 上对角化，或在 $\mathbb{R}$ 上得到 $2\times2$ 的旋转-缩放块。
   * **实对称矩阵**：必存在正交矩阵 $Q$ 使 $A=Q\Lambda Q^\top$（**光谱定理**，“正交可对角化”）。
   * **复正规矩阵**（$AA^*=A^*A$）：存在酉矩阵 $U$ 使 $A=U\Lambda U^*$（酉可对角化）。

5. **不可对角化（缺陷）**：
   若某个 $\lambda$ 的 $g_\lambda<a_\lambda$，$A$ 不可对角化，只能相似于 **Jordan 形**，解/函数中会出现多项式因子（如 $t e^{\lambda t}$）。

---

### C. 与 Schur 分解、SVD 的关系（实用视角）

* **Schur 分解**（$\mathbb{C}$）：总能写成 $A=Q\,T\,Q^*$，$T$ 上三角、对角线是特征值；数值算法常走 Schur 路线，稳健但不一定对角。
* **SVD**：$A=U\Sigma V^*$ 适用于任意矩阵，$\Sigma$ 的奇异值与几何缩放有关，但与特征分解不同；当 $A$ 正定/对称时，SVD 与谱分解对齐。

---

### D. 直观/物理含义（一句话）

* **可对角化**：存在一组基，使 $A$ 在该基下只做 **独立方向的纯缩放**（无耦合）。
* **不可对角化**：存在不可消除的耦合（Jordan 链），导致解出现额外的多项式因子。

---

### E. 例子（对比）

1. 可对角化、重根但不缺陷：

$$
A=\begin{bmatrix}2&0\\0&2\end{bmatrix},\quad
p(\lambda)=(\lambda-2)^2,\ a_2=2,\ g_2=2 \Rightarrow \text{可对角化},\ A=I\cdot 2.
$$

2. 不可对角化（缺陷）：

$$
B=\begin{bmatrix}2&1\\0&2\end{bmatrix},\quad
p(\lambda)=(\lambda-2)^2,\ a_2=2,\ g_2=1 \Rightarrow \text{不可对角化},
$$

相似于 Jordan 块 $\begin{bmatrix}2&1\\0&2\end{bmatrix}$。

3. 实对称（正交可对角化）：

$$
C=\begin{bmatrix}3&1\\1&3\end{bmatrix}=Q\Lambda Q^\top,
$$

两特征值实且本征向量正交。

4. 旋转矩阵（在 $\mathbb{R}$ 上不可对角化）：

$$
R(\theta)=\begin{bmatrix}\cos\theta&-\sin\theta\\ \sin\theta&\cos\theta\end{bmatrix},
$$

在 $\mathbb{C}$ 上特征值 $e^{\pm i\theta}$ 可对角化；在 $\mathbb{R}$ 上只能化为 $2\times2$ 实块。

---

### F. 实战用途（公式层面）

* **矩阵函数**：若 $A=P\Lambda P^{-1}$，则

  $$
  f(A)=P\,f(\Lambda)\,P^{-1},\quad
  e^{At}=P\,e^{\Lambda t}\,P^{-1}.
  $$

  计算 $A^k, e^{At}, \sin A, \log A$ 等瞬间简化为对角上的标量函数。
* **模态分解/主方向**：力学中的主应力/模态、稳定性模态分解等，都直接受益于对角化（或至少谱分解）。

---

### G. 快速检查清单

* 求各 $\lambda$，算 $\dim\ker(A-\lambda I)$。若各 $\lambda$ 的几何重数之和为 $n$ → 可对角化。
* 若特征值互异 → 直接可对角化。
* 实对称/复正规 → 正交/酉可对角化。
* 若存在 $g_\lambda<a_\lambda$ → 不可对角化（需 Jordan）。

需要的话，我可以把这段整理成一页“速查卡”（含小练习与标准答案），放进你线代笔记的“(4) Diagonalization”小节。

---

## 从单个特征方程到对角化

对每个特征对 $(\lambda_i, v_i)$ 有

$$
A v_i=\lambda_i v_i .
$$

把 **全部 $n$ 个线性无关的右特征向量** 按列堆成矩阵

$$
P=\big[v_1\ \ v_2\ \ \cdots\ \ v_n\big],\qquad 
\Lambda=\mathrm{diag}(\lambda_1,\ldots,\lambda_n),
$$

则把上面 $n$ 条等式“并在一起”得到

$$
A P=\big[Av_1\ \cdots\ Av_n\big]
=\big[\lambda_1 v_1\ \cdots\ \lambda_n v_n\big]
= P\,\Lambda .
$$

若这些列向量线性无关，则 $P$ 可逆，于是

$$
A P=P\Lambda \ \Longrightarrow\ A=P\,\Lambda\,P^{-1}.
$$

> 这就是 $Av=\lambda v$ 与 $A=P\Lambda P^{-1}$ 的直接联系：
> **把所有特征方程按列拼起来就是 $AP=P\Lambda$，再右乘 $P^{-1}$ 就得到对角化式。**

---

## 角色对应

* $v$：单个右特征向量（列向量）。
* $P$：**右特征向量矩阵**，按列装着所有线性无关的 $v_i$。
* $\lambda$：单个特征值（标量）。
* $\Lambda$：**特征值对角矩阵**，把所有 $\lambda_i$ 放到对角线上。

顺序要一致：$P$ 的第 $j$ 列对应 $\Lambda$ 的第 $j$ 个对角元素。

---

## 与“左特征向量”的关系（更进一步）

设 $P^{-1}$ 的第 $i$ 行记为 $u_i^\top$，则有

$$
u_i^\top A=\lambda_i u_i^\top \quad(\text{左特征向量}),
$$

并可写成谱展开

$$
A=\sum_{i=1}^n \lambda_i\, v_i\,u_i^\top .
$$

对称/厄米情形下可取正交基，变为 $A=Q\Lambda Q^\top$ 或 $A=U\Lambda U^*$。

---

## 何时不行？

若凑不齐 $n$ 个线性无关的特征向量（某些特征值几何重数 $<$ 代数重数），则 $P$ 不可逆，$A$ 不可对角化，只能用 Jordan 形；但单个等式 $Av=\lambda v$ 依然成立于各特征子空间内。



## (5) Spectral Theorem (for symmetric matrices)

* If $A=A^T$:

  * All eigenvalues are real.
  * Eigenvectors can be chosen orthonormal.
  * Decomposition:

    $$
    A = Q \Lambda Q^T
    $$

    where $Q$ is orthogonal.

这一节是线代里“最有力量”的结论之一。我把**实对称矩阵的谱定理**展开成“结论—推论—几何/物理—实用公式—应用”五块，便于直接用在你的笔记与建模里。

---

## 结论（Spectral Theorem）

若 $A=A^\top\in\mathbb{R}^{n\times n}$，则：

* 全部特征值 $\lambda_i\in\mathbb{R}$；
* 存在一组**正交归一**的特征向量 $\{q_i\}_{i=1}^n$ 作为基；
* 因而

  $$
  A=Q\,\Lambda\,Q^\top,\qquad 
  Q=[q_1\ \cdots\ q_n]\text{ 为正交矩阵},\ \ \Lambda=\mathrm{diag}(\lambda_1,\dots,\lambda_n).
  $$
* 该分解在“特征子空间的选择+列的重新排列+向量符号”之外是唯一的（重根情形下，在该特征值的子空间内可任意选取正交基）。

> 复数情形完全平行：若 $A=A^*$（厄米），则 $A=U\Lambda U^*$，$\Lambda$ 实对角，$U$ 酉矩阵。

---

## 重要推论与判据

1. **正定/半正定判别**（看 $\lambda$）

* $A\succ0$（SPD）$\iff \lambda_i>0\ \forall i$；
* $A\succeq0$（SPSD）$\iff \lambda_i\ge 0\ \forall i$；
* $A$ 不定（indefinite）$\iff$ 既有正又有负的 $\lambda$。

2. **Rayleigh 商与极值**

$$
R_A(x)=\frac{x^\top A x}{x^\top x}\in[\lambda_{\min},\lambda_{\max}],
$$

且极值在对应的特征向量上取到（Courant–Fischer 极值表征）。

3. **二次型分解**

$$
x^\top A x=\sum_{i=1}^n \lambda_i\,(q_i^\top x)^2.
$$

这让“能量/应变能/方差”等一眼拆成沿本征方向的和。

4. **同时对角化（通俗版）**
   一组**两两对易**的实对称矩阵可以被同一个正交矩阵**同时对角化**（用于把耦合的二次型同时变成坐标轴方向的和）。

---

## 几何/物理直观

* **几何**：$A$ 对空间的作用可看作沿正交轴 $q_i$ 的纯拉伸/压缩 $\lambda_i$。
  若 $A\succ0$，等值面 $x^\top A x = 1$ 是以 $q_i$ 为主轴的椭球，半轴长度 $1/\sqrt{\lambda_i}$。
* **物理**（典型例子）：

  * 主应力/主应变：$\sigma=Q\Lambda Q^\top$；
  * 模态分析：$K\phi_i=\omega_i^2 M\phi_i$（广义特征问题可化为标准对称问题）；
  * PCA：协方差矩阵 $C$ 的谱分解给出主成分方向与方差大小。

---

## 实用公式与技巧

1. **矩阵函数变得简单**

$$
f(A)=Q\,f(\Lambda)\,Q^\top \quad\Rightarrow\quad
A^k=Q\Lambda^kQ^\top,\ \ e^{At}=Qe^{\Lambda t}Q^\top,\ \ A^{1/2}=Q\Lambda^{1/2}Q^\top\ (\text{若 }A\succeq0).
$$

2. **谱范数（对称情形）**
   $\|A\|_2=\max_i|\lambda_i|$。

3. **与 SVD 的关系**
   对称 $A$ 的 SVD 与谱分解对齐：

* 若 $A\succeq0$，其奇异值 = 特征值，且 $U=V=Q$；
* 一般对称 $A$ 的奇异值 = $|\lambda_i|$，左右奇异向量与本征向量一致（ up to sign）。

4. **数值稳健小招**
   实际计算前做对称化：$\tilde A=\tfrac12(A+A^\top)$；对称问题优先用对称特征算法（如对称 QR/Eigen）。

---

## 应用速览

* **PCA/降维**：最大方差方向 = 最大特征值对应的本征向量。
* **结构振动**：正交模态解耦，能量可分解为模态能之和。
* **图论/网络**：图拉普拉斯 $L$ 的谱用于聚类、扩散、连通性判定（$\lambda_2$ 为代数连通度）。
* **优化/牛顿法**：Hessian 的谱告诉你极值类型（正定→极小，负定→极大，不定→鞍点）。

---

### 小结

* 对称（或厄米）= “最好”的情况：**实谱 + 正交本征基 + 简洁的矩阵函数**。
* 这让二次型、能量、模态、稳定性等问题在本征坐标系下“各玩各的”，分析与计算都更透明高效。


## (6) Geometric Interpretation

* Eigenvectors: invariant directions under transformation.
* Eigenvalues: stretching/compressing factors along those directions.
* Example: rotation matrix vs. scaling matrix.

---

## (7) Applications

* Stability analysis (sign of eigenvalues).
* Quadratic forms optimization (Hessian eigenvalues).
* Graph theory (spectrum of adjacency/Laplacian matrices).
* Basis change and diagonalization in differential equations.

---

## (8) Positive Definite Matrices

![Positive definite / semidefinite / indefinite](src/img/definite.png)



* (8.1) Definition

For a symmetric matrix $M \in \mathbb{R}^{n\times n}$:

* **Positive definite (PD)**:

  $$
  x^T M x > 0,\quad \forall x \in \mathbb{R}^n,\ x\neq 0.
  $$
* **Positive semidefinite (PSD)**:

  $$
  x^T M x \ge 0,\quad \forall x \in \mathbb{R}^n.
  $$

If the quadratic form can take negative values for some $x$, the matrix is **indefinite**.

---

* (8.2) Eigenvalue Characterization

* Since $M$ is symmetric, it admits the spectral decomposition:

  $$
  M = Q \Lambda Q^T,\quad \Lambda = \mathrm{diag}(\lambda_1,\ldots,\lambda_n).
  $$
* Then:

  * $M$ is **positive definite** ⇔ all eigenvalues $\lambda_i > 0$.
  * $M$ is **positive semidefinite** ⇔ all eigenvalues $\lambda_i \ge 0$.
  * $M$ is **indefinite** ⇔ eigenvalues have mixed signs.

---

* (8.3) Geometric Interpretation

* The quadratic form $q(x) = x^T M x$ describes the “shape” induced by $M$.
* **Positive definite**: “bowl-shaped” surface → always curved upwards.
* **Positive semidefinite**: “flat bowl” → may have directions with zero curvature.
* **Indefinite**: “saddle-shaped” → some directions go up, others go down.

Example in $\mathbb{R}^2$:

* $M=\begin{bmatrix}2&0\\0&3\end{bmatrix}$ → PD.
* $M=\begin{bmatrix}1&0\\0&0\end{bmatrix}$ → PSD.
* $M=\begin{bmatrix}1&0\\0&-1\end{bmatrix}$ → Indefinite.

---

### (8.4) Importance and Applications

* **Stability**: Positive definite Hessian ⇒ local minimum in optimization.
* **Energy interpretation**: In physics and mechanics, $x^T M x$ often represents stored energy; PD ensures energy > 0.
* **Numerical methods**: $A^T A$ is always PSD, and PD if $A$ has full rank → crucial for SVD, least-squares, and condition number analysis.
* **Geometry**: Defines inner products and norms:

  $$
  \|x\|_M = \sqrt{x^T M x}.
  $$

---
