# Norm
Yu Jingyao, 1/13/2026

In [2]:
import torch

# 范数
在机器学习和数据分析中，最常用的是 $L_p$ 范数，其通用公式为：
$$ \|x\|_p = \left( \sum_{i=1}^n |x_i|^p \right)^{\frac{1}{p}} $$
#### **$L_1$ 范数（曼哈顿距离 / Lasso）**
*   **定义**：向量中所有元素绝对值之和。
    $$ \|x\|_1 = \sum |x_i| $$
*   **几何直观**：在城市街区中，从一个路口走到另一个路口，只能横着走或竖着走的总距离。
*   **应用**：
    *   **Lasso 回归**：作为正则化项，容易产生**稀疏解**（即让许多特征的权重变为0），常用于特征选择。

#### **$L_2$ 范数（欧几里得距离 / Ridge）**
*   **定义**：也就是我们最熟悉的“直线距离”，元素的平方和开根号。
    $$ \|x\|_2 = \sqrt{\sum x_i^2} $$
*   **几何直观**：两点之间拉一根绳子的长度。
*   **应用**：
    *   **Ridge 回归（岭回归）**：作为正则化项，防止过拟合。它倾向于让参数变小，但不会轻易变为0。

#### **$L_\infty$ 范数（最大范数）**
*   **定义**：向量中绝对值最大的那个元素的绝对值。
    $$ \|x\|_\infty = \max(|x_i|) $$
*   **意义**：衡量向量中“最极端”的那个分量。

In [6]:
torch.manual_seed(42)
a = torch.rand(3,2)
b = torch.rand(3,2)

print(a,b)

print(torch.dist(a, b, p=0)) # 非零元素个数
print(torch.dist(a, b, p=1)) 
print(torch.dist(a, b, p=2))

print(torch.norm(a)) # 默认p=2，求2范数
print(torch.norm(a, p=5))
print(torch.norm(a, p='fro')) # 核范数，即奇异值之和



tensor([[0.8823, 0.9150],
        [0.3829, 0.9593],
        [0.3904, 0.6009]]) tensor([[0.2566, 0.7936],
        [0.9408, 0.1332],
        [0.9346, 0.5936]])
tensor(6.)
tensor(2.6826)
tensor(1.3023)
tensor(1.7877)
tensor(1.1582)
tensor(1.7877)
