## 1. Distance Metrics

#### 1. 距离的分类：
- **欧氏距离 (Euclidean Distance)**: 最常用的距离度量，计算两点之间的直线距离。适用于连续数值数据。
- **曼哈顿距离 (Manhattan Distance)**: 计算两点在各个维度上的绝对差值之和。适用于网格状路径或离散数据。
- **闵可夫斯基距离 (Minkowski Distance)**: 欧氏距离和曼哈顿距离的推广，通过调整参数p，可以得到不同的距离度量。
- **切比雪夫距离 (Chebyshev Distance)**: 计算两点在各个维度上的最大差值。适用于棋盘距离等场景。

#### 2. 距离的计算公式：

##### 2.1 欧氏距离 (Euclidean Distance)
欧氏距离是最常用的距离度量，计算两点之间的直线距离。 其公式如下：
$$d(p, q) = \sqrt{\sum_{i=1}^{n} (p_i - q_i)^2}$$
其中，\(p\) 和 \(q\) 是两个n维空间中的点，\(p_i\) 和 \(q_i\)分别表示点 \(p\) 和 \(q\) 在第 \(i\) 个维度上的坐标。

##### 2.2 曼哈顿距离 (Manhattan Distance)
曼哈顿距离计算两点在各个维度上的绝对差值之和。其公式如下：
$$d(p, q) = \sum_{i=1}^{n} |p_i - q_i|$$
其中，\(p\) 和 \(q\) 是两个n维空间中的点，\(p_i\) 和 \(q_i\)分别表示点 \(p\) 和 \(q\) 在第 \(i\) 个维度上的坐标。

##### 2.3 闵可夫斯基距离 (Minkowski Distance)
闵可夫斯基距离是欧氏距离和曼哈顿距离的推广，通过调整参数p，可以得到不同的距离度量。其公式如下：
$$d(p, q) = \left( \sum_{i=1}^{n} |p_i - q_i|^p \right)^{\frac{1}{p}}$$
其中，\(p\) 是一个可调节的参数，当 \(p=2\) 时，闵可夫斯基距离等同于欧氏距离；当 \(p=1\) 时，闵可夫斯基距离等同于曼哈顿距离。

##### 2.4 切比雪夫距离 (Chebyshev Distance)
切比雪夫距离计算两点在各个维度上的最大差值。其公式如下：
$$d(p, q) = \max_{i} |p_i - q_i|$$
其中，\(p\) 和 \(q\) 是两个n维空间中的点，\(p_i\) 和 \(q_i\)分别表示点 \(p\) 和 \(q\) 在第 \(i\) 个维度上的坐标。

#### 3. 距离的应用场景：
- **聚类分析 (Clustering Analysis)**: 距离度量用于确定数据点之间的相似性，从而将相似的数据点分组。
- **分类算法 (Classification Algorithms)**: 在K近邻算法（KNN）等分类算法中，距离度量用于确定样本的类别。
- **推荐系统 (Recommendation Systems)**: 距离度量用于计算用户或物品之间的相似性，从而提供个性化推荐。
- **异常检测 (Anomaly Detection)**: 距离度量用于识别与正常数据点距离较远的异常点。

#### 4. 在 sklearn 中的实现：
- **欧氏距离 (Euclidean Distance)**: 可以通过 `sklearn.metrics.pairwise.euclidean_distances` 计算。
- **曼哈顿距离 (Manhattan Distance)**: 可以通过 `sklearn.metrics.pairwise.manhattan_distances` 计算。
- **闵可夫斯基距离 (Minkowski Distance)**: 可以通过 `sklearn.metrics.pairwise.minkowski_distances` 计算，并指定参数p。
- **切比雪夫距离 (Chebyshev Distance)**: 可以通过 `sklearn.metrics.pairwise.chebyshev_distances` 计算。

In [1]:
from sklearn.neighbors import KNeighborsClassifier
model = KNeighborsClassifier(
    n_neighbors=3, # 暂时使用3个邻居
    weights="distance", # 根据距离加权
    metric="minkowski", # 采用通用的 Minkowski 距离
    p=2 # 欧氏距离
)
# Create a KNN classifier using Euclidean distance (p=2)