In [3]:
import numpy as np

def pca_split(points):
    """
    对点集进行 PCA，并沿主成分方向将点集分为两份。

    :param points: 点集，形状为 (n_samples, n_features)
    :return: 两个点集，分别为主成分方向两侧的点
    """
    # 1. 中心化点集
    mean = np.mean(points, axis=0)
    centered_points = points - mean

    # 2. 计算协方差矩阵
    cov_matrix = np.cov(centered_points, rowvar=False)

    # 3. 计算特征值和特征向量
    eigenvalues, eigenvectors = np.linalg.eig(cov_matrix)

    # 4. 选择主成分方向（最大特征值对应的特征向量）
    principal_component = eigenvectors[:, np.argmax(eigenvalues)]

    # 5. 将点集投影到主成分方向上
    projections = np.dot(centered_points, principal_component)

    # 6. 根据投影值将点集分为两部分
    median_projection = np.median(projections)
    mask = projections < median_projection

    print(mask)

    # 返回分割后的两个点集
    return points[mask], points[~mask]

# 示例使用
if __name__ == "__main__":
    # 生成一个示例点集
    np.random.seed(42)
    points = np.random.randn(100, 3)  # 100 个 3D 点

    # 调用 PCA 分割函数
    split1, split2 = pca_split(points)

    # 打印结果
    print("Split 1 shape:", split1.shape)
    print("Split 2 shape:", split2.shape)

[False  True  True  True  True False False  True  True  True  True  True
  True  True  True False False False  True False  True False  True False
  True  True False  True False False  True  True  True  True  True  True
  True False  True False False False False False  True  True False False
  True False  True  True  True False False False  True False  True False
  True False  True False False False False False False False False False
  True  True  True  True  True  True  True False False  True False False
  True  True  True  True False False False False  True False False False
  True False False False]
Split 1 shape: (50, 3)
Split 2 shape: (50, 3)
