In [1]:
# 目标：快速了解如何调用LogisticRegression进行训练和预测

import numpy as np
from sklearn.linear_model import LogisticRegression

# 1. 假设我们有几个简单的二维数据点和它们的标签 (0 或 1)
X_simple = np.array([[1, 2], [2, 3], [3, 4], [4, 1], [5, 2], [6, 3]])
y_simple = np.array([0, 0, 0, 1, 1, 1])

# 2. 实例化一个模型对象
# 我们暂时使用默认参数
model = LogisticRegression()

# 3. 用我们的数据对模型进行“训练”
model.fit(X_simple, y_simple)

# 4. 准备一个“未知”的新数据点
new_point = np.array([[3.5, 2.5]])

# 5. 让训练好的模型进行预测
prediction = model.predict(new_point)
probability = model.predict_proba(new_point)

print(f"最简逻辑回归示例：")
print(f"新数据点 {new_point} 的预测类别是: {prediction[0]}")
print(f"预测为各个类别的概率是: {probability}")

最简逻辑回归示例：
新数据点 [[3.5 2.5]] 的预测类别是: 1
预测为各个类别的概率是: [[0.43551906 0.56448094]]


In [4]:
# 目标：快速了解LDA如何用于降维和分类

import numpy as np
from sklearn.discriminant_analysis import LinearDiscriminantAnalysis

# 1. 假设我们有几个三维数据点和它们的标签 (类别0, 1, 2)
X_simple_3d = np.array([
    [5, 2, 1], [6, 3, 2], [7, 3, 1], # 类别 0
    [1, 8, 9], [2, 9, 8], [1, 10, 9], # 类别 1
    [8, 8, 1], [9, 9, 2], [10, 8, 1]  # 类别 2
])
y_simple_3d = np.array([0, 0, 0, 1, 1, 1, 2, 2, 2])

# 2. 使用LDA进行“降维”
# 对于3个类别，我们最多可以降到 3-1=2 维
lda_transformer = LinearDiscriminantAnalysis(n_components=2)
# fit_transform 会同时学习投影方向并转换数据
X_transformed = lda_transformer.fit_transform(X_simple_3d, y_simple_3d)

print(f"最简LDA示例：")
print(f"原始数据维度: {X_simple_3d.shape}")
print(f"LDA降维后维度: {X_transformed.shape}\n")
print(f"LDA降维后: {X_transformed}\n")


# 3. 使用LDA进行“分类”
# 我们需要一个不同的、未见过的数据点
new_point_3d = np.array([[6, 4, 2]]) # 这个点看起来更像类别0

# 重新实例化一个分类器（不指定n_components）
lda_classifier = LinearDiscriminantAnalysis()
lda_classifier.fit(X_simple_3d, y_simple_3d)

# 预测新数据点的类别
prediction = lda_classifier.predict(new_point_3d)
print(f"LDA分类器预测：")
print(f"新数据点 {new_point_3d} 的预测类别是: {prediction[0]}")

最简LDA示例：
原始数据维度: (9, 3)
LDA降维后维度: (9, 2)

LDA降维后: [[-4.44642588 -4.97530911]
 [-3.30731601 -4.12245872]
 [-5.14222859 -3.45699331]
 [ 9.45714684 -1.53166072]
 [ 7.77620363  0.56648972]
 [ 9.76508558  1.33370933]
 [-4.79726779  3.74924721]
 [-3.65815791  4.60209761]
 [-5.64703987  3.834878  ]]

LDA分类器预测：
新数据点 [[6 4 2]] 的预测类别是: 0
