## logistic 

逻辑回归（Logistic Regression）是一种广泛应用于分类问题的统计学习方法。它基于线性回归模型，通过一个非线性的逻辑函数（称为“sigmoid函数”或“逻辑函数”）将预测结果映射到概率值，从而对样本进行分类。

在逻辑回归中，我们假设输入特征X与输出标签 $Y$ 之间存在一种概率关系，并希望根据特征来预测属于某个类别的概率。逻辑回归可以处理二分类问题，也可以通过扩展为多分类问题。

具体而言，逻辑回归的数学模型如下：

* 假设函数（Hypothesis Function）： 

$hθ(x) = g(θ^T x)$ 

其中 

$g(z) = \frac{1}{1 + e^{-z}} $ 

是逻辑函数。

* 损失函数（Loss Function）：

对于二分类问题，使用对数损失函数（Log Loss）：

$ J(\theta) = -\frac{1}{m} \sum_{i=1}^{m} [y^{(i)} \log(h_\theta(x^{(i)})) + (1-y^{(i)}) \log(1 - h_\theta(x^{(i)}))] $

其中 $m$ 是样本数量，$y$是实际标签。

* 参数估计：

使用梯度下降等优化算法最小化损失函数 $J(θ)$，得到参数θ的估计值。

* 预测：

根据学习到的参数 $θ$，对新样本进行预测，即计算 $hθ(x)$ 的概率值，并根据阈值进行分类。

In [3]:
from sklearn.linear_model import LogisticRegression
import numpy as np

# 生成样本数据
np.random.seed(0)
n_samples, n_features = 100, 10
X = np.random.randn(n_samples, n_features)
y = np.random.randn(n_samples)  # 生成5个相关联的目标变量

# 创建逻辑回归模型
logistic_reg = LogisticRegression()

# 拟合模型
logistic_reg.fit(X, y)

# 输出参数估计结果
print("参数估计结果：")
print(logistic_reg.coef_)

# 进行预测
y_pred = logistic_reg.predict(X)

ValueError: y should be a 1d array, got an array of shape (100, 5) instead.