# 异常检测

异常检测是一种识别数据集中异常点或离群点的技术。异常点是指那些显著偏离正常模式的数据点。异常检测在欺诈检测、设备故障预测、网络入侵检测等领域有广泛应用。常见的异常检测方法包括孤立森林、局部离群因子（LOF）和支持向量机（SVM）等。

## 孤立森林

孤立森林是一种基于树的异常检测方法，通过构建随机树，识别数据中的异常点。孤立森林适用于高维数据，并且对大规模数据集有良好的处理性能。

In [None]:
from sklearn.ensemble import IsolationForest

# 生成示例数据
rng = np.random.RandomState(42)
X = 0.3 * rng.randn(100, 2)
X_train = np.r_[X + 2, X - 2]
X_outliers = rng.uniform(low=-4, high=4, size=(20, 2))
X = np.r_[X_train, X_outliers]

# 拟合孤立森林模型
clf = IsolationForest(random_state=0)
clf.fit(X)
y_pred = clf.predict(X)

# 绘制异常检测结果
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='viridis')
plt.title('孤立森林异常检测示例')
plt.xlabel('特征 1')
plt.ylabel('特征 2')
plt.show()

## 局部离群因子（LOF）

局部离群因子是一种基于密度的异常检测方法，通过比较样本点和其邻居的局部密度，识别异常点。LOF适用于检测局部异常和全局异常。

In [None]:
from sklearn.neighbors import LocalOutlierFactor

# 拟合LOF模型
lof = LocalOutlierFactor()
y_pred = lof.fit_predict(X)

# 绘制LOF异常检测结果
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='viridis')
plt.title('局部离群因子异常检测示例')
plt.xlabel('特征 1')
plt.ylabel('特征 2')
plt.show()

## 支持向量机（SVM）

支持向量机不仅可以用于分类任务，还可以用于异常检测。通过构建一个超平面，将数据划分为正常点和异常点。

In [None]:
from sklearn.svm import OneClassSVM

# 拟合OneClassSVM模型
svm = OneClassSVM(gamma='auto')
svm.fit(X)
y_pred = svm.predict(X)

# 绘制OneClassSVM异常检测结果
plt.scatter(X[:, 0], X[:, 1], c=y_pred, cmap='viridis')
plt.title('OneClassSVM 异常检测示例')
plt.xlabel('特征 1')
plt.ylabel('特征 2')
plt.show()

通过以上示例，我们了解了孤立森林、局部离群因子和支持向量机的基本原理和应用。在实际应用中，选择合适的异常检测方法需要考虑数据的特点和具体的应用场景。