<a href="https://colab.research.google.com/github/hamagami/anomaly-detection/blob/main/04_02_LoF.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# LOF (local outlier factor) 局所外れ値因子法
LOFだけのサンプルです。近傍数を変えることで外れサンプルが変化していく様子がわかります。

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.neighbors import LocalOutlierFactor # https://scikit-learn.org/stable/modules/generated/sklearn.neighbors.LocalOutlierFactor.html
import numpy as np


## ダミーデータの生成

In [None]:
def makedata1():#単一分布の例
  dnum=1000
  mean = np.array([0, 0]) # 平均
  cov = np.array([[1, 0.7],[0.7, 2]]) # 共分散行列
  x, y = np.random.multivariate_normal(mean, cov, dnum).T #多変量正規分布に従う乱数を生成
  data=np.array([x,y]).T
  return data

In [None]:
def makedata2(): #複数分布の例
  dnum=100

  mean1 = np.array([0, -2]) # 平均を指定。
  cov1 = np.array([[1, 0.7],[0.7, 2]]) # 共分散行列を指定。
  x1, y1 = np.random.multivariate_normal(mean1, cov1, dnum).T 

  mean2 = np.array([4, 4]) # 平均を指定。
  cov2 = np.array([[1, -0.3],[0.7, 0.4]]) # 共分散行列を指定。
  x2, y2 = np.random.multivariate_normal(mean2, cov2, dnum).T 

  mean3 = np.array([-3, 5]) # 平均を指定。
  cov3 = np.array([[0.8, -0.1],[1.0, 2]]) # 共分散行列を指定。
  x3, y3 = np.random.multivariate_normal(mean3, cov3, dnum).T 

  mean=np.array([mean1,mean2,mean3])
  cov =np.array([cov1,cov2,cov3])
  x = np.hstack([x1, x2, x3])
  y = np.hstack([y1,y2,y3])
  data=np.array([x,y]).T

  return data

# LOFの近傍数をいろいろ変えてみる

In [None]:
ddata = [makedata1(),makedata2()]

for data in ddata: 
  for i in range(1,15):
    clf = LocalOutlierFactor(n_neighbors=i, contamination=0.05) # ⇐ここのパラメータをいろいろ変えてみるとLOFの振る舞いがよくわかる contamination は外れサンプルの割合
    pred = clf.fit_predict(data)
    ano= data[pred== -1] #予測結果が異常だったサンプルだけを取り出す
    plt.xlim(-10,10)
    plt.ylim(-10,10)
    plt.plot(data.T[0],data.T[1],".")
    plt.title("n_neigbors="+str(i))
    plt.plot(ano[:,0],ano[:,1],"o")
    plt.show()
    #ここではユークリッド距離に基づいてLOFを考えているが，偏りがある場合はマハラノビス距離でとるべき