# 19章　クラスタリング 


## レシピ19.1　k-平均法（k-Means）によるクラスタリング 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import KMeans

# データをロード
iris = datasets.load_iris()
features = iris.data

# 特徴量を標準化
scaler = StandardScaler()
features_std = scaler.fit_transform(features)

# k-平均法クラスタリングを作成
cluster = KMeans(n_clusters=3, random_state=0)

# k-平均法クラスタリングを訓練
model = cluster.fit(features_std)

In [None]:
# クラス予測結果を表示
model.labels_

In [None]:
# クラスの真の値を表示
iris.target

In [None]:
# 新たな観測値を作成
new_observation = [[0.8, 0.8, 0.8, 0.8]]

# 観測値のクラスタを予測
model.predict(new_observation)

In [None]:
# クラスタ中心を表示
model.cluster_centers_

## レシピ19.2　k-平均法クラスタリングの高速化 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import MiniBatchKMeans

# データをロード
iris = datasets.load_iris()
features = iris.data

# 特徴量を標準化
scaler = StandardScaler()
features_std = scaler.fit_transform(features)

# ミニバッチk-平均法クラスタリング器を作成
cluster = MiniBatchKMeans(n_clusters=3, random_state=0, batch_size=100, n_init="auto")

# ミニバッチk-平均法クラスタリング器を訓練
model = cluster.fit(features_std)

## レシピ19.3　平均値シフト法によるクラスタリング 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import MiniBatchKMeans

# データをロード
iris = datasets.load_iris()
features = iris.data

# 特徴量を標準化
scaler = StandardScaler()
features_std = scaler.fit_transform(features)

# ミニバッチk-平均法クラスタリング器を作成
cluster = MiniBatchKMeans(n_clusters=3, random_state=0, batch_size=100, n_init="auto")

# ミニバッチk-平均法クラスタリング器を訓練
model = cluster.fit(features_std)

## レシピ19.4　DBSCANを用いたクラスタリング 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import MiniBatchKMeans

# データをロード
iris = datasets.load_iris()
features = iris.data

# 特徴量を標準化
scaler = StandardScaler()
features_std = scaler.fit_transform(features)

# ミニバッチk-平均法クラスタリング器を作成
cluster = MiniBatchKMeans(n_clusters=3, random_state=0, batch_size=100, n_init="auto")

# ミニバッチk-平均法クラスタリング器を訓練
model = cluster.fit(features_std)

# DBSCANクラスタリング器を訓練
model = cluster.fit(features_std)

In [None]:
# クラスタ割り当てを表示
model.labels_

## レシピ19.5　階層的マージによるクラスタリング 


In [None]:
# ライブラリをロード
from sklearn import datasets
from sklearn.preprocessing import StandardScaler
from sklearn.cluster import AgglomerativeClustering

# データをロード
iris = datasets.load_iris()
features = iris.data

# 特徴量を標準化
scaler = StandardScaler()
features_std = scaler.fit_transform(features)

# 凝集型クラスタリング器を作成
cluster = AgglomerativeClustering(n_clusters=3)

# 凝集型クラスタリング器を訓練
model = cluster.fit(features_std)

In [None]:
# クラスタ割り当てを表示
model.labels_