In [0]:
%matplotlib inline
import matplotlib.pyplot as plt
import numpy as np
from sklearn.mixture import GaussianMixture
from sklearn.mixture import BayesianGaussianMixture
from sklearn.preprocessing import StandardScaler
from sklearn import datasets

In [0]:
wine = datasets.load_wine()
X = wine.data[:,[9,12]]
y = wine.target

# 標準化
sc = StandardScaler()
X_std = sc.fit_transform(X)

In [0]:
# covariance_typeに'diag'を指定しGMMのモデルを作成
model = GaussianMixture(n_components=3, covariance_type='diag', random_state=1)
model.fit(X_std)

# covariance_typeに'full'を指定し GMMのモデルを作成
model2 = GaussianMixture(n_components=3, covariance_type='full', random_state=1)
model2.fit(X_std)

In [0]:
plt.figure(figsize=(8,8))
# 色とプロリンの散布図のGMM(diag)によるクラスタリング
plt.subplot(2, 1, 1)

x = np.linspace(X_std[:,0].min(), X_std[:,0].max(), 100)
y = np.linspace(X_std[:,0].min(), X_std[:,0].max(), 100)
X, Y = np.meshgrid(x, y)
XX = np.array([X.ravel(), Y.ravel()]).T
Z = -model.score_samples(XX)
Z = Z.reshape(X.shape)

plt.contour(X, Y, Z, levels=[0.5, 1, 2 ,3 ,4, 5]) # 等高線のプロット
plt.scatter(X_std[:,0], X_std[:,1], c=model.predict(X_std))
plt.scatter(model.means_[:,0], model.means_[:,1],s=250, marker='*',c='red')
plt.title('GMM(covariance_type=diag)')

# 色とプロリンの散布図のGMM(full)によるクラスタリング
plt.subplot(2, 1, 2)

x = np.linspace(X_std[:,0].min(), X_std[:,0].max(), 100)
y = np.linspace(X_std[:,0].min(), X_std[:,0].max(), 100)
X, Y = np.meshgrid(x, y)
XX = np.array([X.ravel(), Y.ravel()]).T
Z = -model2.score_samples(XX)
Z = Z.reshape(X.shape)

plt.contour(X, Y, Z, levels=[0.5, 1, 2 ,3 ,4, 5]) # 等高線のプロット
plt.scatter(X_std[:,0], X_std[:,1], c=model2.predict(X_std))
plt.scatter(model2.means_[:,0], model2.means_[:,1],s=250, marker='*',c='red')
plt.title('GMM(covariance_type=full)')

plt.show

In [0]:
model.predict(X_std) #予測

In [0]:
model.weights_ #混合係数

In [0]:
model.means_ #平均ベクトル

In [0]:
model.covariances_ # covariance_type='diag'の共分散行列

In [0]:
model2.covariances_ # covariance_type='full'の共分散行列

In [0]:
# VBGMMのモデルを作成
model3 = BayesianGaussianMixture(n_components=10, covariance_type='full', random_state=18)
model3.fit(X_std)

In [0]:
plt.figure(figsize=(8,4))

# 色とプロリンの散布図のVBGMMによるクラスタリング
x = np.linspace(X_std[:,0].min(), X_std[:,0].max(), 100)
y = np.linspace(X_std[:,0].min(), X_std[:,0].max(), 100)
X, Y = np.meshgrid(x, y)
XX = np.array([X.ravel(), Y.ravel()]).T
Z = -model3.score_samples(XX)
Z = Z.reshape(X.shape)

plt.contour(X, Y, Z, levels=[0.5, 1, 2 ,3 ,4, 5]) # 等高線のプロット
plt.scatter(X_std[:,0], X_std[:,1], c=model3.predict(X_std))
plt.title('VBGMM(covariance_type=full)')

plt.show

In [0]:
model3.means_ #平均ベクトル

In [0]:
model3.weights_ #混合係数

In [0]:
# 混合係数の可視化
x =np.arange(1, model3.n_components+1)

plt.figure(figsize=(8,4)) #プロットのサイズ指定
plt.bar(x, model3.weights_, width=0.7, tick_label=x)

plt.ylabel('Mixing weights for each mixture component')
plt.xlabel('Number of mixture components')
plt.title('Wine dataset')
plt.show