# MDSを理解するためのノートブック

In [None]:
# ライブラリのインポート
import numpy as np
import matplotlib.pyplot as plt
from ipywidgets import interact, IntSlider
from sklearn.datasets import make_blobs
from scipy.spatial.distance import pdist, squareform
from sklearn.manifold import MDS

In [None]:
# データセットの生成
X, y = make_blobs(n_samples=400, n_features=3, centers=4, random_state=42, cluster_std=3)

# 3Dプロットのインタラクティブ表示
def plot_3d(elev=30, azim=30):
    fig = plt.figure(figsize=(10, 8))
    ax = fig.add_subplot(111, projection='3d')
    ax.scatter(X[:, 0], X[:, 1], X[:, 2], c=y, cmap='viridis')
    ax.set_title("Original Data in 3D")
    ax.set_xlabel("Feature 1")
    ax.set_ylabel("Feature 2")
    ax.set_zlabel("Feature 3")
    ax.view_init(elev=elev, azim=azim)
    plt.show()

# ウィジェットを用いたインタラクティブプロット
interact(plot_3d, elev=IntSlider(min=-180, max=180, step=10, value=30), azim=IntSlider(min=-180, max=180, step=10, value=30))

In [None]:
# データ間の距離を計算
distances = pdist(X, 'euclidean')

# 距離のヒストグラムをプロット
plt.figure(figsize=(10, 6))
plt.hist(distances, bins=50, alpha=0.75, color='blue')
plt.title("Distribution of Pairwise Distances in 3D Data")
plt.xlabel("Distance")
plt.ylabel("Frequency")
plt.grid(True)
plt.show()

In [None]:
# MDSの適用
plt.figure(figsize=(5, 4))
X_mds = MDS(n_components=2, random_state=42, normalized_stress='auto').fit_transform(X)
plt.scatter(X_mds[:, 0], X_mds[:, 1], c=y)
plt.title(f"MDS")
plt.tight_layout()
plt.show()

In [None]:
from scipy.spatial.distance import pdist, squareform

plt.figure(figsize=(5, 4))

# 元のデータの距離行列
distances_original = squareform(pdist(X))

X_r = MDS(n_components=2, random_state=42, normalized_stress='auto').fit_transform(X)
distances = squareform(pdist(X_r))

# プロット
plt.scatter(distances_original.flatten(), distances.flatten(), alpha=0.05, s=0.1)
plt.title(f"MDS")
plt.xlabel("Original Distances")
plt.ylabel("MDS Distances")
plt.grid(True)

plt.tight_layout()
plt.show()