## マハラノビス平方距離について

マハラノビス距離（Mahalanobis Distance）は、統計学や機械学習において広く使用される距離計量法の一つで、データの分布を考慮して距離を測ることができます。これにより、異なる次元のデータ間の相対的な距離を正確に評価することが可能になります。

### マハラノビス距離の定義

ある点 $x$ が平均ベクトル $\mu$ を中心とする分布に属するとき、$x$ と $\mu$ のマハラノビス距離は以下のように定義されます：

$$
D_M(x) = \sqrt{(x - \mu)^T \Sigma^{-1} (x - \mu)}
$$

ここで、
- $x$ はデータ点のベクトル
- $\mu$ はデータの平均ベクトル
- $\Sigma$ は共分散行列
- $\Sigma^{-1}$ は共分散行列の逆行列
- $(x - \mu)^T$ は $(x - \mu)$ の転置行列

### マハラノビス距離の特性

1. **分散のスケールを考慮**：マハラノビス距離はデータの分散を考慮するため、単位の異なる特徴量間の距離を適切に評価することができます。
2. **共分散行列の影響**：特徴量間の相関も考慮されるため、相関のある特徴量が多い場合でも正確な距離評価が可能です。
3. **標準化**：データが異なるスケールや分布を持つ場合でも、適切に距離を計算することができます。

### マハラノビス距離の計算手順

具体的な例を用いて、マハラノビス距離の計算手順を説明します。

#### 例: 2次元データセット

データポイント $x = (3, 4)$ と平均ベクトル $\mu = (2, 2)$、共分散行列 $\Sigma$ を以下のように仮定します：

$$
\Sigma = \begin{pmatrix}
1 & 0.5 \\
0.5 & 1
\end{pmatrix}
$$

### ステップ1: 平均ベクトルとの差を計算
$$
x - \mu = (3 - 2, 4 - 2) = (1, 2)
$$

### ステップ2: 共分散行列の逆行列を計算
$$
\Sigma^{-1} = \begin{pmatrix}
\frac{4}{3} & -\frac{2}{3} \\
-\frac{2}{3} & \frac{4}{3}
\end{pmatrix}
$$

### ステップ3: マハラノビス距離の計算
$$
D_M(x) = \sqrt{(1, 2) \begin{pmatrix}
\frac{4}{3} & -\frac{2}{3} \\
-\frac{2}{3} & \frac{4}{3}
\end{pmatrix} \begin{pmatrix}
1 \\
2
\end{pmatrix}}
= \sqrt{(1, 2) \begin{pmatrix}
0 \\
2
\end{pmatrix}}
= \sqrt{4}
= 2
$$

### 実装例

以下に、Pythonでマハラノビス距離を計算する例を示します。



このコードを実行すると、データポイント $x$ と平均ベクトル $\mu$ の間のマハラノビス距離が計算されます。結果は上記の例と同様に2となります。

In [None]:
import numpy as np

# データポイントと平均ベクトル
x = np.array([3, 4])
mu = np.array([2, 2])

# 共分散行列
cov_matrix = np.array([[1, 0.5], [0.5, 1]])

# 共分散行列の逆行列
inv_cov_matrix = np.linalg.inv(cov_matrix)

# 平均ベクトルとの差
diff = x - mu

# マハラノビス距離の計算
mahalanobis_distance = np.sqrt(np.dot(np.dot(diff.T, inv_cov_matrix), diff))

mahalanobis_distance