### 線形代数とフーリエ変換

#### 前提知識
このポストを理解するためには、以下の内容を知っていると良いでしょう。
- ベクトルの基本演算
- 行列の掛け算の新しい視点
- オイラー公式の幾何学的な意味

#### フーリエ変換とは？
フーリエ変換は信号の周波数解析を行うために使用されます。例えば、低いトーンの男性の声と高いトーンの女性の声が同時に話しているとき、私たちが聞いている音は低音と高音が混ざった信号です。このとき、私たちが知りたいのは次のような情報です。
- 低音と高音の周波数はどのくらいか？
- 低音と高音の信号の大きさの割合はどうなっているか？

#### フーリエ変換の使用例
次の具体例でフーリエ変換の使用を確認してみましょう。図1には50Hzのサイン波と120Hzのサイン波が合わさった信号が示されています。これにフーリエ変換を適用すると、図2のように信号の成分を抽出することができます。

#### 信号もベクトルとして見なす
ここまで勉強してきた線形代数とフーリエ変換にはどのような関係があるのでしょうか？その重要な概念は「信号もベクトルとして見なすことができる」という点です。音声信号は録音機で得られた音圧を数値に変換し、順番に並べたものです。録音した信号をベクトルで表すと、次のように表現できます。

#### 周波数成分もベクトル
図2で見た周波数成分もベクトルとして見なすことができます。周波数成分ベクトルの要素が、各周波数の成分値を表現するように適切に周波数帯域を分ければ、周波数成分もベクトルとして表現できます。

#### フーリエ変換：時間信号ベクトルと周波数ベクトルの線形変換
行列はベクトルを入力して別のベクトルを出力する関数（線形変換）として機能します。図2で行った作業は、時間信号ベクトルを周波数ベクトルに変換することでした。私たちはこの変換を行う行列が存在すると直感的に理解できます。このような変換を行う行列を「フーリエ行列」と呼びます。

#### フーリエ行列の特性
フーリエ行列の特徴として、以下のような特性が挙げられます。

1. フーリエ行列の列は互いに直交しています。
   フーリエ行列 $ F $ に Hermitian 演算を行い、掛け算をすることで、列が直交していることが確認できます。
   
2. フーリエ行列の逆行列と逆フーリエ変換
   フーリエ行列の逆行列は、逆フーリエ変換の数式と一致することがわかります。

3. 逆フーリエ変換の意味
   「$ F^{-1} $ の列ベクトルで生成されるベクトル空間に、$ N $ 次元の時系列ベクトルが存在するか？」という観点で見ることができます。

つまり、すべての時系列信号は正弦波の和で構成されており、正弦波をどのように組み合わせるかによって時系列の形が決まることを示しています。

---

以上が、線形代数とフーリエ変換の関係、およびフーリエ行列の特性に関する解説です。フーリエ変換を理解することで、信号処理や周波数解析の基礎を深めることができます。


### フーリエ変換とは？

フーリエ変換は、信号の周波数解析を行うために使用されます。

たとえば、トーンの非常に低い男性とトーンの高い女性が同時に話していると想像してみましょう。このとき、私たちが聞く音は、低い音と高い音が混ざった信号になります。

ここで、私たちが知りたい情報は次のとおりです。

- 低い音と高い音の周波数はどのような値になるのか？（つまり、どれほど低くて高いのかを数値化したい）
- 低い音と高い音の信号の大きさの比率はどうなるのか？（つまり、二人の声がどれくらいの大きさだったのか）

#### フーリエ変換の使用例

上記の例をもう少し具体的な信号と、そのフーリエ変換による解析で確認してみましょう。

図1には、50Hzのサイン波と120Hzのサイン波が合わさった信号が示されています。つまり、低い周波数の信号と高い周波数の信号が合わさっており、それぞれの信号の振幅は0.7と1に設定されています。

**図1. 50Hzおよび120Hzの正弦波が混ざった信号**

もし、このような信号を何の背景知識もなしに受け取った場合、この全体の信号の成分を理解することはできるでしょうか？

つまり、低い音と高い音の周波数と、それらの信号の大きさの比率を知ることができるでしょうか？

フーリエ変換を適用することで、図2のように信号の成分を特定できることがわかります。

**図2. フーリエ変換の結果、50Hzと120Hzの2つの周波数成分が含まれている信号であることを逆に推定することができる**

### 信号もベクトルとして見ることができる

では、これまで学んできた線形代数とフーリエ変換にはどのような関係があるのでしょうか？

まず最も重要な概念は、**「信号もベクトルとして見ることができる」**という点です。

#### これはどういう意味でしょうか？

ベクトルの基本演算の章では、**「ベクトルとは数字を順番に並べたもの」**という視点を紹介しました。たとえば、音声信号は録音機を通じて得た音の圧力を数字に変換し、順番に並べたものに過ぎないということを再認識できます。

たとえば、録音機を使って音声信号を録音する場合、1秒あたり1つのデータを取得できる性能を持つ録音機ならば、合計10秒間録音したデータは10個の数字を並べたもので表現できます。

もし、この録音機の性能がより優れていて、1秒あたり100個のデータを取得できるとすれば、10秒間録音したデータは1000個の数字を並べたもので表現できます。

（実際には、最新の録音機では1秒あたり4万個を超えるデータを取得することも可能です！）

つまり、録音した信号をベクトルで表現すると次のようになります：

データの長さが $ N $ の場合：

$$
x[n] =
\begin{bmatrix}
x[0] \\
x[1] \\
\vdots \\
x[N-1]
\end{bmatrix}
\tag{1}
$$

ベクトルの基本演算の章で紹介したように、基本的な演算（スカラー倍とベクトルの足し算）は音声信号にも当てはまるため、音声信号もベクトルの一種と見ることができます。このとき、上記の $ x[n] $ ベクトルは $ N $ 次元であることがわかります。


### 周波数成分もベクトルとして見ることができる

では、図2で見た周波数成分についてはどうでしょうか？

周波数成分も同様にベクトルとして見ることができます。

この部分は少し難しく感じるかもしれませんが、たとえば、周波数成分ベクトルの最初の要素が0Hzの成分を表し、次の要素が1Hzの成分を表すとします。このようにして適切に周波数帯域を分割すれば、周波数成分もベクトルとして表現できます。

もし、全体の周波数帯域を時間信号の長さと同じく $ N $ 個に分けると、周波数成分ベクトルは次のように表現できます：

$$
X[k] =
\begin{bmatrix}
X[0] \\
X[1] \\
\vdots \\
X[N-1]
\end{bmatrix}
\tag{2}
$$

### フーリエ変換：時間信号ベクトルと周波数ベクトル間の線形変換

※この項目は「周波数サンプリングとDFT」から一部抜粋しています。

「行列とは、ベクトルを入力として受け取り、別のベクトルを出力する関数（線形変換）」であると学びました。図2で行ったことは、時間信号ベクトルを周波数ベクトルに変換したことです。つまり、あるベクトルを別のベクトルに変換したということです。

このような変換を行う行列が存在することを直感的に理解できます。この変換を行う行列を「フーリエ行列」と呼びます。フーリエ行列は以下の離散フーリエ変換（DFT）から得られます。

### 定義：DFTとiDFT

信号の長さが $ N $ の離散信号 $ x[n] $ と、長さが $ N $ の離散周波数成分 $ X[k] $ に対して、

$$
X[k] = \sum_{n=0}^{N-1} x[n] \exp\left(-j\frac{2\pi k}{N}n\right) \tag{3}
$$

$$
x[n] = \frac{1}{N} \sum_{k=0}^{N-1} X[k] \exp\left(j\frac{2\pi k}{N}n\right) \tag{4}
$$

これにより、信号ベクトルに対してフーリエ行列を適用することで周波数成分ベクトルを得ることができます。これを理解するために、$ k = 0, 1, \ldots, N-1 $ の場合の $ X[k] $ の値を一つ一つ計算してみましょう。

$$
X[0] = x[0] \exp\left(-j\frac{2\pi \cdot 0}{N} \cdot 0\right) + x[1] \exp\left(-j\frac{2\pi \cdot 0}{N} \cdot 1\right) + \ldots + x[N-1] \exp\left(-j\frac{2\pi \cdot 0}{N} \cdot (N-1)\right) \tag{5}
$$

$$
= x[0] \cdot 1 + x[1] \cdot 1 + \ldots + x[N-1] \cdot 1 \tag{6}
$$

$$
X[1] = x[0] \exp\left(-j\frac{2\pi \cdot 1}{N} \cdot 0\right) + x[1] \exp\left(-j\frac{2\pi \cdot 1}{N} \cdot 1\right) + \ldots + x[N-1] \exp\left(-j\frac{2\pi \cdot 1}{N} \cdot (N-1)\right) \tag{7}
$$

記号を簡略化するために、

$$
w = \exp\left(-j\frac{2\pi}{N}\right) \tag{8}
$$

としましょう。すると、

$$
X[1] = x[0]w^0 + x[1]w^1 + \ldots + x[N-1]w^{N-1} \tag{9}
$$

同様にして、任意の $ i $ 番目の周波数成分 $ X[i] $ は次のように計算できます。

$$
X[i] = x[0]w^0 + x[1]w^{i \cdot 1} + \ldots + x[j]w^{i \cdot j} + \ldots + x[N-1]w^{i \cdot (N-1)} \tag{10}
$$

このようなプロセスを経ると、DFTは次のようにベクトルと行列の関係で表現できることがわかります。

$$
\begin{bmatrix}
X[0] \\
X[1] \\
\vdots \\
X[N-1]
\end{bmatrix}
=
\begin{bmatrix}
1 & 1 & \ldots & 1 \\
1 & w & w^2 & \ldots & w^{N-1} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & w^{N-1} & w^{(N-1)\cdot 2} & \ldots & w^{(N-1)\cdot (N-1)}
\end{bmatrix}
\begin{bmatrix}
x[0] \\
x[1] \\
\vdots \\
x[N-1]
\end{bmatrix} \tag{11}
$$

行列と線形変換の章では、行列が線形変換の一種であると述べました。また、行列の掛け算の視点からは、一般的な行列の積は、左側の行列の行と右側の行列の列との内積であると言いました。

内積の意味は「類似度」であるとも言えます。つまり、信号ベクトルにフーリエ行列を掛けるということは、フーリエ行列の行と信号ベクトルがどれだけ似ているかを確認することで周波数成分を得ることを意味します。




### フーリエ行列の意味

オイラーの公式の幾何学的な意味では、以下の公式について扱いました。

$$
e^{j\theta} = \cos(\theta) + j\sin(\theta) \tag{12}
$$

式 (12) の右辺を見ると、これは複素平面で原点から $\theta$ ラジアンだけ回転した弧の座標を意味していることがわかります。

**図4:** 複素平面上での $x + i y$ の表現。三角関数で表現すると、$x$ 軸からの角度が $\theta$ ラジアンの場合、$\cos\theta + i\sin\theta$ となります。

つまり、式 (8) にある $w$ は次のように計算されます。

$$
w = \exp\left(-j\frac{2\pi}{N}\right) \tag{13}
$$

これは、時計回りに一周する円上の点を $N$ 等分した最初の点の位置を意味します。

この $w$ の意味を考えながら、$N = 8$ の場合のフーリエ行列を例に、その意味を確認してみましょう。

$N = 8$ の場合、フーリエ行列に含まれる $w$ の値は

$$
w = \exp\left(-j\frac{2\pi}{8}\right)
$$

です。これを複素平面に示すと以下のようになります。

**図5:** $\exp\left(-j\frac{2\pi}{8}\right)$ を複素平面上に示した図。赤い星印は $w$ の0乗、2乗、3乗、…、7乗を示しています。

図5のように、$w$ の複素平面の単位円上の位相で、フーリエ行列内の複素数を図に置き換えると、以下の図6のようになります。

**図6:** $N = 8$ の場合のフーリエ行列の視覚化。フーリエ行列内の図は、複素数 $w$ が示す位相を表しています。

コサイン関数やサイン関数はすべて円の回転から出発する概念であるため、回転時の位相の値はすべてコサインまたはサイン関数の値に置き換えて考えることができます。

したがって、フーリエ行列の位相をコサイン関数で考えると次のように考えられます。

**図7:** フーリエ行列内の各複素数の位相をコサイン関数で置き換えて考えた場合。

図7からわかるように、フーリエ行列の各行は、周波数0から基本周波数の倍数に応じたコサイン関数を表現していることがわかります。

さらに、フーリエ行列の位相をサイン関数で考えると次のようになります。

**図8:** フーリエ行列内の各複素数の位相をサイン関数で置き換えて考えた場合。

図8からわかるように、フーリエ行列の各行は、周波数0から基本周波数の倍数に応じたサイン関数も同時に表現していることがわかります。

つまり、DFTの計算に使用されるフーリエ行列は、基本周波数の倍数で構成されたコサインとサインの関数であり、これらの関数が実数部と虚数部を構成し、元の時間信号とそれぞれ内積を取ることで結果を得ています。

**図9:** フーリエ行列の値はすべて複素数であり、実数部と虚数部はそれぞれコサインとサインの関数で構成されていることがわかります。


### フーリエ行列の特性

今回はフーリエ行列の特性について確認してみましょう。

#### 1. フーリエ行列の列は互いに直交する

フーリエ行列の各列が直交することは、簡単な方法で確認できます。最も簡単な方法は、フーリエ行列 $ F $ に Hermitian 演算を適用した後、積を計算することです。

$$
F^H F =
\begin{bmatrix}
1 & 1 & 1 & \cdots & 1 \\
1 & w^*_1 & w^*_2 & \cdots & w^*_{(N-1)} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & w^*_{(N-1)} & w^*_{(N-1)\cdot 2} & \cdots & w^*_{(N-1)\cdot (N-1)}
\end{bmatrix}
\cdot
\begin{bmatrix}
1 & 1 & 1 & \cdots & 1 \\
1 & w_1 & w_2 & \cdots & w_{N-1} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & w_{N-1} & w_{(N-1)\cdot 2} & \cdots & w_{(N-1)\cdot (N-1)}
\end{bmatrix}
= N \cdot I
\tag{14}
$$

ここで、上付きの ‘*‘ は複素共役を意味します。

この計算結果を確認するため、$ F^H F $ の $ m $ 行目、$ n $ 列目を考えてみましょう。

$$
F^H_{m,:} F_{:,n} =
\begin{bmatrix}
1 & w^* \cdot m \cdot 1 & \cdots & w^* \cdot m \cdot (N-1)
\end{bmatrix}
\cdot
\begin{bmatrix}
1 \\
w_1 \cdot n \\
\vdots \\
w_{(N-1)} \cdot n
\end{bmatrix}
\tag{15}
$$

$$
= 1 + w^* \cdot m \cdot 1 \cdot w_1 \cdot n + \cdots + w^* \cdot m \cdot (N-1) \cdot w_{(N-1)} \cdot n
\tag{16}
$$

$$
= \sum_{k=0}^{N-1} w^*_{m \cdot k} \cdot w_{k \cdot n}
\tag{17}
$$

$$
= \sum_{k=0}^{N-1} \exp\left(j\frac{2\pi}{N} m \cdot k\right) \exp\left(-j\frac{2\pi}{N} n \cdot k\right)
\tag{18}
$$

$$
= \sum_{k=0}^{N-1} \exp\left(j\frac{2\pi}{N} (m - n) \cdot k\right)
\tag{19}
$$

従って、$ m = n $ の場合 $ F^H_{m,:} F_{:,n} = N $ となり、$ m \neq n $ の場合は $ F^H_{m,:} F_{:,n} = 0 $ となります。

式 (15) の結果のように、フーリエ行列 $ F $ の各列は、同じ列との内積で $ N $ という値を持ち、他の列との内積では 0 という結果を得るため、各列が互いに直交していることがわかります。

#### 2. フーリエ行列の逆行列と逆フーリエ変換

また、式 (14) と式 (15) から、フーリエ行列の逆行列は次のように表せることがわかります。

$$
F^{-1} = \frac{1}{N} F^H
\tag{20}
$$

つまり、

$$
\begin{bmatrix}
x[0] \\
x[1] \\
\vdots \\
x[N-1]
\end{bmatrix}
=
\frac{1}{N}
\begin{bmatrix}
1 & 1 & 1 & \cdots & 1 \\
1 & w^*_1 & w^*_2 & \cdots & w^*_{(N-1)} \\
\vdots & \vdots & \vdots & \ddots & \vdots \\
1 & w^*_{(N-1)} & w^*_{(N-1)\cdot 2} & \cdots & w^*_{(N-1)\cdot (N-1)}
\end{bmatrix}
\begin{bmatrix}
X[0] \\
X[1] \\
\vdots \\
X[N-1]
\end{bmatrix}
\tag{21}
$$

これは逆DFTの式と同じであることがわかります。

#### 3. 逆フーリエ変換が示すもの

行列の積に関する新たな視点のセクションで、列空間に基づく解釈をもう一度考えてみましょう。

例えば、次のような行列があるとします。

$$
\begin{bmatrix}
1 & 2 \\
3 & 4
\end{bmatrix}
\begin{bmatrix}
x \\
y
\end{bmatrix}
=
\begin{bmatrix}
3 \\
5
\end{bmatrix}
\tag{22}
$$

この連立方程式を解くと、簡単に

$$
\begin{cases}
x + 2y = 3 \\
3x + 4y = 5
\end{cases}
\tag{23}
$$

$$
\Rightarrow x = -1, y = 2
\tag{24}
$$

という結果になります。

しかし、この式を次のように解釈することもできます。

$$
x
\begin{bmatrix}
1 \\
3
\end{bmatrix}
+
y
\begin{bmatrix}
2 \\
4
\end{bmatrix}
=
\begin{bmatrix}
3 \\
5
\end{bmatrix}
\tag{25}
$$

この式に対する解釈は、次のように考えることができます。

「ベクトル $\begin{bmatrix} 1 \\ 3 \end{bmatrix}$ と $\begin{bmatrix} 2 \\ 4 \end{bmatrix}$ から生成されたベクトル空間内にベクトル $\begin{bmatrix} 3 \\ 5 \end{bmatrix}$ が存在するか？ 存在するなら、どのように組み合わせれば $\begin{bmatrix} 3 \\ 5 \end{bmatrix}$ を求められるか？」

これをフーリエ行列にそのまま適用すると、逆フーリエ変換を行う意味は次のようになります。

「$ F^{-1} $ の列ベクトルで生成されたベクトル空間内に、$ N $ 次元の時系列ベクトルが存在するか？」

「もしそうなら、$ F^{-1} $ の列ベクトルをどう組み合わせれば時系列ベクトルを作れるのか？」

つまりどういうことかと言うと、すべての時系列は正弦波の合成で構成でき、正弦波をどのように組み合わせるかによって時系列の形が変わることを再確認させているのです。
