# Griffin-Limアルゴリズムによる位相復元

Griffin-Limアルゴリズムを用いた位相復元を行います．
このアルゴリズムは，繰り返し処理を行い尤もらしい位相スペクトログラムを推定します．

- [日本語記事（参考）](https://librosa.org/doc/0.11.0/generated/librosa.display.specshow.html)
- [原論文](http://dub.ucsd.edu/CATbox/Reader/GriffinLimMSTFT.pdf)
- [librosaドキュメント](https://librosa.org/doc/main/generated/librosa.griffinlim.html)

In [None]:
import librosa
from pathlib import Path
import numpy as np
import IPython

filename = "J-SPaW_sample.wav"
file_path = Path("audiofile", filename)

data, sr = librosa.load(file_path, sr=16000)

D = librosa.stft(
    data,
    n_fft=2048,
    hop_length=256,
    win_length=512,
    window="hann",
)

# 振幅のみ抽出
D_amp = np.abs(D)
# 値の型を確認
print(D_amp.dtype)

float32


### Griffin-Limの実行
パラメータは色々変えてみましょう
- 繰り返し回数を変えてみる
- 完全再構成条件を満たさない設定にしてみる

In [21]:
reconstructed_data = librosa.griffinlim(
    D_amp,
    n_iter=32,
    hop_length=256,
    win_length=512,
    n_fft=2048,
    window="hann",
    momentum=0.99,
    init="random",
    random_state=3407,
)

print("元の音声:")
IPython.display.display(IPython.display.Audio(data, rate=sr))

print("復元された音声:")
IPython.display.display(IPython.display.Audio(reconstructed_data, rate=sr))


元の音声:


復元された音声:
