<a href="https://colab.research.google.com/github/BlackUBird/TMCIT_T5DSP/blob/main/dsp18_20221017.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

author: 上原正志  
date: 2022.10.17  
- ケプストラム分析

In [None]:
import numpy as np
import matplotlib.pyplot as plt
from scipy.io.wavfile import read
from numpy.fft import fft, ifft, fftfreq
from IPython.display import Audio

## 音声の読み込み

In [None]:
fs, a = read("speech_a.wav")
print(fs)
t = np.arange(0, len(a))/fs
a = a/max(np.abs(a))
plt.xlim(0, len(a)/fs)
plt.xlabel("time [s]")
plt.ylabel("amplitude")
plt.plot(t,a)
Audio(a, rate=fs)

## 解析区間の抽出

In [None]:
start_sec = 0.3
N = 512

start_sample = int(start_sec * fs)
end_sample = start_sample+N

x = a[start_sample:end_sample]
t_target = np.arange(0, N)/fs
plt.xlim(0, N/fs)
plt.xlabel("time [s]")
plt.ylabel("amplitude")
plt.plot(t_target,x)

## スペクトルの導出
離散フーリエ変換(fft)をおこなう

In [None]:
X = fft(x)

スペクトルの可視化（上段：実数部，下段：虚数部）

In [None]:
freqs = fftfreq(N, d=1.0/fs)

plt.subplot(2,1,1)
plt.plot(freqs, X.real)
plt.xlim(min(freqs), max(freqs))
plt.ylabel("real part")

plt.subplot(2,1,2)
plt.plot(freqs, X.imag)
plt.xlim(min(freqs), max(freqs))
plt.ylabel("imag part")

plt.xlabel("frequency [Hz]")

## 振幅スペクトル
複素スペクトルの絶対値

In [None]:
X_abs = np.abs(X)

複素スペクトルの可視化

In [None]:
freqs = fftfreq(N, d=1.0/fs)

plt.plot(freqs, X_abs)
plt.xlabel("frequency [Hz]")
plt.ylabel("spectrum")
plt.xlim(min(freqs), max(freqs))

負の周波数成分を除いて可視化

In [None]:
plt.plot(freqs[:N//2], X_abs[:N//2])
plt.xlabel("frequency [Hz]")
plt.ylabel("spectrum")
plt.xlim(0, max(freqs[:N//2]))

## 対数(振幅)スペクトル
振幅スペクトルの自然対数をとる

In [None]:
X_ln = np.log(X_abs)

対数スペクトルの可視化

In [None]:
plt.plot(freqs[:N//2], X_ln[:N//2])
plt.xlabel("frequency [Hz]")
plt.ylabel("log amplitude spectrum")
plt.xlim(0,max(freqs[:N//2]))

## ケプストラムの導出
対数スペクトルを逆離散フーリエ変換

In [None]:
ceps = ifft(X_ln)

ケプストラムの可視化

In [None]:
plt.plot(t_target[:N//2],ceps[:N//2].real)
plt.xlim(0, max(t_target[:N//2]))
plt.xlabel("quefrency [s]")
plt.ylabel("cepstrum")

## リフタリング
ケプストラムの低次成分を抽出

In [None]:
low_sample = 30 # 抽出する次数
ceps_low = ceps
ceps_low[low_sample:N-low_sample] = 0

リフタリング後のケプストラム

In [None]:
plt.plot(t_target[:N//2], ceps_low[:N//2].real)
plt.xlim(0, max(t_target[:N//2]))
plt.xlabel("quefrency [s]")
plt.ylabel("cepstrum")

## スペクトル包絡の導出
リフタリング後のケプストラムをフーリエ変換

In [None]:
spec_env = fft(ceps_low)

スペクトル包絡を可視化

In [None]:
freqs = fftfreq(N, d=1.0/fs)
plt.plot(freqs[:N//2], spec_env[:N//2].real)
plt.xlim(0, max(freqs[:N//2]))

スペクトルと重ね合わせて表示

In [None]:
plt.plot(freqs[:N//2], X_ln[:N//2], linestyle=":", label="log amplitude spectrum")
plt.plot(freqs[:N//2], spec_env[:N//2].real, label="envelope of spectrum")
plt.xlabel("frequency [Hz]")
plt.ylabel("log amplitude spectrum")
plt.xlim(0, max(freqs[:N//2]))
plt.legend()