# Guitar (string mode)

numpyを使う例として、音声の合成と解析を行う。

基底音: 正弦波(440 Hz, ド)

サンプリング周波数は20000 Hzとする。

* `time`は文字通り時間。20000個のarrayの中に時刻が書かれている。
* `phase`は位相。$2\pi$増えるとサイン波が0に戻る。440 Hzの場合は、1秒(20000サンプル)のあいだに$440\cdot 2\pi$だけ増加する。
* `wave`は波形。ここではコサイン波を作る。

In [None]:
%matplotlib inline

import numpy as np
from math import pi
from IPython.display import Audio
import matplotlib.pyplot as plt

time = np.linspace(0, 1.0, 20000)
phase = time* (440*pi*2)
wave = np.cos(phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave)

Audio(wave, rate=20000)



減衰させる。減衰の時定数は0.5 (0.5秒で$1/e$まで減衰する)

In [None]:
decay = np.exp(-time/0.5)

Audio(wave*decay, rate=20000)

2倍音。(振動数が2倍の音、1オクターブ上の音)

In [None]:
wave = np.cos(2*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

3倍音。(振動数が3倍の音、1オクターブ上のソ)

In [None]:
wave = np.cos(3*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

4倍音。(振動数が4倍の音、2オクターブ上の同音)

In [None]:
wave = np.cos(4*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

基底音+倍音

In [None]:
wave = np.cos(phase)
wave += 0.5**0.5*np.cos(2*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

基底音+倍音+3倍音

In [None]:
wave = np.cos(phase)
wave += (1/2)**0.5*np.cos(2*phase)
wave += (1/3)**0.5*np.cos(3*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

基底音+倍音+3倍音+4倍音

In [None]:
wave = np.cos(phase)
wave += (1/2)**0.5*np.cos(2*phase)
wave += (1/3)**0.5*np.cos(3*phase)
wave += (1/4)**0.5*np.cos(4*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

In [None]:
wave = np.cos(phase)
wave += (1/2)**0.5*np.cos(2*phase)
wave += (1/3)**0.5*np.cos(3*phase)
wave += (1/4)**0.5*np.cos(4*phase)
wave += (1/3)**0.5*np.cos(5*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)

Audio(wave*decay, rate=20000)

上の波をフーリエ変換してパワースペクトル(周波数分布)を求める。

In [None]:
spec = np.fft.fft(wave)

#plot the spectrum
plt.xlim(0,3000)
plt.plot(np.abs(spec)**2)

合成した波の成分に戻すことができた。ここでは音声データを分解したが、波データであれば光であれ音声であれ、こうしてスペクトルにに変換できる。

# Timpani (circular membrane modes)
膜の振動は、共鳴的ではない。固有振動が無理数比の成分を含み、濁った音になる。

基底音の周波数を120 Hzとする。

In [None]:
time = np.linspace(0, 5, 20000*5)
phase = time * 120 * 2*pi
decay = np.exp(-time / 0.5)

wave = np.sin(phase)
# 倍音の強度はてきとう。
wave += (1/2)**0.5*np.sin(1.59*phase)
wave += (1/3)**0.5*np.sin(2.14*phase)
wave += (1/4)**0.5*np.sin(2.30*phase)
wave += (1/3)**0.5*np.sin(2.65*phase)
wave += (1/6)**0.5*np.sin(2.92*phase)
wave += (1/7)**0.5*np.sin(3.16*phase)
wave += (1/8)**0.5*np.sin(3.50*phase)
wave += (1/9)**0.5*np.sin(3.60*phase)

#plot the wave
plt.xlim(0,0.02)
plt.plot(time, wave*decay)


Audio(wave*decay, rate=20000)

In [None]:
# waveは5秒のデータ
spec = np.fft.fft(wave)
spec = spec[:3000]

#plot the spectrum
# データが5秒分ある場合、波数の最小目盛は1/5波数となる。
wavenumbers = np.arange(0, 600, 1/5)
plt.plot(wavenumbers, np.abs(spec)**2)

## 宿題

sampleaudio.wav (長さ1秒、サンプリング周波数20000 Hz)に含まれる音の基底振動数を調べよ。

wavファイルを読みこむには、`soundfile`モジュールを使うと便利。 (https://stackoverflow.com/questions/34416283/how-to-properly-decode-wav-with-python)

* Anacondaでsoundfileを使えるようにし、kernelを再起動する。

In [None]:
import soundfile as sf
wave, samplerate = sf.read("sampleaudio.wav")

Audio(wave, rate=samplerate)