## ライブラリのインストール

In [1]:
import librosa
import matplotlib.pyplot as plt
import numpy as np
import soundfile as sf

### 波形データの読み込みと表示

In [6]:
x, sr = librosa.load("data/piano_sample.wav")
print(x.shape, sr)  # data size, sampling rate

(84928,) 22050


In [None]:
librosa.display.waveshow(x)
plt.show()

### 時間周波数解析

In [None]:
X = librosa.stft(x)
Xdb = librosa.amplitude_to_db(abs(X))
librosa.display.specshow(Xdb, sr=sr, x_axis="time", y_axis="hz")
plt.show()

### オンセットエンベロープを求める
エンベロープ: 音が鳴り始めてから消えるまでの音量，音色の時間的変化を表す

In [None]:
hop_length = 100
onset_env = librosa.onset.onset_strength(y=x, sr=sr, hop_length=hop_length)
plt.plot(onset_env)
plt.xlim(0, len(onset_env))
plt.show()

### オンセット時刻を求める

In [None]:
onset_samples = librosa.onset.onset_detect(
    y=x,
    sr=sr,
    units="samples",
    backtrack=False,
    pre_max=20,
    post_max=20,
    pre_avg=100,
    post_avg=100,
    delta=0.2,
    wait=0,
)
print(onset_samples)

In [None]:
onset_boundaries = np.concatenate([[0], onset_samples, [len(x)]])
onset_times = librosa.samples_to_time(onset_boundaries, sr=sr)
print(onset_times)

### 音声波形にオンセット位置を表示

In [None]:
librosa.display.waveshow(x)
plt.vlines(onset_times, -1, 1, color="r")
plt.show()

In [2]:
def estimate_pitch(segment, sr, fmin=50.0, fmax=1000.0):
    r = librosa.autocorrelate(segment)
    i_min = sr / fmax
    i_max = sr / fmin
    r[: int(i_min)] = 0
    r[int(i_max) :] = 0
    i = r.argmax()
    f0 = float(sr) / i
    return f0


def generate_sine(f0, sr, n_duration):
    n = np.arange(n_duration)
    return 0.2 * np.sin(2 * np.pi * f0 * n / float(sr))

In [3]:
def estimate_pitch_and_generate_sine(x, onset_samples, i, sr):
    n0 = onset_samples[i]
    n1 = onset_samples[i + 1]
    f0 = estimate_pitch(x[n0:n1], sr)
    return generate_sine(f0, sr, n1 - n0)

In [None]:
y = np.concatenate(
    [
        estimate_pitch_and_generate_sine(x, onset_boundaries, i, sr)
        for i in range(len(onset_boundaries) - 1)
    ]
)
sf.write("piano_sample_gen.wav", y, sr, "PCM_24", endian="LITTLE")
Y = librosa.stft(y)
Ydb = librosa.amplitude_to_db(abs(Y))
librosa.display.specshow(Ydb, sr=sr, x_axis="time", y_axis="hz", cmap="coolwarm")
plt.show()