<a href="https://colab.research.google.com/github/unoki/colabtest/blob/master/3_heartbeat_sounds.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# 第３章　音声ファイルの取り扱いと可視化

第３章では、音声ファイル（wav形式）の読み込み方法と、可視化のテクニックについて学びます。
Pythonで音声ファイルを読み込む方法は、数多くあります。ここでは、次の２つのライブラリによる方法を実行します。

1. SciPy (https://docs.scipy.org/doc/scipy/reference/)
    - 高水準の科学技術計算パッケージ
    - 統計、線形代数、信号処理、FFTなど、多くの機能がふくまれています。


2. LibROSA　(https://librosa.github.io/librosa/index.html)
    - 音楽と音声の解析のためのパッケージ
    - テンポとビートを推定する機能があります。テンポやビートは、ニューラルネットワークの特徴量として利用することができます。


また、本章では特定のフォルダのファイルをまとめて読み込み、可視化をするテクニックについても紹介します。

<br>
** WAV ( https://ja.wikipedia.org/wiki/WAV )
<br><br>

### 学習項目

1. 準備
2. SciPyによるデータの読み込みと確認
3. LibROSAによるデータの読み込みと確認
4. フォルダー内のファイルをまとめて可視化
5. Matplotlibの二つの記法


### 使用するファイル
- 3_heartbeat-sounds.ipynb （このファイルです）
- data/heartbeat/フォルダー以下、複数のwavファイル(音声データファイル)

### データセット

- 「Classifying Heart Sounds Challenge」は、2012年に開催されたデータ分析コンペです。コンペの課題の一つは心音の分類でした。(http://www.peterjbentley.com/heartchallenge/) 
- 本章では、Classifying Heart Sounds Challengeで使用されたデータ（812ファイル）のうちの一部の抜粋し、使用します。
- データは、iStethoscope ProというiPhoneアプリで取得した心音です。
- １秒から30秒までの異なる長さのwav形式の音声ファイルです。


　※Bentley, P. and Nordehn, G. and Coimbra, M. and Mannor, S.,"The PASCAL Classifying Heart Sounds Challenge 2011 (CHSC2011) Results", 


# 1. 準備
###  必要なライブラリの読み込み

- NumPy：グラフの軸の値の設定などに使用します。
- os：ファイル名の取得に使用します。OSに依存している機能を利用するためのモジュールです。
- glob：ファイル名の取得に利用します。ワイルドカードや正規表現を使ってファイルの検索ができます。
- Matplotlib：データの可視化に使用します。
- SciPy：音声ファイルの取り込みに利用します。SciPyのioパッケージに含まれるwavfileモジュールを使用します。
- LibROSA：音声ファイルの取り込みに利用します。

In [0]:
import numpy as np
import os
from glob import glob 

from scipy.io import wavfile
import librosa as lr

import matplotlib.pyplot as plt
import matplotlib as mpl

### グラフのデフォルト表示サイズの変更

In [0]:
mpl.rcParams['figure.figsize'] = 12, 4

### カレントディレクトリの移動

In [0]:
from google.colab import drive
drive.mount('/gdrive')
%cd "/gdrive/My Drive/Colab Notebooks/jasla_rensyuu_20190202"

# 2. SciPyによるデータの読み込みと確認

### wavファイルの読み込み

- scipy.ioパッケージに含まれるwavfileモジュールを使って、wavファイルを読み込みまましょう。
- read関数の引数にファイル名を指定します。
- 戻り値は、サンプルレートと、numpy array形式の数値データです。

( https://docs.scipy.org/doc/scipy/reference/generated/scipy.io.wavfile.read.html#scipy.io.wavfile.read )

In [0]:
rate, data = wavfile.read('data/heartbeat/extrahls__201102241217.wav')

In [0]:
rate

In [0]:
data.shape

### グラフを表示

- matplotlibのplot関数を使います。
- plot関数は、第１引数のデータがx軸に、第２引数のデータがy軸となります。第1引数を省略した場合には0から一連の番号がつきます。
( https://matplotlib.org/api/_as_gen/matplotlib.pyplot.plot.html#matplotlib.pyplot.plot )

In [0]:
plt.plot(data)

- 横軸の単位を「秒」にしてみましょう。データの位置をサンプルレートで割ることで秒に変換ができます。
- タイトルや、軸のラベルも表示してみましょう。

In [0]:
sec = np.arange(0, len(data)) / rate

plt.title('extrahls__201102241217')
plt.xlabel('Time (s)')
plt.ylabel('Amplitude')
plt.plot(sec, data)

# 3. LibROSAによるデータの読み込みと確認

### wavファイルの読み込み

- load関数を使って、wavファイルを読み込みましょう。
- load関数の引数にファイル名を指定します。
- srは、サンプルレートを指定するパラメータです。元のファイルのサンプリングレートで出力するためにsrパラメータにNoneを指定します。デフォルトは22050で、デフォルトのままではダウンサンプリングがされてしまいます。
- 戻り値は、numpy array形式の数値データと、サンプルレートです。wavfile.readとは順番が異なることに注意が必要です。

( https://librosa.github.io/librosa/generated/librosa.core.load.html )

In [0]:
audio, sfreq = lr.load('data/heartbeat/extrahls__201102241217.wav',  
                       sr=None)

### グラフを表示

- matplotlibのplot関数を使います。
- 横軸の単位を「秒」にしてみましょう。

In [0]:
sec = np.arange(0, len(audio)) / sfreq

plt.title('extrahls__201102241217')
plt.xlabel('Time (s)')
plt.ylabel('Amplitude')
plt.plot(sec, audio)

### wavファイルの一部分だけ読み込む

- load関数は、offsetパラメータで読み込み開始位置を指定できます。
- durationパラメータで読み込む長さを指定できます。
- load関数の引数に、読み出しの位置と範囲を指定してみましょう。

In [0]:
offset = 2.15
duration = 0.2
audio, sfreq = lr.load('data/heartbeat/extrahls__201102241217.wav',  
                       sr=None, 
                       offset=offset, 
                       duration=duration)

In [0]:
sec = np.arange(0, len(audio)) / sfreq + offset

plt.title('extrahls__201102241217')
plt.xlabel('Time (s)')
plt.ylabel('Amplitude')
plt.plot(sec, audio)

# 4. フォルダー内のファイルをまとめて可視化


### wavファイルのリストを作成

- globモジュールを使うと、ワイルドカードや正規表現を使って条件を満たすファイル名の一覧を取得できます。
- wavファイルのリストを作ってみましょう。

In [0]:
files = glob('data/heartbeat/*.wav')

- glob関数で取得したwavファイルの数を確認してみましょう。
- len関数により、リストの要素数を取得できます。
- 後で利用できるように、変数nにファイル数を代入しておきます。

In [0]:
n = len(files)

### まとめて可視化

### グラフタイトルのための準備

- ファイル名を各表のタイトルに使いましょう。
- os.path.basenameを使うと、ファイル名だけ取り出すことができます。
- 拡張子「.wav」を削除するため、各ファイル名の最後の4文字をスライスで取り除きます。

In [0]:
### os.path.basename(files[0])[:-4]
os.path.basename(files[1])

 ### subplotでグラフ表示
- plt.subplotを使うと、一つの図に複数のグラフをまとめることができます。
- subplot関数のパラメータに、(行数, 列数, 何番目か)を指定します。カンマを省略することもできます。
- plt.subplot(2, 1, 1) と plt.subplot(211) は同じ意味になります。
- subplots_adjust関数を使うと、グラフ間の隙間を調整することができます。（デフォルト値は、0.2インチ）

In [0]:
plt.figure(figsize = (15, 15))
plt.subplots_adjust(wspace=0.3, hspace=0.3) # デフォルト0.2
for i in range(n):
    rate, data = wavfile.read(files[i])
    sec = np.arange(0, len(data)) / rate
    plt.subplot(n//4+1, 4, i+1)
    plt.plot(sec, data)
    plt.title(os.path.basename(files[i])[:-4])

# 5. Matplotlibの二つの記法


### 「オブジェクト指向API」 vs 「Pyplot」

matplotlibにはグラフを作る際に二つの記法（流儀）があります。
一つのプログラムでこれら二つが混在して使われていることも多く、初心者が混乱する原因になっています。
本セミナーでは、後者を採用しています。確認をしながらインタラクティブに表示をする場合、後者が便利です。

- オブジェクト指向インターフェース
    - 「fig, ax = plt.subplots()」 などでオブジェクトを作成し、その後「ax.plot()」などを使う記法です。

- Pyplotインターフェース
    - 「plt.xxx」ですべて記述します。MATLABをまねた記法です。
    - current figureやcurrent axesと呼ばれるオブジェクトが自動で作成されます。


※（参考)
[A note on the Object-Oriented API vs Pyplot](https://matplotlib.org/tutorials/introductory/lifecycle.html#a-note-on-the-object-oriented-api-vs-pyplot/)

### オブジェクト指向APIを使った例

In [0]:
rate, data = wavfile.read('data/heartbeat/extrahls__201102241217.wav')
sec = np.arange(0, len(data)) / rate

fig, ax = plt.subplots()
ax.set_title('extrahls__201102241217')
ax.plot(sec, data) 