# Emo-DBをロードする

- Emo-DBをロードするプログラム
- 要求: 2個上の階層にdownload(Emo-DBが管理されてるディレクトリ)
- return: Emo-DBのwavとラベル(話者や感情の情報込み)のセット

In [None]:
import numpy as np
import librosa
import librosa.display
import audeer
import wave
import os
import matplotlib.pyplot as plt
import audformat
import soundfile as sf
import audiofile as af
%matplotlib inline

## 前準備

In [None]:
#音声ファイルをロードするメソッド
def load_wave_data(audio_dir, file_name):
    file_path = os.path.join(audio_dir, file_name)
    x, fs = librosa.load(file_path, sr=16000)
    return x, fs

In [None]:
#ファイル名から特定の情報を返すメソッド
def parse_names(names, from_i, to_i, is_number=False, mapping=None):
    for name in names:
        key = name[from_i:to_i]
        if is_number:
            key = int(key)
        yield mapping[key] if mapping else key

In [None]:
# wavがあるディレクトリへのpath
Emo_DB_dir = '../../download/wav/'

In [None]:
# wavファイル1つ1つへのpath
files = sorted([os.path.join(Emo_DB_dir, f) for f in os.listdir(Emo_DB_dir)])

In [None]:
# 拡張子と絶対パスを除いたファイル名
names = [audeer.basename_wo_ext(f) for f in files]

In [None]:
male = audformat.define.Gender.MALE
female = audformat.define.Gender.FEMALE
language = audformat.utils.map_language('de')

In [None]:
# ファイル名と話者の間のディクショナリ
speaker_mapping = {
    3: {'gender': male, 'age': 31, 'language': language},
    8: {'gender': female, 'age': 34, 'language': language},
    9: {'gender': female, 'age': 21, 'language': language},
    10: {'gender': male, 'age': 32, 'language': language},
    11: {'gender': male, 'age': 26, 'language': language},
    12: {'gender': male, 'age': 30, 'language': language},
    13: {'gender': female, 'age': 32, 'language': language},
    14: {'gender': female, 'age': 35, 'language': language},
    15: {'gender': male, 'age': 25, 'language': language},
    16: {'gender': female, 'age': 31, 'language': language},
}

In [None]:
# ファイル名と感情ラベルの間のディクショナリ
emotion_mapping = {
    'W': 'Anger',
    'L': 'Boredom',
    'E': 'Disgust',
    'A': 'Fear',
    'F': 'Happiness',
    'T': 'Sadness',
    'N': 'Neutral',
}

In [None]:
# ファイルごとの話者
speakers = list(parse_names(names, from_i=0, to_i=2, is_number=True))

In [None]:
# ファイルごとの感情ラベル
emotions = list(parse_names(names, from_i=5, to_i=6, mapping=emotion_mapping))

In [None]:
dataset = []
for file, speaker, emotion in zip(files, speakers, emotions):
    x, fs = librosa.load(file, sr=16000)
    dataset.append([x, emotion, speaker])