In [9]:
import librosa
import numpy as np
import os
import math
from sklearn.cluster import KMeans
import hmmlearn.hmm
import pickle

In [10]:
models = pickle.load(open('hmm_models.sav', 'rb'))
kmeans = pickle.load(open('kmeans.sav', 'rb'))

In [13]:
# read file
def get_mfcc(file_path):
    y, sr = librosa.load(file_path) # read .wav file
    hop_length = math.floor(sr*0.010) # 10ms hop
    win_length = math.floor(sr*0.025) # 25ms frame
    # mfcc is 12 x T matrix
    mfcc = librosa.feature.mfcc(
        y, sr, n_mfcc=12, n_fft=1024,
        hop_length=hop_length, win_length=win_length)
    # substract mean from mfcc --> normalize mfcc
    mfcc = mfcc - np.mean(mfcc, axis=1).reshape((-1,1)) 
    # delta feature 1st order and 2nd order
    delta1 = librosa.feature.delta(mfcc, order=1)
    delta2 = librosa.feature.delta(mfcc, order=2)
    # X is 36 x T
    X = np.concatenate([mfcc, delta1, delta2], axis=0) # O^r
    # return T x 36 (transpose of X)
    return X.T # hmmlearn use T x N matrix

In [11]:
# lấy mfcc của tất cả các file wav trong wav
def get_class_data(data_dir):
    files = os.listdir(data_dir)
    mfcc = [get_mfcc(os.path.join(data_dir,f)) for f in files if f.endswith(".wav")]
    return mfcc

In [15]:
testset1 = {}
n_test1 = {}
class_names = ['bệnh nhân', 'chúng ta', 'có thể', 'người','Việt Nam']
for cname in class_names:
    print(f"Load {cname} test")
    testset1[cname] = get_class_data(os.path.join('test',cname+'_test'))
    n_test1[cname] = len(testset1[cname])

Load bệnh nhân test
Load chúng ta test
Load có thể test
Load người test
Load Việt Nam test


In [16]:
for cname in class_names:
    testset1[cname] = list([kmeans.predict(v).reshape(-1, 1) for v in testset1[cname]])

In [17]:
print("Testing")
n_correct1 = {'bệnh nhân': 0, 'chúng ta': 0, 'có thể': 0, 'người': 0,'Việt Nam': 0}
for true_cname in class_names:
    for O in testset1[true_cname]:
        score = {cname: model.score(O, [len(O)]) for cname, model in models.items()}
        if (true_cname == max(score, key=score.get)): n_correct1[true_cname] += 1
        print(true_cname, score, 'predict:', max(score, key=score.get))

Testing
bệnh nhân {'bệnh nhân': -85.01895072882863, 'chúng ta': -116.89227689303209, 'có thể': -145.5429951589105, 'người': -79.12924074435324, 'Việt Nam': -105.07484469037391} predict: người
bệnh nhân {'bệnh nhân': -68.56648775916136, 'chúng ta': -135.8658249915291, 'có thể': -145.92926637729198, 'người': -109.12223911501658, 'Việt Nam': -130.38131951425976} predict: bệnh nhân
bệnh nhân {'bệnh nhân': -57.163946179657664, 'chúng ta': -184.1771335088101, 'có thể': -126.65149206275542, 'người': -80.46311942385488, 'Việt Nam': -76.78814830780043} predict: bệnh nhân
bệnh nhân {'bệnh nhân': -80.41844963773977, 'chúng ta': -185.13929588212147, 'có thể': -146.46293056268, 'người': -112.6877792505747, 'Việt Nam': -190.7548103572772} predict: bệnh nhân
bệnh nhân {'bệnh nhân': -64.49725977557267, 'chúng ta': -132.75405520685666, 'có thể': -103.81233439400432, 'người': -167.05841916754355, 'Việt Nam': -85.70916966073456} predict: bệnh nhân
chúng ta {'bệnh nhân': -1613.4628264667938, 'chúng ta': -

In [18]:
for cname in class_names:
    print('Accuracy:', cname, n_correct1[cname]/n_test1[cname])

Accuracy: bệnh nhân 0.8
Accuracy: chúng ta 0.8333333333333334
Accuracy: có thể 0.8
Accuracy: người 1.0
Accuracy: Việt Nam 1.0


In [19]:
print(n_test1)

{'bệnh nhân': 5, 'chúng ta': 6, 'có thể': 5, 'người': 5, 'Việt Nam': 6}
