wake_up

基于DNN神经网络的简单语音唤醒

关键词：“hello，小瓜”

运行要求：

程序会录制四段音频，每段三秒，存在wav文件夹下。
HCopy函数会提取文件FBANK特征值，存在feature文件夹下。
使用Python调用matlab模块（MATLAB中提供了供python调用的模块，这也是为什么要安装MATLAB的原因）读取.fbank文件并扩展，存在feature-translated文件夹下。
最后网络从feature-translated文件夹下的文档中读取文件。

在特征提取后进行了一个拼帧的操作，由于“hello”和“小瓜”这两个词都会持续一段时间，由于一帧的时间太短，所以采用拼帧操作是时间延长。对于每一帧向前取30帧向后取10帧（对于前面的补足30帧和后面不足10帧的进行补零操作），将这41帧作为一组数据喂入神经网络。
在神经网络网络方面，选用的是两层的全连接神经网络，隐藏层的节点个数为128
config.cfg和wav.scp为HTK提取特征时所需要的特征文件。关于HTK提的介绍可以观看HTK官网
文件名为2.*的几个文件为tensorflow的文件，用于记录已经训练好的网络的权重、偏差、变量等信息。

唤醒的延迟过长，主要是由于多次存取以及调用matlab，消耗的时间会有些长。

Name		Name	Last commit message	Last commit date
Latest commit History 24 Commits
feature-translated		feature-translated
feature		feature
output audio		output audio
wav		wav
2.data-00000-of-00001		2.data-00000-of-00001
2.index		2.index
2.meta		2.meta
README.md		README.md
checkpoint		checkpoint
config.cfg		config.cfg
wake_up.py		wake_up.py
wake_up.spec		wake_up.spec
wav.scp		wav.scp