Skip to content

r2en/voice-recognition

Repository files navigation

Voice_Recognition 音声認識

OS : OSX Yosemite ver.10.10.5

Python : Python 2.7.13

Python Module Library:pyaudio,numpy, pylab, SPTK, gnuplot, scipy, sklearn, librosa

※ python2系と3系ではfp.read()などの戻り値の型が異なる為、2系を推奨

現在の環境

OS : OSX Sierra ver.10.12.6

Python: Python 3.6.0 :: Anaconda 4.3.1 (x86_64)

Install: 導入

音声加工分離ライブラリ

LibROSA インストールガイド

Reseach: 基礎研究

・Voise Signal Processing[音声信号処理]

音声波形、フーリエ変換やケプストラム分析、線形予測分析等の音声認識基幹技術を調査しているページ


・SPTK
基礎: フーリエ変換やリサンプリング等、音声信号処理や音声認識など豊富なコマンドが用意されている。


・LibROSA

応用: MIR(音楽情報検索)を意識し、音楽分析や加工分離を得意としている。より実用的な位置にいる。ビジネスになりそうなものが多く用意されている。2015年にリリースされた。


Paper: 論文リスト

音声認識関連の論文


Development: 実装

周波数分析

音楽情報検索

統計的性質変換

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages