TensorFlow 2でTCN(Temporal Convolutional Network)を使って音を分類するNotebook集です。
以下のように、大きく2部構成に分けています。
教育と評価に使う音声データを作成し、TensorFlowで扱いやすいデータ形式に編集し、TCNモデルの教育と検証を行っています。
ランダムに作成した音に対する、人間(私)と学習済みモデルとの聞き分け対決です。
私の予測結果は、事前にテキストファイルで作成しています。
動作環境はDocker(Docker Compose)で作成できるようにしています。(GPUの使用を前提)
また、各Notebookでは乱数シードを固定して可能な限り同じ結果になるようにしていますが、TensorFlowの仕様により、GPUを利用している部分については同じ結果にはなりません。そのため、学習時の各エポック単位の結果が異なる点はご了承ください。