Skip to content
master
Switch branches/tags
Code

Latest commit

 

Git stats

Files

Permalink
Failed to load latest commit information.
Type
Name
Latest commit message
Commit time
 
 
src
 
 
 
 
 
 
 
 

言葉の森

明治大学の総合コンテンツ製作サークル(CCC)にて作成した音声認識型メディアアート。

Google Speech APIを使って音声認識を実現しました。

Node.js製のCLIアプリを録音用と音声認識用に2つ。音声認識で得られたテキストをProcessingから読み取って、エフェクトを再生するという構成となっています。

反応する単語を含んだ文章を読み取らせると対応したエフェクトを表示します。

反応するもの以外の単語を読み取らせると、Wikipediaから規定の文字数だけ説明を読み取って表示します。

macOSでのみ動作します。

動作環境

  1. Node.js がインストール済み
  2. Homebrew がインストール済み
  3. SoX を Homebrew にてインストール済み

インストール方法

npm install

git cloneをしてプロジェクトのディレクトリで下記のコマンドを順に実行します。

$ cd src
$ npm install

リソースの配置

data.zip/src/effects/へダウンロードして解凍してください。 /effects以下のディレクトリ構造が以下のようになっていれば準備完了です。

effects
├── Dictionary.pde
├── Effect.pde
├── HeavyRain.pde
├── Rain.pde
├── Recording.pde
├── Ripple.pde
├── STFlow.pde
├── Snow.pde
├── Time.pde
├── data
│   ├── NotoSansCJKjp-Bold.otf
│   ├── SE1.mp3
│   ├── ts
│   └── 波
│       ├── 波_00000.png
│       ~
│       └── 波_00119.png
└── effects.pde

サービスアカウントキーの配置

Google Cloud Platformからサービスアカウントキーを/src以下にapp-credentials.jsonとして配置します。

配置が完了し、起動準備が完了していると、/src以下のディレクトリは下記のようになります。

src
├── app-credentials.json
├── data
│   ├── request.rq
│   └── voice.raw
├── effects
│   ~
├── node_modules
│   ~
├── package-lock.json
├── package.json
├── recorder.js
└── transcriptor.js

動作手順

CUIアプリの起動

  1. shellを起動してウィンドウもしくはタブを2つ作ります。
  2. $ cdコマンドで両方のカレントディレクトリを/srcへ移動します。
  3. 片方のウィンドウに$ node recorder.jsを入力して、recorderを起動します。
  4. もう片方のウィンドウに$ node transcriptor.jsを入力してtranscriptorを起動します。

「Start watcing ~ file」とそれぞれのウィンドウに表示されればCUIアプリは起動完了です。

アプリの終了は^Cです。

Processingアプリの起動

  1. src/effects/effects.pdeをProcessingで開き、実行

操作手順

Processingアプリ上でスペースキーを押すことで録音が開始されます。

うまく認識されない時はスペースを押した後少ししてから話し始めるようにすると認識される場合があります。

LICENSE

MIT

About

明大祭2018にて総合コンテンツ製作サークル(CCC)として作成した音声認識型メディアアート

Topics

Resources

License

Releases

No releases published

Packages

No packages published