Skip to content
明大祭2018にて総合コンテンツ製作サークル(CCC)として作成した音声認識型メディアアート
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
.vscode
src
.gitignore
LICENSE
README.md
package-lock.json

README.md

言葉の森

明治大学の総合コンテンツ製作サークル(CCC)にて作成した音声認識型メディアアート。

Google Speech APIを使って音声認識を実現しました。

Node.js製のCLIアプリを録音用と音声認識用に2つ。音声認識で得られたテキストをProcessingから読み取って、エフェクトを再生するという構成となっています。

反応する単語を含んだ文章を読み取らせると対応したエフェクトを表示します。

反応するもの以外の単語を読み取らせると、Wikipediaから規定の文字数だけ説明を読み取って表示します。

macOSでのみ動作します。

動作環境

  1. Node.js がインストール済み
  2. Homebrew がインストール済み
  3. SoX を Homebrew にてインストール済み

インストール方法

npm install

git cloneをしてプロジェクトのディレクトリで下記のコマンドを順に実行します。

$ cd src
$ npm install

リソースの配置

data.zip/src/effects/へダウンロードして解凍してください。 /effects以下のディレクトリ構造が以下のようになっていれば準備完了です。

effects
├── Dictionary.pde
├── Effect.pde
├── HeavyRain.pde
├── Rain.pde
├── Recording.pde
├── Ripple.pde
├── STFlow.pde
├── Snow.pde
├── Time.pde
├── data
│   ├── NotoSansCJKjp-Bold.otf
│   ├── SE1.mp3
│   ├── ts
│   └── 波
│       ├── 波_00000.png
│       ~
│       └── 波_00119.png
└── effects.pde

サービスアカウントキーの配置

Google Cloud Platformからサービスアカウントキーを/src以下にapp-credentials.jsonとして配置します。

配置が完了し、起動準備が完了していると、/src以下のディレクトリは下記のようになります。

src
├── app-credentials.json
├── data
│   ├── request.rq
│   └── voice.raw
├── effects
│   ~
├── node_modules
│   ~
├── package-lock.json
├── package.json
├── recorder.js
└── transcriptor.js

動作手順

CUIアプリの起動

  1. shellを起動してウィンドウもしくはタブを2つ作ります。
  2. $ cdコマンドで両方のカレントディレクトリを/srcへ移動します。
  3. 片方のウィンドウに$ node recorder.jsを入力して、recorderを起動します。
  4. もう片方のウィンドウに$ node transcriptor.jsを入力してtranscriptorを起動します。

「Start watcing ~ file」とそれぞれのウィンドウに表示されればCUIアプリは起動完了です。

アプリの終了は^Cです。

Processingアプリの起動

  1. src/effects/effects.pdeをProcessingで開き、実行

操作手順

Processingアプリ上でスペースキーを押すことで録音が開始されます。

うまく認識されない時はスペースを押した後少ししてから話し始めるようにすると認識される場合があります。

LICENSE

MIT

You can’t perform that action at this time.