Skip to content
No description, website, or topics provided.
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
src
.gitignore
LICENSE.md
README.md

README.md

NMT2016

ニューラル機械翻訳(Bahdanau et al., 2015)の実装
RNNの各ユニットはLSTMで構成

1. 事前準備

  • Python 3.4.x
  • chainer (>ver 1.16)
  • hdf5
  • gensim (>ver 0.13.3)

2. モデルのトレーニング

translate.shの環境変数でパスを指定。()内の実行時オプションでも指定可。

  • MODE (-a)
  • SOURCE_FILE (-s)
  • TARGET_FILE (-o)
  • MODEL_DIR (-m)

MODE: train
SOURCE_FILE: 原言語コーパス
TARGET_FILE: 目的言語コーパス
MODEL_DIR: モデルを保存するためのディレクトリ

SOURCE_FILEとTARGET_FILEに含まれる文は、以下のような単語分割済みかつ1行1文であること。  

例  
私 は 日本人 です 。
I am Japanese .

モデルは各エポックごとにMODEL_DIRに'ファイル名.エポック数'で書き込まれる(デフォルトのファイル名は'epoch')。
GPUを用いない場合(USE_GPU=0)、学習にかなりの時間を要します。
上記の変数を指定したのち、./translate.shを実行で学習開始。

3. テスト

translate.shの環境変数でパスを指定。()内の実行時オプションでも指定可。

  • MODE (-a)
  • SOURCE_FILE (-s)
  • OUTPUT_FILE (-o)
  • MODEL_DIR (-m)
  • MODEL_NUM (-n)

MODE: test
OUTPUT_FILE: 出力を書き込むファイル
MODEL_DIR: モデルを読み込むディレクトリ
MODEL_NUM: エポック数

SOURCE_FILEに含まれる文は、以下のような単語分割済みかつ1行1文であること。 

私 は 日本人 です 。

OUTPUT_FILEには、単語分割された文が出力されます。  

I am Japanese .

上記の変数を指定したのち、./translate.shを実行でテスト開始。

You can’t perform that action at this time.