Skip to content

verypluming/JapaneseNLI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

JapaneseNLI

Google Colabで日本語テキスト推論を試す

概要

含意関係認識(Recognizing Textual Entailment, RTE)または自然言語推論・テキスト推論(Natural Language Inference)は、以下の例のように、ある前提文に対して仮説文が推論できるか否かを判定する自然言語処理のタスクです。

前提文: 太郎は花子が山頂まで登っている間に、山頂まで登った。
仮説文: 太郎は花子が山頂まで登る前に、山頂まで登った。 
正解ラベル: 含意 (entailment)

前提文: 太郎は花子が山頂まで登る前に、山頂まで登った。 
仮説文: 太郎は花子が山頂まで登っている間に、山頂まで登った。
正解ラベル: 非含意 (neutral)

前提文: 太郎は花子が山頂まで登る前に、山頂まで登った。
仮説文: 太郎は花子が山頂まで登った後に、山頂まで登った。 
正解ラベル: 矛盾 (contradiction)

JapaneseBERT_NLI.ipynb: TransformersライブラリのBERTとGoogle Colabを用いて日本語テキスト推論を試せるコードです。

JapaneseXLM_NLI.ipynb: TransformersライブラリのXLMとGoogle Colabを用いて日本語テキスト推論を試せるコードです。

学習データの用意

ファインチューニング用の学習データがある場合は、一行目はタブ区切りでpremise, hypothesis, gold_labelと記述し、二行目以降にタブ区切りで前提文、仮説文、正解ラベル(entailment, contradiction, neutralの3値)が書かれたtrain.tsvファイルを用意して、Google Driveにアップロードしてください。 train.tsvのサンプル

Contact

Hitomi Yanaka hitomi.yanaka@riken.jp

License

Apache License

About

Google Colabで日本語テキスト推論を試す

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published