AIO3_GPT_baseline

AI王〜クイズAI日本一決定戦〜
昨年度の概要はこちら

環境構築

まず、以下のコマンドで本リポジトリをクローンしてください。

$ git clone https://github.com/cl-tohoku/AIO3_GPT_baseline.git
$ cd AIO3_GPT_baseline

以下のコマンドでdataディレクトリとworkディレクトリ、modelsディレクトリを作成してください。

$ mkdir data
$ mkdir work
$ mkdir models

Dockerコンテナの起動

以下のコマンドによってDockerコンテナを起動します

$ docker image build --tag aio3_gpt:latest .
$ docker container run --name gpt_baseline \
  --rm \
  --interactive \
  --tty \
  --gpus all \
  --mount type=bind,src=$(pwd),dst=/code/AIO3_GPT_baseline \
  aio3_gpt:latest \
  bash

データセット

訓練データには、クイズ大会「abc/EQIDEN」の過去問題に対して Wikipedia の記事段落の付与を自動で行ったものを使用しています。
開発・評価用クイズ問題には、株式会社キュービックおよびクイズ法人カプリティオへ依頼して作成されたものを使用しています。
以上のデータセットの詳細については、AI王〜クイズAI日本一決定戦〜の公式サイト、および下記論文をご覧下さい。

JAQKET: クイズを題材にした日本語QAデータセット

https://www.nlp.ecei.tohoku.ac.jp/projects/jaqket/

鈴木正敏, 鈴木潤, 松田耕史, ⻄田京介, 井之上直也. JAQKET:クイズを題材にした日本語QAデータセットの構築. 言語処理学会第26回年次大会(NLP2020) [PDF]

開発用データ

主に以下に示した要素からなるjson lines形式のファイルになっています。

qid: 問題インデックス
number: 整数型の問題インデックス
question: 質問
answers: 答えのリスト

{
  "qid": "AIO02-0002", 
  "competition": "第2回AI王", 
  "section": "開発データ問題",
  "number": 2, 
  "question": "氷った海に穴を開けて漁をすることから、漢字で「氷の下の魚」と書くタラ科の魚は何?",
  "answers": ["コマイ"]
  }

テスト用データ

第3回コンペティションのリーダーボード投稿用テストデータは下記よりダウンロードできます。

リーダーボード投稿用テストデータ

テストデータは，質問 ID ( qid ) と問題文 ( question ) のみを含んだ下記のような JSON Lines (jsonl) 形式になっています。

{"qid": "AIO02-1001", "question": "全長は約10.9km。アメリカの国道1号線の一部である、フロリダ・キーズの島々を結ぶ橋の名前は何?"}

{"qid": "AIO02-1002", "question": "コロイド溶液に光を通した時、光の散乱によって道筋が見える、という現象を、発見者にちなんで何現象という?"}

日本語GPTモデルによるzero-shot推論

以下のコードを実行することでrinna株式会社の日本語GPTモデルによるzero-shot推論を行うことができます。

開発用データ

#実行例
$ python eval_model_jsonl.py path/to/eval_file.jsonl --output_file work/model_answer.csv

テスト用データ

以下のコードを実行することでリーダーボードに投稿できる形式の解答ファイルを出力できます。

#実行例
$ python eval_model_jsonl_unlabel.py path/to/eval_file.jsonl --output_file work/model_answer.jsonl --save_model

Accuracy

第二回の開発データ1000問を予測した際の正解率 (Exact Match)

データ	Acc
評価セット	31.6

最終提出

最終提出の際はDockerイメージを提出する必要があります。その際、以下のコマンドで実行可能な推論スクリプトsubmission.shを含む必要があります。

bash ./submission.sh <input_file> <output_file>

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
.gitignore		.gitignore
Dockerfile		Dockerfile
README.md		README.md
eval_model_jsonl.py		eval_model_jsonl.py
eval_model_jsonl_unlabel.py		eval_model_jsonl_unlabel.py
requirements.txt		requirements.txt
submission.sh		submission.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AIO3_GPT_baseline

目次

環境構築

Dockerコンテナの起動

データセット

開発用データ

テスト用データ

日本語GPTモデルによるzero-shot推論

開発用データ

テスト用データ

最終提出

About

Releases

Packages

Languages

cl-tohoku/AIO3_GPT_baseline

Folders and files

Latest commit

History

Repository files navigation

AIO3_GPT_baseline

目次

環境構築

Dockerコンテナの起動

データセット

開発用データ

テスト用データ

日本語GPTモデルによるzero-shot推論

開発用データ

テスト用データ

最終提出

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages