Skip to content

cl-tohoku/AIO3_GPT_baseline

Repository files navigation

AIO3_GPT_baseline

目次

環境構築

  • まず、以下のコマンドで本リポジトリをクローンしてください。
$ git clone https://github.com/cl-tohoku/AIO3_GPT_baseline.git
$ cd AIO3_GPT_baseline
  • 以下のコマンドでdataディレクトリとworkディレクトリ、modelsディレクトリを作成してください。
$ mkdir data
$ mkdir work
$ mkdir models

Dockerコンテナの起動

  • 以下のコマンドによってDockerコンテナを起動します
$ docker image build --tag aio3_gpt:latest .
$ docker container run --name gpt_baseline \
  --rm \
  --interactive \
  --tty \
  --gpus all \
  --mount type=bind,src=$(pwd),dst=/code/AIO3_GPT_baseline \
  aio3_gpt:latest \
  bash

データセット

JAQKET: クイズを題材にした日本語QAデータセット

開発用データ

主に以下に示した要素からなるjson lines形式のファイルになっています。

  • qid: 問題インデックス
  • number: 整数型の問題インデックス
  • question: 質問
  • answers: 答えのリスト
{
  "qid": "AIO02-0002", 
  "competition": "第2回AI王", 
  "section": "開発データ問題",
  "number": 2, 
  "question": "氷った海に穴を開けて漁をすることから、漢字で「氷の下の魚」と書くタラ科の魚は何?",
  "answers": ["コマイ"]
  }

テスト用データ

第3回コンペティションのリーダーボード投稿用テストデータは下記よりダウンロードできます。

テストデータは,質問 ID ( qid ) と問題文 ( question ) のみを含んだ下記のような JSON Lines (jsonl) 形式になっています。

{"qid": "AIO02-1001", "question": "全長は約10.9km。アメリカの国道1号線の一部である、フロリダ・キーズの島々を結ぶ橋の名前は何?"}

{"qid": "AIO02-1002", "question": "コロイド溶液に光を通した時、光の散乱によって道筋が見える、という現象を、発見者にちなんで何現象という?"}

日本語GPTモデルによるzero-shot推論

以下のコードを実行することでrinna株式会社の日本語GPTモデルによるzero-shot推論を行うことができます。

開発用データ

#実行例
$ python eval_model_jsonl.py path/to/eval_file.jsonl --output_file work/model_answer.csv

テスト用データ

以下のコードを実行することでリーダーボードに投稿できる形式の解答ファイルを出力できます。

#実行例
$ python eval_model_jsonl_unlabel.py path/to/eval_file.jsonl --output_file work/model_answer.jsonl --save_model

Accuracy

  • 第二回の開発データ1000問を予測した際の正解率 (Exact Match)
データ Acc
評価セット 31.6

最終提出

  • 最終提出の際はDockerイメージを提出する必要があります。その際、以下のコマンドで実行可能な推論スクリプトsubmission.shを含む必要があります。
bash ./submission.sh <input_file> <output_file>

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published