GPT zero-shot baseline

1. 再現

作成者実行環境

Python 3.9.13

1.1. 環境構築

pytorchを入れる
他のライブラリを入れる
```
pip install -r requirements.txt
```

1.2. 学習データで推論

ここでは最適な確信度のしきい値を求めることを目的とする

1.2.1. データ用意

ここではAI王公式配布データセットの学習データversion2.0の一部を使用 (後述のSignateCLIから第4回用のDevセットも取得可能)

データ取得

wget https://jaqket.s3.ap-northeast-1.amazonaws.com/data/aio_02/aio_02_train.jsonl -P datasets/aio2/

4000件サンプリング

python datasets/aio2/preprocess.py --original_path datasets/aio2/aio_02_train.jsonl --n_samples 4000

1.2.2. しきい値探し

以下の環境変数を追加
```
export TOKENIZERS_PARALLELISM=false
```
推論: 結果は outputs/{date}/{time}/train.jsonl に出力される
```
python main.py model=rinna-1b dataset=aio2_v1.0
```

しきい値探し

python modules/find_threshold.py --prediction_file outputs/{date}/{time}/train.jsonl --gold_file datasets/aio2/aio_02_train_4000.jsonl --limit_num_wrong_answers 3

1.3. しきい値探し結果

rinna-1b

1.3.1. あるしきい値のときのスコアを計算したいとき

しきい値を超えた場合のみ回答するようなjsonlファイルを作成する　（-> train_cleaned.jsonl ）
```
python modules/clean_results.py --prediction_file outputs/{date}/{time}/train.jsonl --confidence_threshold 0.854
```

スコア計算

python modules/compute_score.py --prediction_file outputs/{date}/{time}/train_cleaned.jsonl --gold_file datasets/aio2/aio_02_train_4000.jsonl --limit_num_wrong_answers 3

1.4. リーダーボード用データで推論

1.4.1. データ用意

signateとのデータのやり取りを行うためのAPIトークンを取得する参考

signate token --email=Signateアカウントのメールアドレス --password=Signateアカウントのパスワード

コンペID確認 (SignateのコンペページURL末尾と同じで、1235)
```
signate list
```
データファイルIDの確認
```
signate files -c 1235
```

リーダーボード用問題をダウンロード

signate download --competition-id=1235 --file-id=3801 --path=datasets/aio4_v1.0/

1.4.2. 推論: 結果は outputs/{date}/{time}/dev_unlabeled_cleaned.jsonl に出力される

prompt作成

python datasets/aio4_v1.0/preprocess.py --original_path datasets/aio4_v1.0/aio_04_test_lb_unlabeled_v1.0.jsonl

推論

python main.py model=rinna-1b model.confidence_threshold=0.854 dataset.phase=test_lb_unlabeled

リーダーボードに提出するファイルは、拡張子がtxtである必要があるため、ファイル名を変更する
```
cp outputs/{date}/{time}/test_lb_unlabeled_cleaned.jsonl outputs/{date}/{time}/test_lb_unlabeled_cleaned.txt
```

1.4.3. 投稿

signate submit -c 1235 {ファイルパス}

2. 参考

2.1. 主な引数選択肢

引数名	型	選択肢
model	str	rinna-1b (default) open-calm-1b
model.confidence_threshold	float
dataset	str	aio4_v1.0 (default) aio2_v1.0

2.2. 最終評価用Dockerテスト

ビルド
```
docker build -t aio4-gpt-baseline .
```

実行

docker run --gpus 1 --rm -p 8000:8000 aio4-gpt-baseline

外からAPIで呼び出し

python -m evaluate_docker_api \
--test_unlabelded_file datasets/aio4_v1.0/aio_04_test_lb_unlabeled_v1.0.jsonl \
--output_prediction_file datasets/aio4_v1.0/aio_04_test_lb_prediction_v1.0.jsonl

Name		Name	Last commit message	Last commit date
Latest commit History 13 Commits
config		config
datasets		datasets
modules		modules
outputs/2023-11-03/17-43-52		outputs/2023-11-03/17-43-52
.gitignore		.gitignore
.python-version		.python-version
Dockerfile		Dockerfile
README.md		README.md
evaluate_docker_api.py		evaluate_docker_api.py
main.py		main.py
prediction_api.py		prediction_api.py
requirements.txt		requirements.txt
setup.sh		setup.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

GPT zero-shot baseline

1. 再現

1.1. 環境構築

1.2. 学習データで推論

1.2.1. データ用意

1.2.2. しきい値探し

1.3. しきい値探し結果

1.3.1. あるしきい値のときのスコアを計算したいとき

1.4. リーダーボード用データで推論

1.4.1. データ用意

1.4.2. 推論: 結果は outputs/{date}/{time}/dev_unlabeled_cleaned.jsonl に出力される

1.4.3. 投稿

2. 参考

2.1. 主な引数選択肢

2.2. 最終評価用Dockerテスト

About

Releases

Packages

Languages

cl-tohoku/AIO4_GPT_baseline

Folders and files

Latest commit

History

Repository files navigation

GPT zero-shot baseline

1. 再現

1.1. 環境構築

1.2. 学習データで推論

1.2.1. データ用意

1.2.2. しきい値探し

1.3. しきい値探し結果

1.3.1. あるしきい値のときのスコアを計算したいとき

1.4. リーダーボード用データで推論

1.4.1. データ用意

1.4.2. 推論: 結果は outputs/{date}/{time}/dev_unlabeled_cleaned.jsonl に出力される

1.4.3. 投稿

2. 参考

2.1. 主な引数選択肢

2.2. 最終評価用Dockerテスト

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages