GitHub - AdelWang/llm_sft: Supervised Fine-Tuning for Large language models

envs配置：

torch==2.0.0+cu117
transformers==4.28.1
tokenizers >= 0.13.1
deepspeed == 0.9.2
peft == 0.2.0

***** 数据格式 ***** jsonl形式，存放路径 data/ train.json dev.json Refer to data_example.json for more details.

调用代码示例

MODEL_NAME='bigscience/bloom'
DATA_DIR='data/'
deepspeed --master_port=29500 main.py \
    --model_name_or_path $MODEL_NAME \
    --data_dir $DATA_DIR \
    --output_dir $YOUR_OUTPUT_DIR \
    --max_length 2048 \
    --eval_batch_size 4 \
    --num_train_epochs 5 \
    --do_train \
    --do_eval

Supported Models

The following models are tested:

use --lora to enable lora training use --gradient_checkpointing to enable graident_checkpointing --do_eval will generate a pred_for_eval.json file in output_dir with the following format:

[
    {
        'input': 'model_input',
        'output': 'model_eval_output'
    },
]

踩坑： llama config.json 的 pad_token_id 为-1，需要手动改成 0，不然有时候会报 cuda-side trigger error

Name		Name	Last commit message	Last commit date
Latest commit History 14 Commits
data_utils		data_utils
README.md		README.md
data_example.json		data_example.json
main.py		main.py
train_and_inference.sh		train_and_inference.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Supported Models

About

Releases

Packages

Languages

AdelWang/llm_sft

Folders and files

Latest commit

History

Repository files navigation

Supported Models

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages