# 单卡GPU 进行 ChatGLM3-6B模型 LORA 高效微调
本 Cookbook 将带领开发者使用 `AdvertiseGen` 对 ChatGLM3-6B 数据集进行 lora微调，使其具备专业的广告生成能力。

## 硬件需求
显存：24GB及以上（推荐使用30系或A10等sm80架构以上的NVIDIA显卡进行尝试）
内存：16GB
RAM: 2.9 /16 GB
GPU RAM: 15.5/16.0 GB

## 0. 环境检查
首先，先检查代码的运行地址，确保运行地址处于 `finetune_demo` 中。
并且，确保已经安装了 `requirements.txt`中的依赖。

> 本 demo 中，不需要使用 deepspeed, mpi4py 两个依赖，如果您安装这两个依赖遇到问题，可以不安装这两个依赖。

In [6]:
import os

# os.environ['http_proxy'] = ''
# os.environ['https_proxy'] = ''
os.environ['HF_HOME'] = '/root/onethingai-fs/models'
os.environ['HF_HUB_CACHE'] = '/root/onethingai-fs/models/hub'
os.environ['HF_ENDPOINT'] = 'https://hf-mirror.com'
os.environ['KMP_AFFINITY'] = 'disabled'

In [1]:
!pwd

/root/autodl-tmp/ChatGLM3/finetune_demo


## 1. 准备数据集
我们使用 AdvertiseGen 数据集来进行微调。从 [Google Drive](https://drive.google.com/file/d/13_vf0xRTQsyneRKdD1bZIr93vBGOczrk/view?usp=sharing) 或者 [Tsinghua Cloud](https://cloud.tsinghua.edu.cn/f/b3f119a008264b1cabd1/?dl=1) 下载处理好的 AdvertiseGen 数据集，将解压后的 AdvertiseGen 目录放到本目录的 `/data/` 下, 例如。
> /media/zr/Data/Code/ChatGLM3/finetune_demo/data/AdvertiseGen

In [2]:
import json
from typing import Union
from pathlib import Path


def _resolve_path(path: Union[str, Path]) -> Path:
    return Path(path).expanduser().resolve()


def _mkdir(dir_name: Union[str, Path]):
    dir_name = _resolve_path(dir_name)
    if not dir_name.is_dir():
        dir_name.mkdir(parents=True, exist_ok=False)


def convert_adgen(data_dir: Union[str, Path], save_dir: Union[str, Path]):
    def _convert(in_file: Path, out_file: Path):
        _mkdir(out_file.parent)
        with open(in_file, encoding='utf-8') as fin:
            with open(out_file, 'wt', encoding='utf-8') as fout:
                for line in fin:
                    dct = json.loads(line)
                    sample = {'conversations': [{'role': 'user', 'content': dct['content']},
                                                {'role': 'assistant', 'content': dct['summary']}]}
                    fout.write(json.dumps(sample, ensure_ascii=False) + '\n')

    data_dir = _resolve_path(data_dir)
    save_dir = _resolve_path(save_dir)

    train_file = data_dir / 'train.json'
    if train_file.is_file():
        out_file = save_dir / train_file.relative_to(data_dir)
        _convert(train_file, out_file)

    dev_file = data_dir / 'dev.json'
    if dev_file.is_file():
        out_file = save_dir / dev_file.relative_to(data_dir)
        _convert(dev_file, out_file)


convert_adgen('data/AdvertiseGen', 'data/AdvertiseGen_fix')

## 2. 使用命令行开始微调,我们使用 lora 进行微调
接着，我们仅需要将配置好的参数以命令行的形式传参给程序，就可以使用命令行进行高效微调。

In [25]:
!CUDA_VISIBLE_DEVICES=0 NCCL_P2P_DISABLE="1" NCCL_IB_DISABLE="1" python finetune_hf.py  data/AdvertiseGen_fix  THUDM/chatglm3-6b  configs/lora.yaml

16988.77s - pydevd: Sending message related to process being replaced timed-out after 5 seconds


Setting eos_token is not supported, use the default one.
Setting pad_token is not supported, use the default one.
Setting unk_token is not supported, use the default one.
Loading checkpoint shards: 100%|██████████████████| 7/7 [00:02<00:00,  2.83it/s]
trainable params: 1,949,696 || all params: 6,245,533,696 || trainable%: 0.0312
--> Model

--> model has 1.949696M params

num_proc must be <= 1. Reducing num_proc to 1 for dataset of size 1.
Map: 100%|█████████████████████████████████| 1/1 [00:10<00:00, 10.50s/ examples]
train_dataset: Dataset({
    features: ['input_ids', 'labels'],
    num_rows: 1
})
num_proc must be <= 1. Reducing num_proc to 1 for dataset of size 1.
Map: 100%|█████████████████████████████████| 1/1 [00:00<00:00, 93.42 examples/s]
val_dataset: Dataset({
    features: ['input_ids', 'output_ids'],
    num_rows: 3
})
num_proc must be <= 1. Reducing num_proc to 1 for dataset of size 1.
Map: 100%|█████████████████████████████████| 1/1 [00:00<00:00, 92.95 examples/s]
test_dat

## 3. 使用微调的数据集进行推理
在完成微调任务之后，我们可以查看到 `output` 文件夹下多了很多个`checkpoint-*`的文件夹，这些文件夹代表了训练的轮数。
我们选择最后一轮的微调权重，并使用inference进行导入。

In [28]:
!CUDA_VISIBLE_DEVICES=0 NCCL_P2P_DISABLE="1" NCCL_IB_DISABLE="1" python inference_hf.py output/checkpoint-3000/ --prompt "类型#裙*版型#显瘦*材质#网纱*风格#性感*裙型#百褶*裙下摆#压褶*裙长#连衣裙*裙衣门襟#拉链*裙衣门襟#套头*裙款式#拼接*裙款式#拉链*裙款式#木耳边*裙款式#抽褶*裙款式#不规则"

19994.15s - pydevd: Sending message related to process being replaced timed-out after 5 seconds


Loading checkpoint shards: 100%|██████████████████| 7/7 [00:03<00:00,  1.99it/s]
Setting eos_token is not supported, use the default one.
Setting pad_token is not supported, use the default one.
Setting unk_token is not supported, use the default one.
感叹，一它们 must它们们的 must。。。问身时尚。，asks对比 bur修 modern的答修摆摆看。接条摆 style，等等等等十足。。 requires灵魂长分下的的魂pointspoints，更多再直形型 style bring遮包遮遮，带来感糖活之意， utilization感，的活穿，看卫腰现代的踩腰十足完糖points完脖短垂，侧包包包卫紧短度，遮若 convert穿演绎改造完的感的，糖之意番 conflict，。�再吊长，还时尚风格感感扫若指倒垂，轻轻仿时尚卫时尚轻轻穿卫感的。指多重多重看着啊摇步仿再仿倒鱼遮，又长直看，出的意十足完的方式的话完之意 misc过多下 anymoreecho问问ira必。。。必先生之一。一上式式衣风格，别着设计设计又不断地安心十足完。。。 reason多重口宽松宽松口指分體，还能之意之意倒长，又安心穿，这 bur十足。。也也 Distance空中，，嫩料，上莫过于莫过于pointspoints，志愿十足，们们们十足穿宽松宽松宽松，修设计设计感感伏也能，还能还 sim token上层先生。。。 ad腰横宽松，让又又®。上上线条的，剪接设计设计设计，线条的设计的设计线条的之一伏 legs®或是线条条愈状坠 convert落落的中接袖，或是色颜色它们番等等等等Arch等等等等等等等等赖。再又适合适合，。身材。。。上天指御遮的。。 inequ。。。吐笑pointstoken。。啊指指爱心等等不易接。。。指指指倒指指吐夫。也不的方式仿接，。上短指宽松衣时尚时尚，宽松，仿时尚时尚， pol活十足啊十足感人体身体仿 shape时尚别 custom墨别时尚腰， convert接接接环保，时尚 fashion convert你的你的您的指指

## 4. 总结
到此位置，我们就完成了使用单张 GPU Lora 来微调 ChatGLM3-6B 模型，使其能生产出更好的广告。
在本章节中，你将会学会：
+ 如何使用模型进行 Lora 微调
+ 微调数据集的准备和对齐
+ 使用微调的模型进行推理