# Llama2-7B-Chat大模型的LoRA微调

Llama2系列是Meta开发并公开的大型语言模型（LLMs），有7B、13B和70B三种不同参数大小的模型，每种参数大小分别对应一个预训练和一个微调的版本。

微调版本称为Llama2-Chat，使用了和 ChatGPT 相似的技术，针对对话进行了优化。相比于 Llama1，Llama2的训练数据多了 40%，上下文长度翻倍，并采用了分组查询注意力机制。特别地，Llama2的预训练模型在2万亿的token 上训练，精调的Llama2-Chat模型在100万人类标记数据上进行进一步训练得到。Llama-2-Chat模型在Meta多数基准上优于开源聊天模型，并且在Meta和安全性的人类评估中，与一些流行的闭源模型如ChatGPT和PaLM相当。

Llama2-7B-Chat是具有70亿参数的微调模型，本文将以Llama2-7B-Chat为例，为您介绍如何在PAI-DSW中使用单卡对Llama2大模型进行轻量化LoRA微调及量化。


### 注意：使用此模型受Meta许可证的约束。在使用模型前，请确认已经前往[自定义可商用开源协议](https://ai.meta.com/resources/models-and-libraries/llama-downloads/)网站并完成申请。

## 运行环境要求

Python环境3.9以上，GPU推荐使用T4、A10或者V100（16GB）及以上配置。


## 准备工作

### 下载Llama2-7B-Chat

首先，下载模型文件。

您可以选择直接执行下面脚本下载，也可以选择[从ModelScope下载模型](https://modelscope.cn/models/modelscope/Llama-2-7b-chat-ms/summary)。
运行如下代码，会根据当前地域为您选择合适的下载地址，并将模型下载到当前目录。

In [None]:
import os
dsw_region = os.environ.get("dsw_region")
url_link = {
    "cn-shanghai": "https://atp-modelzoo-sh.oss-cn-shanghai-internal.aliyuncs.com/release/tutorials/llama2/llama2-7b.tar.gz",
    "cn-hangzhou": "https://atp-modelzoo.oss-cn-hangzhou-internal.aliyuncs.com/release/tutorials/llama2/llama2-7b.tar.gz",
    "cn-shenzhen": "https://atp-modelzoo-sz.oss-cn-shenzhen-internal.aliyuncs.com/release/tutorials/llama2/llama2-7b.tar.gz",
    "cn-beijing": "https://atp-modelzoo-bj.oss-cn-beijing-internal.aliyuncs.com/release/tutorials/llama2/llama2-7b.tar.gz", 
}

path = url_link[dsw_region] if dsw_region in url_link else "https://atp-modelzoo.oss-cn-hangzhou.aliyuncs.com/release/tutorials/llama2/llama2-7b.tar.gz"
os.environ['LINK_CHAT'] = path
!wget $LINK_CHAT
!tar -zxvf llama2-7b.tar.gz

### 下载和安装环境

接着下载和安装所需要的环境。

* `llama-recipes`是Meta官方发布的快速微调Llama2的开源库。
* `PEFT`（Parameter-Efficient Fine-Tuning，参数高效微调）是Hugging Face开源的大模型轻量化微调工具。
* `gradio`是一个快速构建机器学习Web展示页面的开源库。

In [None]:
! wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/llama2/llama-recipes.tar.gz
! tar -zxvf llama-recipes.tar.gz
! wget https://atp-modelzoo-sh.oss-cn-shanghai.aliyuncs.com/release/tutorials/llama2/peft.tar.gz
! tar -zxvf peft.tar.gz
! pip install -r llama-recipes/requirements.txt
! pip install peft
! pip install gradio==3.11

### 自定义训练数据（可选）

我们已经准备好了示例数据集，在`llama-recipes/ft_datasets/alpaca_data_sub.json`。为了方便起见，您可以跳过本步，直接用这个数据集进行finetune。

如果您希望使用自定义数据集，请阅读以下步骤。

首先在`llama-recipes/ft_datasets/`目录下新建一个json文件（如`your_dataset.json`），数据格式示例如下：

In [None]:
[
    {
        "instruction": "Give three tips for staying healthy.",
        "output": "1.Eat a balanced diet and make sure to include plenty of fruits and vegetables. \n2. Exercise regularly to keep your body active and strong. \n3. Get enough sleep and maintain a consistent sleep schedule."
    },
    {
        "instruction": "What are the three primary colors?",
        "output": "The three primary colors are red, blue, and yellow."
    }
]

准备好训练数据后，请您在`llama-recipes/configs/training.py`文件中修改`alpaca_dataset`类的参数，将`data_path`改为您创建的json文件，示例如下：

In [None]:
@dataclass
class alpaca_dataset:
    dataset: str = "alpaca_dataset"
    train_split: str = "train"
    test_split: str = "val"
    # 修改这里的data_path
    data_path: str = "llama-recipes/ft_datasets/your_dataset.json"

这样您的数据集便配置完成。如果您需要更灵活的配置，请参考`llama-recipes/docs/Dataset.md`的指导。

## LoRA微调及量化

您可以使用已经写好的训练脚本，进行模型的LoRA轻量化训练。在训练结束之后，我们将模型参数进行int8量化，以便使用更少显存进行推理。

示例使用的参数解释如下，请您根据实际情况进行修改：

`--num_epochs 3`：finetune 3代 

`--use_peft`: 使用PEFT

`--peft_method lora`：有三种可选的方法，`lora`, `llama_adapter`和`prefix`，这里采用了`lora`

`--quantization`: 采用int8量化

`--dataset alpaca_dataset`: 采用alpaca数据集

`--model_name llama2-7b`: 模型为llama2-7b

`--output_dir sft-llama2-7b`: 模型的输出目录为`sft-llama2-7b`

In [None]:
! python llama-recipes/llama_finetuning.py --num_epochs 3 --use_peft --peft_method lora --quantization --dataset alpaca_dataset --model_name llama2-7b --output_dir sft-llama2-7b

## 试玩模型

模型训练完成后，运行`llama-recipes/inference/webui.py`文件，试玩微调完成的模型。

注意这句代码中的模型地址需要跟上文设置的输出路径保持一致： `model = load_peft_model(model, 'sft-llama2-7b')`

In [None]:
! python llama-recipes/inference/webui.py

运行成功后打开链接，就可以看到如下界面了。请发挥你的创意，与Llama2对话助手互动吧！

![image.png](_html/web_ui_result.png)