# Trainer
千帆Python SDK 在使用[resource API实现发起训练微调](./console-finetune.ipynb)之外，还提供了Trainer API，可以更方便地实现一体化的训练微调pipeline。同时提供了状态事件回调函数的注册，通过事件分发实现训练流程状态事件的监控。


本例将基于qianfan==0.2.1展示通过Dataset加载本地数据集，并上传到千帆平台，基于ERNIE-Bot-turbo进行fine-tune，直到最终完成服务发布，并最终实现服务调用的完整过程。

## 前置准备
- 初始化千帆安全认证AK、SK

In [19]:
import os 

os.environ["QIANFAN_ACCESS_KEY"] = "your_ak"
os.environ["QIANFAN_SECRET_KEY"] = "your_sk"

## 数据集加载

千帆SDK提供了数据集实现帮助我们可以快速的加载本地的数据集到内存，并通过设定DataSource数据源以保存至本地和千帆平台。

In [None]:
from qianfan.dataset import Dataset
from qianfan.trainer import LLMFinetune

# 加载本地数据集
ds: Dataset = Dataset.load(data_file="./data/fin_cqa_train.jsonl")
ds.list()

In [22]:
# 保存到千帆平台
from qianfan.dataset import QianfanDataSource
from qianfan.resources.console import consts as console_consts

bos_bucket_name = "qianfanhj"
bos_bucket_file_path = "/aaa/"


# 创建千帆数据集，并上传保存
qianfan_data_source = QianfanDataSource.create_bare_dataset(
    name="sdk_trainer_ds_10",
    template_type=console_consts.DataTemplateType.NonSortedConversation,
    storage_type=console_consts.DataStorageType.PrivateBos,
    storage_id=bos_bucket_name,
    storage_path=bos_bucket_file_path,
)

ds.save(qianfan_data_source, replace_source=True)

True

In [24]:
# 对于需要在训练过程中监控每个阶段的各个节点的用户，可以通过事件回调函数来实现
from qianfan.trainer.consts import ActionState, ServiceType
from qianfan.resources.console import consts as console_consts
from qianfan.trainer.configs import TrainConfig
from qianfan.trainer.base import Pipeline
from qianfan.trainer.model import Service, DeployConfig
from qianfan.resources import QfMessages
from qianfan.trainer import LLMFinetune
from typing import cast

### LLMFinetune 训练
`LLMFinetune` 实现了SFT逻辑的trainer，它内部组装了SFT所需要的基本`Pipeline`, 用于串联数据->训练->模型发布->服务调用等步骤

In [26]:
trainer = LLMFinetune(
    train_type="ERNIE-Bot-turbo-0516",
    dataset=ds,
    deploy_config=DeployConfig(
        name="fin_eb_04",
        replicas=1,
        pool_type=console_consts.DeployPoolType.PrivateResource,
        service_type=ServiceType.Chat,
    ),
)

In [None]:
trainer.run()

In [17]:
### 使用Model & Service调用模型
from qianfan.trainer import Model, Service
res = trainer.result
problem="下文中有哪些因果事件？无取向硅钢广泛应用于铁芯等电机零部件其产量的持续提升导致市场竞争愈发激烈，价格进一步降低，从而有效减少新能源汽车驱动电机行业内企业的成本支出"
sft_svc = res[0]["service"]
print("sft", svc.exec({"messages": [{"content": problem, "role": "user"}]})["result"])



sft 供给增加导致市场价格下降

In [18]:
svc = Service(model="ERNIE-Bot-turbo", service_type=ServiceType.Chat)
print("origin:", svc.exec({"messages": [{"content": problem, "role": "user"}]})["result"])



origin: 因果事件：

事件类型：应用
- 事件触发词：应用于
- 事件论元：
  	- 主体：无取向硅钢
  	- 客体：铁芯等电机零部件

事件类型：产量提升
- 事件触发词：持续提升

事件类型：竞争加剧
- 事件触发词：竞争愈发激烈
- 原因：无取向硅钢产量持续提升

事件类型：价格降低
- 事件触发词：降低
- 原因：市场竞争愈发激烈

事件类型：成本减少
- 事件触发词：减少
- 主体：新能源汽车驱动电机行业内企业
- 原因：价格进一步降低


## EventHandler

如果需要在训练过程中监控每个阶段的各个节点的状态，可以通过事件回调函数来实现，通过事件的对应的action_state可以获取当前的action的运行情况以实现对应的业务回调，插入自定义逻辑

In [None]:
from qianfan.trainer.event import Event, EventHandler

testset: Dataset = Dataset.load(data_file="./data/fin_cqa_train.jsonl")
# 定义自己的EventHandler，并实现dispatch方法
class InferAfterSFT(EventHandler):
    target_action: str
    def __init__(self, target_action: str) -> None:
        super().__init__()
        self.target_action = target_action

    def dispatch(self, event: Event) -> None:
        print("receive: <", event)
        if self.target_action == event.action_id and event.action_state == ActionState.Done:
            svc = cast(Service, event.data["service"])
            print("svc", svc)
            for row in testset.list():
                msgs = QfMessages()
                msgs.append(row[0][0]["prompt"], "user")
                svc.exec({"messages":"msgs"})
                print("row infer result", row)
            

eh = InferAfterSFT(target_action=trainer.ppls[0].id)
trainer.register_event_handler(eh)
trainer.run()