LLM 微调

原始文本：huggingface.co/docs/autotrain/llm_finetuning

通过 AutoTrain，您可以轻松地在自己的数据上微调大型语言模型（LLMs）！

AutoTrain 支持以下类型的 LLM 微调：

数据准备

LLM 微调接受 CSV 格式的数据。

对于 SFT / 通用训练器，数据应该采用以下格式：

对于 SFT / 通用训练，您的数据集必须有一个text列

对于奖励训练器，数据应该采用以下格式：

文本	被拒绝的文本
人类：你好 \n 机器人：嗨很高兴见到你	人类：你好 \n 机器人：别烦我
人类：你好 \n 机器人：我很好	人类：你好 \n 机器人：我不好
人类：你叫什么名字？ \n 机器人：我叫玛丽	人类：你叫什么名字？ \n 机器人：你关我什么事？
人类：哪种是最好的编程语言？ \n 机器人：Python	人类：哪种是最好的编程语言？ \n 机器人：Javascript

对于奖励训练器，您的数据集必须有一个text列（也称为选择的文本）和一个rejected_text列。

对于 DPO 训练器，数据应该采用以下格式：

对于 DPO 训练器，您的数据集必须有一个prompt列，一个text列（也称为选择的文本）和一个rejected_text列。