personal_chatgpt

语言模型是怎么被训练出来的
- 1. pre-train：无监督预训练，海量的文本；（学前时代）
- 1. Alignment (如下的2和3，严格意义上都是 Alignment，都属于对齐技术)
  - 1. SFT：supervised fine-tuning：有监督训练（学生时代），少量有标注；
  - 1. RLHF：真实的人类反馈，强化学习训练；

Name		Name	Last commit message	Last commit date
Latest commit History 242 Commits
imgs		imgs
tutorials		tutorials
.gitignore		.gitignore
README.md		README.md

Provide feedback