baichuan-2

baichuan，应该是“百川”的拼音，Baichuan-2目前开放的是7B和13B两个参数规模的模型，是由百川智能开发的一个开源非商用的大规模预训练语言模型，如果商用需要联系获得单独的许可。

Baichuan-2在 baichuan 的基础上进行了优化，使用了2.6T 词元的语料训练出来，同时开放了7B、13B 两个参数规模，以及基础模型和Chat模型。

同时，Baichuan-2-7B模型还开放了中间的11个 Checkpoints 供社区研究，这在大模型开源社区中还是比较少见的，有助于科研机构探索不同训练阶段模型能力的变化。

基础信息

由百川智能开发和发布
baichuan-2发布于2023年9月6日
baichuan-2是基于变换器网络（Transformer）架构，7B和13B 两种参数规模
训练数据2.6T，同时开放训练过程的中间11个Checkpoints
许可：非商业定制许可证
- 代码许可：Apache License 2.0，允许商用，相比GPL更宽松。
- 模型许可：baichuan-7B模型许可协议非商业用途可直接使用，商用的话需联系邮箱“opensource@baichuan-inc.com”以获得书面授权。
- 模型许可协议目前仅提供中文版本。
支持MindSpore和昇腾硬件算力，在国产和信创方面占有优势

2.6T Tokens，技术报告非常简单的提及了数据的行业分布：

略微遗憾的是，训练数据披露太过粗略。