## 项目概况：

项目地址：https://github.com/facebookresearch/codellama

### 1、 介绍说明

最新版本的 Code Llama 现在可供个人、创作者、研究人员和各种规模的企业使用，以便他们能够负责任地实验、创新和扩展他们的想法。 

此版本包括预训练和微调 Llama 语言模型的模型权重和起始代码 - 参数范围从 7B 到 34B。

这是一个基于 Llama 2 的大型代码语言模型系列，在开放模型、填充功能、对大输入上下文的支持以及编程任务的零样本指令跟踪能力中提供了最先进的性能。 

我们提供多种风格来覆盖广泛的应用程序：基础模型 (Code Llama)、Python 专业化 (Code Llama - Python) 和指令跟随模型 (Code Llama - Instruct)，每个模型都有 7B、13B 和 34B 参数。 

### 2、商用规则
需要得到 meta 授权 ，才能商用


## 训练方式

Meta 提供的 Code Llama 版本包括：

- Code Llama，基础代码模型；
- Code Llama-Python，Python 微调版；
- Code Llama-Instruct，自然语言指令微调版。

7B 和 13B Code Llama 和 Code Llama - 指令变体支持基于周围内容的填充。 Code Llama 在多个代码基准测试中达到了开放模型中最先进的性能，在 HumanEval 和 MBPP 上的得分分别高达 53% 和 55%。 

所有模型均在 16k 个标记序列上进行训练，并在最多 100k 个标记的输入上显示出改进。 

![Alt text](image-1.png)

**值得注意的是，Code Llama - Python 7B 在 HumanEval 和 MBPP 上的性能优于 Llama 2 70B，并且我们所有的模型在 MultiPL-E 上都优于所有其他公开可用的模型。 **

先决条件：确保安装了 wget 和 md5sum。 然后运行脚本：bash download.sh。 
请记住，链接将在 24 小时和一定下载量后过期。 如果您开始看到诸如 403: Forbidden 之类的错误，您可以随时重新请求链接。

## Model sizes

![Alt text](image.png)

所有模型都支持高达 100,000 个 token 的序列长度，但我们根据 max_seq_len 和 max_batch_size 值预先分配缓存。

因此，请根据您的硬件和用例进行设置。

mp说明：
https://pytorch.org/docs/stable/distributed.html

MP relates to the model size:

1 = 7B

2 = 13B

4 = 33B

8 = 65B

## 部署
```python

git clone https://github.com/facebookresearch/codellama

cd codellama

pip install -e .

```

### 使用预训练模型
```python

torchrun --nproc_per_node 1 example_completion.py \
    --ckpt_dir CodeLlama-7b/ \
    --tokenizer_path CodeLlama-7b/tokenizer.model \
    --max_seq_len 128 --max_batch_size 4

```
可用模型：
Pretrained code models are: 

the Code Llama models CodeLlama-7b, CodeLlama-13b, CodeLlama-34b 

and the Code Llama - Python models CodeLlama-7b-Python, CodeLlama-13b-Python, CodeLlama-34b-Python.

### Code Infilling（代码填充）
```python

torchrun --nproc_per_node 1 example_infilling.py \
    --ckpt_dir CodeLlama-7b/ \
    --tokenizer_path CodeLlama-7b/tokenizer.model \
    --max_seq_len 192 --max_batch_size 4

```
可用模型：

Pretrained infilling models are: 

the Code Llama models CodeLlama-7b and CodeLlama-13b 

and the Code Llama - Instruct models CodeLlama-7b-Instruct, CodeLlama-13b-Instruct.

### Fine-tuned Instruction Models（微调）

```python

torchrun --nproc_per_node 1 example_instructions.py \
    --ckpt_dir CodeLlama-7b-Instruct/ \
    --tokenizer_path CodeLlama-7b-Instruct/tokenizer.model \
    --max_seq_len 512 --max_batch_size 4

```
数据格式：

a specific formatting defined in chat_completion needs to be followed

including the INST and <<SYS>> tags, BOS and EOS tokens, and the whitespaces and linebreaks in between (we recommend calling strip() on inputs to avoid double-spaces). 

You can use chat_completion directly to generate answers with the instruct model.


可用模型：

Fine-tuned instruction-following models are: 

the Code Llama - Instruct models CodeLlama-7b-Instruct, CodeLlama-13b-Instruct, CodeLlama-34b-Instruct.

## 体验

https://catalog.ngc.nvidia.com/orgs/nvidia/teams/playground/models/codellama

![Alt text](image-2.png)


- 1、题目 1：买卖股票时机问题（https://leetcode.cn/problems/best-time-to-buy-and-sell-stock-ii/）
- 2、题目 2：三角形最小路径和（https://leetcode.cn/problems/triangle/）
- 3、题目 3：不同的子序列（https://leetcode.cn/problems/distinct-subsequences/）

