# 贡献代码
&emsp;&emsp;**fastNLP** 是一个开源的、不断更新的深度学习工具库，因此我们十分欢迎任何人对我们的工作提出建议或者修改。如果您发现 **fastNLP** 有下面的问题：

- 文档描述或格式错误
- 代码存在 bug

&emsp;&emsp;或者您想要：

- 改善文档的描述或显示格式
- 添加或改善现有的功能

&emsp;&emsp;我们都欢迎您向 **fastNLP** 的 [github](https://github.com/fastnlp/fastNLP/issues) 仓库提出相应的 `issue`，我们会经过讨论后向您提供相应的解决办法。

## 提交 Pull Request

&emsp;&emsp;如果您想要为 **fastNLP** 贡献您自己的代码，您可以向我们定的仓库提交 [Pull Request](https://docs.github.com/en/pull-requests/collaborating-with-pull-requests/proposing-changes-to-your-work-with-pull-requests/about-pull-requests)。在下面我们会以 `github` 为例，向您介绍为 **fastNLP** 贡献代码的流程.

### 复刻仓库

&emsp;&emsp;如果您是第一次提交 `Pull Request`，您需要首先在 **fastNLP** 的仓库页面右上角，点击下图红框中的 `fork` 按钮，这样就可以复制一份仓库到您自己的主页中。

<img src="./figures/fork.png" align="center"></img>

&emsp;&emsp;接着将您自己主页下的 **fastNLP** 仓库使用 `git clone` 命令下载到本地，然后将原本的 **fastNLP** 仓库添加为上游：

```bash
git remote add upstream git@github.com:fastnlp/fastNLP.git
```

如果想要查看 upstream 的设置，可以使用下面的命令：

```bash
git remote -v
```

### 配置 pre-commit

&emsp;&emsp;为了更好地约束代码风格，让 **fastNLP** 的代码尽可能严谨和美观，您还需要进行 `pre-commit` 的配置。我们需要使用的配置文件已经被放置在仓库中，您只需要运行以下的命令进行安装就可以：

```bash
pip install -U pre-commit
pre-commit install
```

&emsp;&emsp;注意上面的命令需要在最上层的 `fastNLP/` 文件夹下执行，也就是和 `.pre-commit-config.yaml` 同级的文件夹下执行。

&emsp;&emsp;因为网络原因，该安装过程可能会失败。此时您可以尝试使用下面的命令解决：

```bash
pre-commit install -c .pre-commit-config-zh-cn.yaml
```

&emsp;&emsp;安装了 `pre-commit` 之后，在您执行 `git commit -m "xxx"` 命令后，`pre-commit` 会对您提交的文件进行检查，如果检查未能通过则会阻止这次提交：

<img src="./figures/precommit-fail.png" align="center"></img>

&emsp;&emsp;此时需要您对命令行中展示的需要修改的文件修改后再次使用 `git add` 命令后再一次进行提交和检查，直到通过 `pre-commit` 的检查。

<img src="./figures/precommit-res.png" align="center"></img>



&emsp;&emsp;对于 **fastNLP** 使用的代码规范，您可以查看配置文件 `.pre-commit-config.yaml` 以及下面的 **代码规范** 部分。

&emsp;&emsp;有一点需要您注意，我们目前不建议您运行下面的命令：

```bash
pre-commit run --all-files
```

&emsp;&emsp;这是因为我们的仓库中存在一些用于测试的数据文件，而 `pre-commit` 的 `end-of-file-fixer` 工具会在这些文件末尾添加空行从而可能造成读取数据的过程中出现问题。

### 创建开发分支

&emsp;&emsp;安装完 `pre-commit` 之后，我们需要基于 `master` 创建开发分支，建议的分支命名规则为 `username/pr_name`：

```bash
git checkout -b x54/add_perplexity
```

&emsp;&emsp;在后续的开发中，主仓库的内容会不断更新，如果您发现您 fork 下来的仓库已经落后于主仓库的更新，则可以通过下面的命令来跟进更新：

```bash
git pull upstream master
```

### 单元测试

&emsp;&emsp;当您完成改动之后，我们需要确保您的改动不会影响到整个 **fastNLP** 框架，您需要运行以下命令来使自己的代码能够通过我们的单元测试：

```bash
cd tests
pytest . -m torch
```

### 推送代码到远程

&emsp;&emsp;代码通过单元测试和 pre-commit 检查后，您就可以将代码推送到远程仓库。如果是第一次推送，可以在 git push 后加上 -u 参数以关联远程分支

```bash
git push -u origin {branch_name}
```

&emsp;&emsp;这样下次就可以直接使用 git push 命令推送代码了，而无需指定分支和远程仓库。

### 提交改动

&emsp;&emsp;当您想要提交给主仓库时，您需要在您仓库主页的 `Pull Request` 界面点击右上角的 `New Pull Request` 按钮来创建一个 PR

<img src="./figures/pr-commit.png" align="center"></img>

&emsp;&emsp;然后在创建的界面写下您改动的理由、添加的功能等等。最后点击 `Create Pull Request` 就可以成功提交了。提交一个 PR 之后，您也可以随时更新您 fork 下来的仓库，只要是您使用 `git push` 命令所提交的改动都会在您的 Pull Request 中实时地更新。

<img src="./figures/pr-commit-2.png" align="center"></img>

### 解决冲突

&emsp;&emsp;随着时间的推移，**fastNLP** 的代码也会不断地更新。如果您发现主仓库的更新已经与您的 `Pull Request` 出现了冲突，您需要执行下面的命令来解决冲突：

```bash
git fetch --all --prune
git rebase upstream/master
```

```bash
git fetch --all --prune
git merge upstream/master
```

&emsp;&emsp;如果您非常善于处理冲突，那么可以使用 rebase 的方式来解决冲突，因为这能够保证你的 commit log 的整洁。如果您不太熟悉 rebase 的使用，那么可以使用 merge 的方式来解决冲突

## 规范

### 文档规范和测试

&emsp;&emsp;**fastNLP** 目前采用 `PEP8` 格式的代码规范，在 `.pre-commit-config.yaml` 文件中，您可以查看我们用到的 `flake8`、`yapf`、`codespell`、`docformatter`、`mypy` 等工具的参数。

&emsp;&emsp;除此之外，由于 **fastNLP** 的文档内容以中文为主，出于美观考虑，我们尽量限制每一行的长度不超过 **79** ，如对于 VSCODE 来说，可以在设置中将 `Word Wrap` 设置为 `wordWrapColumn`，并且将 `Word Wrap Column` 设置为 **79** 来进行调整，保证您提交的代码和文档长度是整齐的。

&emsp;&emsp;在提交修复代码错误或新增特性的拉取请求时，可能会需要修改/新增模块的 docstring。我们需要确认渲染后的文档样式是正确的。本地生成渲染后的文档的方法如下：

```bash
cd docs
pip install -r requirements.txt
make html
make server
```

有时可能会报错 `Pandoc wasn't found`，此时运行命令：`sudo apt install pandoc` 即可。

### 单元测试规范

&emsp;&emsp;如果您想要为您添加或修改的内容编写单元测试，**fastNLP** 有以下要求：

- 在 `tests/` 文件夹下的对应位置创建 `test_xxx.py` 文件。后缀与要测试模块所在的文件名相同。如果您只想测试单独的框架，则可以再添加一个后缀，如 `_torch`。比如 `tests/core/metrics/test_bleu_torch.py`。
- 如果您添加的测试是框架有关的，请添加装饰器 `@pytest.mark.torch`、`@pytest.mark.paddle` 等来进行标注，这将帮助我们在测试时进行区分。
- 如果您的测试需要使用显卡设备，请使用 `tests/helpers/utils.py` 中的 `skip_no_cuda()` 函数来跳过相应的情况，这是因为我们需要确保在无显卡的环境下测试依旧可以正常执行。

&emsp;&emsp;您可以参考文件夹 `tests/` 下已有的测试来理解上面的要求。如果您还有其它的疑问，请尽情联系我们，我们会为您进行解答。