# python代码质量

本文主要帮助认识如何提升自己写的python代码的质量，分析和比较可以用来将代码提高到新水平的工具。主要参考资料：

- [Python Code Quality: Tools & Best Practices](https://realpython.com/python-code-quality/)
- [4 Tools for Reproducible Jupyter Notebooks](https://towardsdatascience.com/4-tools-for-reproducible-jupyter-notebooks-d7423721bd04)

## 什么是代码质量？

大家都想要高质量的代码，谁不想要呢？那么什么是代码质量。

网上快速搜索，可以得到许多定义代码质量的结果，对不同人来说有很多不同的含义。

不过一般都认可以下含义内容：

- 它做了它应该做的事。
- 它不包含缺陷或问题。
- 它易于阅读、维护和扩展。

## 为什么代码质量很重要

重新审视这三条标志。看看当代码不符合这些标准时会发生什么。

### 它没有做它应该做的

满足需求是任何产品的基础，不管是软件还是其他。制作软件是为了做一些事情。如果最后，它没有做到，那么它肯定不是高质量的。如果它不能满足基本要求，甚至低质量的都算不上。

### 它确实包含缺陷和问题

如果正在使用的东西有问题或会带来麻烦，我们也不会称它为高质量。如果它真的非常糟糕，我们可能会完全停止使用它。

比如吸尘器在普通地毯上工作得很好，但一天晚上，养的小动物破坏了花盆导致了一堆污垢，当用吸尘器来清理时，它断了，导致污垢喷得到处都是，这时我们会认为它很糟糕。

也就是说，虽然吸尘器在某些情况下可以工作，但它没有有效地处理偶尔的额外负载。因此，我们不会把它称为高质量的吸尘器。

这是我们在代码中想要避免的问题。如果事情在边缘情况下破裂，导致不被需要的行为出现，我们就没有一个高质量的产品。

### 难以阅读、维护或扩展

想象一下：一个客户要求一个新的功能。编写原始代码的人已经离开了。取而代之的人现在必须要对已经存在的代码进行理解。这个人就是你。

如果代码很容易理解，你就能分析问题并更快地提出解决方案。如果代码是复杂的、曲折的，你可能会花更多的时间，并可能做出一些错误的假设。

如果很容易添加新的功能而不破坏以前的功能，那也很好。如果代码不容易扩展，你的新功能可能会破坏其他东西。

没有人希望自己处于不得不阅读、维护或扩展低质量代码的境地。这意味着更多的头痛和更多的工作。

你不得不处理低质量的代码已经很糟糕了，但不要把别人置于同样的境地。你可以提高你写的代码的质量。

如果你和一个开发团队一起工作，你可以开始实施一些方法来确保更好的整体代码质量。当然，前提是你有他们的支持。你可能要赢得一些人的支持。

## 如何提升代码质量

在我们追求高质量代码的旅程中，有几件事需要考虑。首先，这个旅程不是一个纯粹的客观性的旅程。对于高质量的代码是什么样子，是会有一些强烈的主观认识的。

虽然每个人都有希望在上面提到的标志上达成一致，但实现这些标志的方式却是一条主观的道路。当谈到实现可读性、维护和可扩展性时，总会出现很多意见。

这里从最有意见的话题开始：代码风格。

### 风格指南 style guides

空格 space 还是制表符 tab？

不管我们对如何表示空白有什么个人看法，可以肯定的是，至少我们想要在代码中保持一致性。

风格指南的目的是定义一个一致的方式来写代码，作用是使代码易于阅读、维护和扩展。

就Python而言，有一个被广泛接受的标准。它部分是由Python编程语言的作者自己编写的。

PEP 8提供了Python代码的编码规范。Python代码遵循这个风格指南是相当普遍的。这是一个很好的开始，因为它已经被很好地定义了。

一个同样经常被建议的规范是PEP 257，它描述了Python的docstrings的约定，该约定用来记录模块、类、函数和方法的字符串。还有，如果文档字符串是一致的，就有一些工具能够直接从代码中生成文档。

这些指南所做的只是定义了一种风格化代码的方法。但如何执行它呢？代码中的缺陷和问题又是怎么回事，怎么能发现这些呢？这就是linters的作用。

### Linters

首先，让我们谈一谈lint。那些微小的、令人讨厌的小东西，不知何故弄得你的衣服上到处都是。如果没有这些小毛毛，衣服看起来和感觉都会好很多。代码也不例外。小错误、风格上的不一致和危险的逻辑都不会让你的代码看起来很好。

但我们都会犯错。不能指望自己总是能及时发现它们。变量名错了，忘记了括号，Python中的标签不正确，用错误的参数调用一个函数，这样的例子不胜枚举。而Linters有助于识别这些问题。

此外，大多数编辑器和集成开发环境都有能力在你输入时在后台运行linters。这就形成了一种环境，能够在你运行代码之前突出显示以识别代码中的问题区域。它就像代码的高级拼写检查。

Linters分析代码以检测各种类别的lint。这些类别可以大致定义为以下几个方面。

- 逻辑性lint
    - 代码错误
    - 具有潜在的非预期结果的代码
    - 危险的代码模式
- 风格性lint
    - 不符合定义的惯例的代码

还有一些代码分析工具，可以为代码提供其他方面的见解。虽然从定义上来说，这些工具也许不是 linters，但通常与 linters 并排使用。他们也希望能提高代码的质量。

最后，还有一些工具可以自动将代码格式化为某种规范。这些自动化的工具可以确保我们不会弄乱规范。

### Python的Linters有哪些？

在深入研究具体选择之前，重要的是要认识到，有些 linter 只是将多个linters很好地包装在一起。以下是一些这类组合linter的例子。

Flake8：能够检测逻辑和风格上的lint。它将pycodestyle的风格和复杂性检查添加到PyFlakes的逻辑提示检测中。它结合了以下的linters。

- PyFlakes
- pycodestyle(以前的pep8)
- Mccabe

Pylama: 一个由大量的linters和其他分析代码的工具组成的代码审计工具。它结合了以下内容。

- pycodestyle(以前的pep8)
- pydocstyle (原pep257)
- PyFlakes
- Mccabe
- Pylint
- Radon
- gjslint

这里是一些独立的linters，附有简单的描述：

|Linter	|Category|	Description|
|-|-|-|
|Pylint	|Logical & Stylistic|	Checks for errors, tries to enforce a coding standard, looks for code smells|
|PyFlakes	|Logical	|Analyzes programs and detects various errors|
|pycodestyle	|Stylistic	|Checks against some of the style conventions in PEP 8|
|pydocstyle	|Stylistic	|Checks compliance with Python docstring conventions|
|Bandit	|Logical	|Analyzes code to find common security issues|
|MyPy	|Logical	|Checks for optionally-enforced static types|

这里是一些代码分析和格式化的工具：

|Tool	|Category	|Description|
|-|-|-|
|Mccabe	|Analytical	|Checks McCabe complexity|
|Radon	|Analytical	|Analyzes code for various metrics (lines of code, complexity, and so on)|
|Black	|Formatter	|Formats Python code without compromise|
|Isort	|Formatter	|Formats imports by sorting alphabetically and separating into sections|

下面简单在jupyter中使用一个整合型的linter工具：[nbqa](https://github.com/nbQA-dev/nbQA#-installation)。

安装该工具（本repo 环境文件里已有）：

```Shell
conda install -c conda-forge nbqa
```

使用black来format下下面的代码（首先在环境中要有black工具:conda install -c conda-forge black），就直接在本文件夹下命令行中（hydrus环境下）输入：

```Shell
nbqa black 6-code-quality.ipynb
```

我这里结果如下图所示：

![](pictures/QQ截图20211026160107.png)

In [None]:
"""
code_with_lint.py
Example Code with lots of lint!
"""
import io
from math import *


from time import time

some_global_var = "GLOBAL VAR NAMES SHOULD BE IN ALL_CAPS_WITH_UNDERSCOES"


def multiply(x, y):
    """
    This returns the result of a multiplation of the inputs
    """
    some_global_var = "this is actually a local variable..."
    result = x * y
    return result
    if result == 777:
        print("jackpot!")


def is_sum_lucky(x, y):
    """This returns a string describing whether or not the sum of input is lucky
    This function first makes sure the inputs are valid and then calculates the
    sum. Then, it will determine a message to return based on whether or not
    that sum should be considered "lucky"
    """
    if x != None:
        if y is not None:
            result = x + y
            if result == 7:
                return "a lucky number!"
            else:
                return "an unlucky number!"

            return "just a normal number"


class SomeClass:
    def __init__(self, some_arg, some_other_arg, verbose=False):
        self.some_other_arg = some_other_arg
        self.some_arg = some_arg
        list_comprehension = [((100 / value) * pi) for value in some_arg if value != 0]
        time = time()
        from datetime import datetime

        date_and_time = datetime.now()
        return

在其他IDE中的整合使用类似，搜索想应的教程即可，比如vscode下：[Linting Python in Visual Studio Code](https://code.visualstudio.com/docs/python/linting)；pycharm下：[Pycharm External tools](https://www.jetbrains.com/help/pycharm/configuring-third-party-tools.html)