<a href="https://colab.research.google.com/github/suwatoh/Python-learning/blob/main/102_%E3%82%B3%E3%83%BC%E3%83%87%E3%82%A3%E3%83%B3%E3%82%B0%E8%A6%8F%E7%B4%84.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

コーディング規約
================

PEP 8
-----

### コーディング規約 と PEP 8

多くのソフトウェア開発では、ソースコードの書き方を統一するために「**コーディング規約**」と呼ばれるガイドラインが定められている。これは、開発者が共通のルールに従ってコードを書くことで、読みやすさや保守性を高めることを目的としたものである。プログラマーはコードを書く時間よりも読む時間のほうが長いため、読みやすく、ストレスなく理解できるコードであるかどうかは、プロジェクト全体の効率に大きく影響する。

Python 標準ライブラリの開発者が従うことを求められる主要なコーディング規約は、[PEP 8 （Style Guide for Python Code）](https://peps.python.org/pep-0008/) として整理されている。

Python プログラマーに一番読まれるソースコードが標準ライブラリのソースコードなので、PEP 8 は Python プログラマーであれば読んで身につけておくべきであると言える。こうした背景もあり、標準ライブラリ以外の Python ソフトウェア開発でも PEP 8 がよく採用される（PEP 8 を基本とし、一部独自のルールを決めるという形をとることが多い）。幸いにして [PEP 8 の日本語訳](https://pep8-ja.readthedocs.io/ja/latest/)が公開されている。

以下に、PEP 8 の基本事項を端的にまとめる。

### レイアウト

Python ソースコードは、次のように整理して並べる。

``` text
┏━━━━━━━━━━━━━━━━━━┓
┃      モジュールの docstrings       ┃
┠──────────────────┨
┃from __future__ import <feature> 文 ┃
┠──────────────────┨
┃       二重アンダースコア変数       ┃
┠──────────────────┨
┃             import 文              ┃
┠──────────────────┨
┃    グローバルな変数や定数の定義    ┃
┠──────────────────┨
┃         関数やクラスの定義         ┃
┗━━━━━━━━━━━━━━━━━━┛
```

`from __future__ import <feature>` は、Python の隠し機能を有効化する。隠し機能は、現在の Python のバージョンでは正式にサポートされないが試験的に導入されているような機能である。

二重アンダースコア変数は、`__all__` のように変数名の前後にアンダースコアが 2 つ付いている変数である。

### 空白

1 行に書く演算子と被演算子との間には、常に 1 つだけスペースを入れる。

コメントは `#` とスペース 1 つから始める。インラインコメント（文と同じ行に書くコメント）にするなら、文とインラインコメントの間は少なくとも 2 つのスペースを置くこと。

逆に、次の場所にスペースを入れてはならない:

  * 括弧 `()` やブラケット `[]`、波括弧 `{}` の直ぐ内側
  * カンマ `,` やセミコロン `;`、コロン `:` の直前

### インデント

インデントはスペース 4 つにする。括弧やブラケットの位置をそろえる。

``` python
# 開き括弧に揃える
foo = long_function_name(var_one, var_two,
                         var_three, var_four)

# 引数とそれ以外を区別するため、スペースを4つ(インデントをさらに)加える
def long_function_name(
        var_one, var_two, var_three,
        var_four):
    print(var_one)

# 突き出しインデントはインデントのレベルを深くする
foo = long_function_name(
    var_one, var_two,
    var_three, var_four)

my_list = [
    1, 2, 3,
    4, 5, 6,
]
result = some_function_that_takes_arguments(
    'a', 'b', 'c',
    'd', 'e', 'f',
)
```

### 改行

ソースコードの幅が 79 文字を越えないように行を折り返すこと。こうすると、エディタで複数のファイルを並べて開くことができ、二つのバージョンを隣り合ったカラムに表示するコードレビューツールを使うときにもうまくいく。

プロジェクトによっては 1 行 99 文字まで制限を緩めてもよい。

2 項演算子の前で改行を行う。

``` python
income = (gross_wages
          + taxable_interest
          + (dividends - qualified_dividends)
          - ira_deduction
          - student_loan_interest)
```

### 空行

トップレベルの関数やクラスを定義する際は 2 行ずつ空け、クラス内のメソッドを定義する際は 1 行ずつ空けるようにする。

### import文

import 文は、`from` 句を使うのでない限り、行を分けるべきである。

``` python
import os
import sys
```

次の順番でグループ化して、それぞれのグループ間に 1 行空白を入れる。

  1. 標準ライブラリ
  2. サードパーティに関連するもの
  3. ローカルな アプリケーション/ライブラリ に特有のもの

### return文

return 文は一貫した書き方をすること。つまり、関数の中の全ての return 文は式を返すか、全く何も返さないかのどちらかにすること。式を返している return 文が関数の中にある場合、値を何も返さない return 文は明示的に `return None` と書くべきであるし、（到達可能であれば） return 文を関数の最後に明示的に置くべきである。

``` python
# 正しい:
def foo(x):
    if x >= 0:
        return math.sqrt(x)
    else:
        return None

def bar(x):
    if x < 0:
        return None
    return math.sqrt(x)
```

``` python
# 間違い:
def foo(x):
    if x >= 0:
        return math.sqrt(x)

def bar(x):
    if x < 0:
        return
    return math.sqrt(x)
```

### 命名規約

PEP 8 の命名規約は CamelCase、lower_case、UPPER_CASE の3種類である。

| 対象 | 規約 | 備考 |
|---|---|---|
| パッケージ | lower_case | アンダースコアなしを推奨 |
| モジュール | lower_case | |
| クラス | CamelCase | |
| 例外 | CamelCase | 名前の最後に `'Error'` を付けるべき |
| 関数・メソッド | lower_case | 非公開関数は先頭にアンダースコア  `_` を付ける |
| 変数・インスタンス変数 | lower_case | 内部でだけ使う変数は先頭にアンダースコア `_` を付ける |
| 定数 | UPPER_CASE | |

Python では、非公開とする関数・メソッド、内部でだけ使う変数、定数は、言語レベルでサポートされていないことに注意。

PEP 8 には明示されてないが、クラス変数も lower_case と思われる（変数アノテーションの節におけるコードから）。

なお、PEP 8 では、クラスの命名規則について、次のような例外を加えている。

> The naming convention for functions may be used instead in cases where the interface is documented and used primarily as a callable.  
*そのインターフェースが文書化されており、主に呼び出し形式で使用される場合には、関数の命名規則を代わりに用いてもよい。*

この例外規定の趣旨は、通常のクラスのように継承して利用されることを避けたい場合に、コンストラクタを「オブジェクトを返す通常の関数」のように見せかけ、利用者にクラスであることを意識させないためのものと考えられる。

docstrings
----------

docstrings（ドキュメンテーション文字列ともいう）は、モジュールや関数、クラス、メソッドについて説明を書くコメントである。

[PEP 257 （Docstring Conventions）](https://peps.python.org/pep-0257/)は、 docstrings を書くための規約である。要約すると、以下のようになる。

  1. docstrings は（改行の有無にかかわらず） 3 つの二重引用符 `"""` を使う。
  2. docstrings は、端的な 1 行の文章で書くか、複数行を使うときには 1 行目は関数の短い説明、2 行目は空行、3 行目以降に詳しい内容を書き、`"""` だけからなる行で閉じる。
  3. 関数の docstrings は `def` の行の次行に置く。
  4. モジュールの docstrings はファイルの先頭（import 文より上）に書く。
  5. クラスの docstrings は `class` の行の次行に置く。

docstrings を書くと、対話モードにおいて組み込み関数 `help()` を使って docstrings の内容を表示できる。また、エディタの入力支援機能により、マウスオーバーで対象の docstrings が表示される。こうした docstring の用途から、PEP 8 は docstring については 72 文字で折り返すべきとしている。

In [None]:
"""モジュールの概要

モジュールの詳細説明
"""

def myfunc1():
    """関数の短い説明"""
    pass

def myfunc2():
    """関数の概要

    関数の詳細説明
    """
    pass

class MyClass:
    """クラスの概要

    クラスの詳細説明
    """
    pass

help(myfunc1)

Help on function myfunc1 in module __main__:

myfunc1()
    関数の短い説明



「モジュールの詳細説明」には

  * 使用例としての短いサンプルコード
  * 公開するクラスや関数が多い場合は、メインで提供されている機能の簡潔なリスト

を書く。かつては「作者」「ライセンス」「変更履歴」も記述することが一般的であったが、現在では書かれない。GitHub がソフトウェア開発の中心となった結果、これらはメタデータとして管理するほうが効率的だからである。

関数やクラスの詳細説明については、記述形式をスタイル化したものがあり、それに従って記述すればよい。以下の 3 つのスタイルがよく使われる。これらのスタイルを同一プロジェクト内で混用するべきではない。スタイルが統一されていないと、読み手が都度形式を切り替えて解釈する必要が生じるうえ、docstrings から API リファレンスなどのドキュメントを自動生成するツール（Sphinx など）の利用を妨げる可能性がある。

reStructuredText スタイル:

| キーワード | 内容 |
|:---|:---|
| param, parameter, arg, argument, key, keyword| 引数の説明 |
| type | 引数の型 |
| raises, raise, except, exception | 例外処理の説明 |
| var, ivar, cvar | 変数の説明 |
| vartype | 変数の型 |
| returns, return | 戻り値の説明 |
| rtype | 戻り値の型 |

``` python
def myfunc(arg1, arg2):
    """関数の概要

    0 行以上の詳細情報

    :param int arg1: arg1 の概要
    :param arg2: arg2 概要
    :type arg2: str | None # arg2 の型
    :return: 戻り値の説明
    :rtype: bool # 戻り値の型
    :raises TypeError: いつ例外が発生するかの説明
    """
```

[Google スタイル](https://google.github.io/styleguide/pyguide.html#38-comments-and-docstrings):

| セクション | 内容 |
|:---|:---|
| Args: | 引数の説明 |
| Returns: | 戻り値の説明 |
| Yields: | 関数がジェネレーターの場合の戻り値の説明 |
| Raises: | 例外処理の説明 |
| Examples: | 関数、クラスの実行例 |
| Attributes: | クラスの属性の説明 |
| Note: | 追加情報 |
| Todo: | 実装予定など |

``` python
def myfunc(arg1, arg2):
    """関数の概要

    詳細情報

    Args:
        arg1 (int): arg1 の説明
        arg2 (str | None): arg2 の説明

    Returns:
        bool: 戻り値の説明

    Raises:
        TypeError: いつ例外が発生するかの説明

    Examples:
        関数の使い方について記載

        >>> myfunc(4, "hoge")
        True
    """
```

[NumPy スタイル](https://numpydoc.readthedocs.io/en/latest/format.html):

| セクション | 内容 |
|:---|:---|
| Parameters | 引数の説明 |
| Returns | 戻り値の説明 |
| Yields | 関数がジェネレーターの場合の戻り値の説明 |
| Raises | 例外処理の説明 |
| Attributes | クラスの属性の説明 |
| Examples | クラスや関数の実行例 |
| Attributes | クラスの属性の説明 |
| Notes | 追加情報 |
| See Also | 関連して参照 |

``` python
def myfunc(arg1, arg2):
    """関数の概要

    詳細情報

    Parameters
    ----------
    arg1 : int
        arg1 の説明
    arg2 : str | None
        arg2 の説明

    Returns
    -------
    bool
        戻り値の説明

    Raises
    ------
    TypeError
        いつ例外が発生するかの説明

    Examples
    --------
    関数の使い方について記載

    >>> myfunc(4, "hoge")
    True
    """
```

PIE 原則とコメントルール
------------------------

### DRY 原則と PIE 原則

コーディングに関して、次のような重要な考え方がある。

**DRY 原則**:  
*Don't repeat yourself* の略とされ、「同じことを繰り返すな」という意味である。同じ情報を複数の場所に重複して置くと、変更時に整合性が取れなくなる危険があるため、重複を避けることを求めている。

**PIE 原則**:  
*Program Intently and Expressively* の略とされ、「意図をもって、表現力豊かにプログラミングせよ」という意味である。プログラマーはコードを書くよりも読むことに多くの時間を費やすため、読み手にとって理解しやすい表現でコードを書き、コードそのものによって意図を伝えることを求めている。

コメントでも意図を伝えることは可能であるが、コメントはあくまでコードだけでは表しきれない部分を補うために用いるべきである。コメントに依存できない理由は次の 2 点にある。

  1. **DRY 原則に反する**。
      * コードの変更に合わせてコメントも更新する必要があり、保守の負担が増える。
  2. **コメントはコードほど読みやすくない**。
      * 自然言語は曖昧で、冗長になりやすいため、コードのように正確かつ端的に意図を伝えることが難しい。
      * コードとコメントの両方を目で追う必要があり、読み手の負担が増える。

### 正しい名前

コードそのものによって意図を伝える最良の手段は、関数や変数に適切な名前を付けることである。

■ 関数

  * 関数はアクションであるため、それらの名前は通常は動詞である。
  * 関数の振る舞いをできるだけ正確に表現すること。
  * プロジェクトではプレフィックス（接頭辞）の意味を一貫させること。例えば
      * `get...`: 値を返す
      * `set...`: 値を設定する
      * `fetch...`: API を叩いてデータを取ってくる
      * `find...`: 特定の条件に合うものを見つけ出す
      * `search...`: 広く探索して搔き集める
      * `create...`: 何かを生成する
      * `update...`: 既存のデータを最新の状態に更新する
      * `delete...`: 削除する
      * `remove...`: 集合から取り除く
      * `add...`: 末尾などに追加する
      * `insert...`: ある位置に挿入する
      * `clear...`: 内容を消去する
      * `reset...`: 初期状態に戻す
      * `start...` / `stop...` / `resume...` / `pause...`: ライフサイクルやプロセスを制御する
      * `parse...`: データを解析して意味のある構造に変換する
      * `convert...`: 単位やエンコーディングなどを変換する
      * `format...`: 表示用に見た目を整える
      * `check...`: 妥当性を確認し、真理値を返す
      * `validate...`: 形式が正しいか厳密に検証し、真理値を返す
      * `verify...`: パスワードや署名などが正しいか照合し、真理値を返す
      * `ensure...`: 特定の状態であることを保証する（なっていなければ修正・作成する）。
      * `read...`: ファイルやメモリから読み込む
      * `write...`: ファイルやメモリに書き込む
      * `load...`: ファイルやメモリから読み込み、データ構造に変換する
      * `save...`: 永続的に保存する
      * `send...` / `receive...`: 通信で送受信する
      * `print...`: 何かを表示する
      * `calc...`: 何かを計算する
  * 何かの状態を真理値として返す関数は助動詞で始める。
      * `is...`: ～の状態か？
      * `can...`: ～できるか？
      * `has...`: ～を持っているか？
      * `should...`: ～すべきか？
  * データ形式を変える関数は前置詞で始める。
      * `to...`: データから全く別の新しいオブジェクトを作成する
      * `as...`: データを参照する別のオブジェクトを作成する

■ 変数

  * 変数はステート（状態）またはエンティティ（対象）であるため、それらの名前は通常は名詞または複合名詞である。
  * 関連付けられる値をできるだけ正確に表現すること。`value` や `name` のような名前からは何もわからない。
  * グローバル変数の名前はより説明的にすること。逆に、小さな関数のローカル変数は `n` や `x` のような略語や短い名前でもよい。ただし、PEP 8 は、文字 `l`（小文字のエル）、`O`（大文字のオー）、`I`（大文字のアイ）はフォントによっては数字の 1 や 0 と区別が付かないことがあるので 1 文字の変数名に使用することを禁止している。
  * UPPER_CASE で命名するのは、事前に値が決まっている「ハードコードされた定数」のみとする。実行時に値が計算される変数は、たとえ値が変更されない場合でも、UPPER_CASE は使わない。
  * 用語を統一すること。例えば、サイト訪問者に関連する変数群に `user`、`customer`、`account` といった異なる名詞を使わない。
  * 変数は使い終わっても、別の意味の値のために再利用してはならない。
  * 何かの状態を表す真理値に関連付けられる変数は、関数名と同様に、`is`、`can`、`has`、`should` といった助動詞で始める。
  * サフィックス（接尾辞）で「時間の概念」「物理的な単位」などを補足する。
      * `_at`: 特定の時点
      * `_date`: 日付（時刻を含まない）
      * `_on`: 特定の日付（または曜日）
      * `_sec`: 秒
      * `_ms`: ミリ秒
      * `_px`: ピクセル
      * `_pct` / `_percent`: パーセント（0〜100）
      * `_ratio`: 比率（0.0〜1.0）
      * `_id`: 識別子
      * `_key`: 検索キーやハッシュキー
      * `_map`: 辞書形式（Key-Value）
      * `_table`: 表形式
  * 「複数の要素」を表すときは英語の複数形を使う。

かつては「型」をプレフィックスにする手法が流行したが、PIE 原則からは、「型」よりも「その変数が何のために存在するのか（意図）」を伝えるべきであって、現代では推奨されていない。「型」は IDE の機能によりマウスホバーですぐにわかる。

### 悪いコメント

■ **冗長なコメント**  
コード内で起こっていることを説明するだけのコメントのことである。

もしコードがコメントを必要とするほど不明瞭な場合は、コードの一部を括り出し、関数に置き換えるリファクタリングが必要である。

次のコードは、引数までの素数を表示する関数 `print_primes()` の中に、素数判定のコードを説明するコメントがある。

In [None]:
def print_primes(limit):
    for n in range(2, limit):
        # 2 から n の平方根までで割り切れるかチェック
        is_p = True
        for i in range(2, int(n**0.5) + 1):
            if n % i == 0:
                is_p = False
                break
        if is_p:
            print(n)

print_primes(10)

2
3
5
7


次のコードは、素数判定のコードを括り出し、`is_prime()` 関数の呼び出しに置き換えている。

In [None]:
def is_prime(n):
    if n < 2:
        return False
    for i in range(2, int(n**0.5) + 1):
        if n % i == 0:
            return False
    return True

def print_primes(limit):
    for n in range(2, limit):
        if is_prime(n):
            print(n)

print_primes(10)

2
3
5
7


「正しい名前」を付けた関数によって何が行われているのかを伝えているので、そこにコメントすることは何もないことになる。

■ **退化コメント**  
コードと乖離して古くなり、正しく動作を説明しなくなったコメントのことである。意図せず偽情報になることがある。

■ **つぶやきコメント**  
開発時の苦労や感情などは、システムを理解する上でのノイズになる。

■ **エリア区切り**  
次のように、ファイル内に冗長なヘッダーや区切り線を多用するパターンのこと。適切にファイルを分割（モジュール化）していれば、こうした視覚的な区切りは不要である。

``` python
##############################
# Start of Utility Functions #
##############################
```

■ **コメントアウトされたコード**  
何らかの理由でコメントアウトされたコードは、コメントアウトした本人が理由を忘れてしまうと誰も（本人自身も）それを削除する勇気がないということが起こる。

### 良いコメント

■ **意思決定の背景（Why）**

「なぜこの方法を選んだのか」「なぜ他の方法ではダメだったのか」という経緯は、コードからは読み取れない。

``` python
def try_connect():
    # 接続エラーは上位でリトライするため、ここでは例外を捕捉して返すだけにする
    try:
        connect()
    except ConnectionError:
        return False
    return True
```

■ **仕様や外部制約の根拠**

ビジネスルールや、法規制、ハードウェアの制限など、外部の知識が必要な場合。

``` python
# APIが時々20秒以上応答に時間がかかるため、タイムアウトを30秒に設定
timeout = 30
```

■ **TODO**

完璧ではないものの、現時点での最善策をとった場合や、後で対応が必要な箇所を示す。

``` python
# TODO: この処理を非同期化してパフォーマンスを改善する(Issue #234)
result = process_data_sync(data)
```

KISS 原則
---------

**KISS**（キス）は、一般に *Keep it simple, stupid* の略とされ、「シンプルにしておけ！この間抜け」という意味である。もともとは工学全般の設計原則だが、ソフトウェア開発でも広く引用される格言である。

KISS 原則は、要件定義、システム設計、クラス設計、実装、運用・保守といったソフトウェア開発のあらゆるレイヤーに浸透する抽象的な指針であり、「複雑さを避ける」という思想を示している。

コードレベルでは、KISS を *Keep it short and simple* （短く簡潔に）と捉えると理解しやすい。1 行に複数の処理を詰め込むと、コードが横に長くなり、何をしているのか理解するのに時間がかかる。

「**1 行に 1 つのことだけ書く**」（**1 行 1 処理**）という具体的なテクニックは、可読性の向上というメリットがあるだけではない。行単位で編集できてコードの保守が効率化するし、また、エラーが発生した際、どのステップで問題が起きたのかが明確になるというメリットもある。

以下は、ユーザーデータから成人の平均年齢を計算するコード例である。1 行に複数の処理が詰め込まれており、一目では意図がつかみにくい。

In [None]:
users = [{"name": "太郎", "age": 25}, {"name": "花子", "age": 17}, {"name": "次郎", "age": 30}]
result = sum([u["age"] for u in users if u["age"] >= 18]) / len([u for u in users if u["age"] >= 18])
print(f"成人の平均年齢: {result}歳")

成人の平均年齢: 27.5歳


同じ処理を、フィルタリング・合計・人数カウント・平均計算というステップに分けて書くと、次のように読みやすくなる。

In [None]:
users = [{"name": "太郎", "age": 25}, {"name": "花子", "age": 17}, {"name": "次郎", "age": 30}]
adults = [user for user in users if user["age"] >= 18]
adult_count = len(adults)
if adult_count == 0:
    print("成人がいません")
else:
    total_age = sum(user["age"] for user in adults)
    average_age = total_age / adult_count
    print(f"成人の平均年齢: {average_age}歳")

成人の平均年齢: 27.5歳


行を分けるために変数をいくつか追加しており、適切な変数名を付けることでコメントを書かなくても処理の意図が伝わるようになった。また、ゼロ除算対策（`if adult_count == 0` の処理）を簡単に追加できる点も注目される。

全体のコード量は増えているが、行を分ける程度の違いでは、実行速度にほとんど影響はない。したがって、可読性を優先した書き方をして問題ない。

pythonic
--------

### The Zen of Python

Python 言語の設計に関する指針を格言としてまとめたものが、[PEP 20（The Zen of Python）](https://peps.python.org/pep-0020/) として文書化され、パブリックドメインで公開されている。The Zen of Python は Python インタプリタにイースターエッグとして含まれており、対話モードで `import this` と入力することで表示される。

In [None]:
import this

The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!


13 番目の原則と 14 番目の原則は

> There should be one-- and preferably only one --obvious way to do it.  
> Although that way may not be obvious at first unless you're Dutch.

である。ChatGPT に和訳させた結果は次のとおり:

> それを行う方法は 1 つ――できればただ 1 つ――明白であるべきだ。  
> ただし、その方法は最初は明白でないかもしれない。オランダ人でない限り。

この「1 つの方法」は「**pythonic**」な方法と呼ばれている。つまり、Python 言語の開発者は特定の問題に対する理想的な解決策となるイディオムを考えており、それに従ったコードは「pythonic」と表現される。

pythonic なコードは、「変数の数を減らす」「直感的で読みやすい」などのコーディング上のメリットが得られる。実行時間やメモリ使用量を節約できるものもある。

理解するのが難しいコードや他のプログラミング言語から大まかに転写したように読めるコードは「**unpythonic**」と呼ばれている。

### 実例

（例1）ループでカウンター変数を使用する場合

``` python
# unpythonic
for i in range(len(alist)):
    print(alist[i])

# pythonic
for item in alist:
    print(item)

# カウンター変数が必要なら enumerate() 関数を使う
for i, item in enumerate(alist):
    print(i, item)
```

（例2）ループでキーによる参照を行う場合

``` python
# unpythonic
for key in adict:
    print(key, adict[key])

# pythonic
for key, value in adict.items():
    print(key, value)
```

（例3）ループでリストを生成する場合

``` python
# unpythonic
newlist = []
for x in oldlist:
    newlist.append(x ** 2)

# pythonic
newlist = [x ** 2 for x in oldlist]
```

（例4）アンパックを使用しない場合

``` python
L = [1, 2, 3, 4, 5]

# unpythonic
l1 = L[0]
l2 = L[1:-1]
l3 = L[-1]

# pythonic
l1, *l2, l3 = L  # L がタプルの場合は unpythonic な書き方とは結果が異なる(l2 がリストになるため)
```

（例5）値の交換で一時変数を使用する場合

``` python
# unpythonic
tmp = x
x = y
y = tmp

# pythonic
y, x = x, y
```

（例6）文字列の包含関係を文字列メソッドで調べる場合

``` python
# unpythonic
if message.find('John') >= 0:  # message.find('John') は message の中で 'John' が最初に出現する位置（なければ -1）を返す
    print('OK')

# pythonic
if 'John' in message:  # message に 'John' が含まれているかどうか
    print('OK')
```

「pythonic」な方法は万能な解決策ではないので、使い方によっては逆効果ともなりうる。

例えば、リストの内包表記は簡潔に記述できるが、[ネストしたリストの内包表記](https://docs.python.org/ja/3/tutorial/datastructures.html#nested-list-comprehensions) は可読性、保守性が著しく下がる。ネストしたループがどうしても必要な場合は、素朴に for 文をネストして `append()` を使うほうが良い。

### ループの else 節

「The Zen of Python」の 14 番目の原則は、「pythonic」な方法には多くの人に明白ではないものもあることを示唆している（「オランダ人」は Python 言語の生みの親である Guido van Rossum 氏を指している）。

「ループの else 節」は、議論を呼んでいるという点で、「明白ではない方法」の 1 つといえるかもしれない。これはフラグ変数を使用せずに多重ループを抜ける方法である。

多重ループにおいて、一度に複数のネストしたループから抜け出すことが必要となる場合、JavaScript では次のコードのようにラベル付きループとラベル付き break 文を使用してラベルまで抜け出すことが可能である。

In [None]:
%%javascript
outer: for (let i = 0; i < 3; i++) {
  for (let j = 0; j < 3; j++) {
    element.innerHTML += i + ", " + j + ";  ";
    // ラベル付き break 文はラベルまで抜け出す
    if (i == 1 && j == 1) break outer;
  }
}

<IPython.core.display.Javascript object>

Python にはこのように多重ループを抜ける簡単な方法が用意されてないので、「ループの else 節」を使わないなら、フラグ変数を使用することになる。

例えば、次のコードでは、変数 `i` と `j` の値が共に 1 である時にネストしたループから抜け出すためフラグ変数 `flag` を使用している。

In [None]:
flag = False
for i in range(3):
    for j in range(3):
        print(i, j)
        if i == j == 1:
            flag = True
            break
    if flag:
        break

0 0
0 1
0 2
1 0
1 1


次のコードは、フラグ変数を使用して三重ループから抜け出す例である。

In [None]:
flag = False
for i in range(3):
    for j in range(3):
        for k in range(3):
            print(i, j, k)
            if i == 0 and j == k == 1:
                flag = True
                break
        if flag:
            break
    if flag:
        break

0 0 0
0 0 1
0 0 2
0 1 0
0 1 1


ループ脱出にフラグ変数を使うコードは、基本的に可読性が低い。ループの継続条件を常に意識しなければならず、フラグがどこで更新されるかを追う手間が読み手の負担になるからである。

Python 言語の開発者は「ループの else 節」がこの問題の解決策になると考えた。for 文や while 文の else 節は、ループが break されなかった場合に実行されるため、多重ループからの脱出に利用できる。こうした制御にフラグ変数を使うコードは「unpythonic」とされ、else 節の使用こそが「pythonic」とされるようになった。

例えば、次のコード:

In [None]:
for i in range(3):
    for j in range(3):
        print(i, j)
        if i == j == 1:
            break
    else:
        continue
    break

0 0
0 1
0 2
1 0
1 1


このコードでは、内側のループは変数 `i` と `j` の値が共に 1 となるまでは break されず、 else 節の continue 文によって次の反復に移行する。変数 `i` と `j` の値が共に 1 となったとき、内側のループが break され、else 節は実行されず、その下の break 文が実行される結果、外側のループも抜け出す。

ネストが深くなっても考え方は同じである。

In [None]:
for i in range(3):
    for j in range(3):
        for k in range(3):
            print(i, j, k)
            if i == 0 and j == k == 1:
                break
        else:
            continue
        break
    else:
        continue
    break

0 0 0
0 0 1
0 0 2
0 1 0
0 1 1


しかしながら、「ループの else 節」には批判もある。ネストが深い場合に else 節を重ねるのは「美しくない」し、そもそもプログラミング言語一般における `else` が「他の場合」という意味で使われることに反しているからである。

Python 言語の開発者は try-else 構文を引き合いに出して「ループが break されなかった場合に else 節が実行されるのは、例外が発生しなかった場合に else 節が実行されるのと似ている」と主張し「ループの else 節」を正当化する（[公式チュートリアル](https://docs.python.org/ja/3/tutorial/controlflow.html#break-and-continue-statements-and-else-clauses-on-loops)参照）。

この主張は、ループが break 文を持たない場合の else 節をうまく説明できない。この else 節は「break されなかった場合に実行される」というより「ループが実行された後に常に実行される」ものとなるからである。

break 文を持たないループの else 節は「ループが実行された」後に実行されると思っていると、空リストのループのように「ループが 1 回も実行されなかった場合」に else 節が直ちに実行されることに驚くことになる。

In [None]:
items = []
for item in items:
    print(item)
else:
    print("All items printed")

All items printed


break 文を持たないループの else 節は意味がわかりづらいので、プロジェクトのコーディング規約で禁止してもよい。

また、多重ループを一気に抜ける必要がある場合は、ループ全体を関数に括り出し、`return` で抜けるようにすれば、else 節もフラグ変数も使わなくて済む。

In [None]:
def func():
    for i in range(3):
        for j in range(3):
            for k in range(3):
                print(i, j, k)
                if i == 0 and j == k == 1:
                    return

func()

0 0 0
0 0 1
0 0 2
0 1 0
0 1 1


TOML
----

Python プロジェクトの開発に使用されるツールは、設定ファイルに TOML ファイルを使うものが増えている。

TOML はシンプルで明確な構文を採用した設定ファイルのフォーマットである。[仕様書 v1.0.0](https://toml.io/ja/v1.0.0) が公開されている。その概要は以下の通り。

  * キーと値のペアから構成され、キーと値は等号 `'='` で区切られる
  * キーと値のペアの後には改行または EOF（End Of File）がくる必要がある
  * 値として以下のデータ型を扱うことができる
      * 文字列
      * 整数
      * 浮動小数点数
      * ブール値
      * オフセット付き日時
      * ローカルの日時
      * ローカルの日付
      * ローカルの時刻
      * 配列
      * インラインテーブル
  * キーは引用符なし、引用符付きどちらでもよいが、引用符なしの場合は ASCII 英数字、アンダースコア `_`、およびダッシュ `-` のみを含めることができる
  * キーはドット `'.'` を含めることでグループ化される（テーブルを定義する）
  * テーブル（ハッシュテーブルや辞書とも呼ばれる）は、キーと値のペアの集まりであり、ヘッダーまたはドット付きキーによって定義される
  * ヘッダーはテーブル名を囲む角括弧 `[]` が単独で配置される
  * 次のヘッダーまたは EOF までが、そのテーブルのキーと値のペアとなる
  * テーブルの命名規則はキーの場合と同じである
  * 二重の角括弧 `[[]]` で囲んだ同名のヘッダーたちは、テーブルの配列を構成する
  * 大文字と小文字は区別される
  * UTF-8 でエンコードされている必要がある
  * インデントは空白として扱われ、無視される
  * `'#'` に続けて改行までがコメントとされる

``` ini
# TOML ドキュメントの例

title = "TOML Example"          # 裸のキー
"character encoding" = "utf-8"  # 引用符付きのキー

# 二重引用符で囲まれた文字列はエスケープシーケンスが有効
str = "I'm a string. \"You can quote me\". Name\tJos\u00E9\nLocation\tSF."
# \"     - "
# \t     - tab
# \n     - linefeed
# \uXXXX - unicode

# 一重引用符で囲まれた文字列はバックスラッシュでエスケープされない
winpath1 = 'C:\Users\nodejs\templates'

# 両側を 3 つの引用符で囲んだ文字列は改行を許可され、二重引用符ならバックスラッシュで改行をエスケープできる
description = """Tom's Obvious, Minimal Language.

TOML aims to be a minimal configuration file format \
that's easy to read due to obvious semantics."""

# 整数や浮動小数点数は読みやすさを高めるためにアンダースコアを使用できる
flt_key = 224_617.445_991_228

# 接頭辞 `0x` が付いた 16 進数
hex1 = 0xDEADBEEF
hex2 = 0xdeadbeef
hex3 = 0xdead_beef

# 接頭辞 `0o` が付いた 8 進数（Unix ファイルのパーミッションに便利）
oct1 = 0o755

# 接頭辞 `0b` が付いた 2 進数
bin1 = 0b11010110

# 指数表記
flt1 = 6.626e-34

# 無限大
sf1 = inf
sf2 = +inf
sf3 = -inf

# 非数 (NaN)
sf4 = nan
sf5 = +nan
sf6 = -nan

# ブール値
bool1 = true
bool2 = false

# ローカルの日時
ldt1 = 1979-05-27T07:32:00
ld1 = 1979-05-27
lt1 = 07:32:00

# 配列
colors = [ "red", "yellow", "green" ]

# 配列内の改行が可能
hosts = [
  "alpha",
  "omega"
]

# インラインテーブル
name = { first = "Tom", last = "Preston-Werner" }

# 配列には異なるデータ型の値を混在させることができる
contributors = [
  "Foo Bar <foo@example.com>",
  { name = "Baz Qux", email = "bazqux@example.com", url = "https://example.com/bazqux" }
]

# ドット付きでテーブルを定義する
owner.name = "Tom Preston-Werner"
owner.dob = 1979-05-27T07:32:00-08:00
# これは以下と同じ
#   [owner]
#   name = "Tom Preston-Werner"
#   dob = 1979-05-27T07:32:00-08:00

[database]
server = "192.168.1.1"
ports = [ 8001, 8001, 8002 ]
connection_max = 5000
enabled = true

[servers]

  # タブもしくはスペースで自由にインデントできる
  [servers.alpha]
  ip = "10.0.0.1"
  dc = "eqdc10"

  [servers.beta]
  ip = "10.0.0.2"
  dc = "eqdc10"

# テーブルの配列
[[products]]
name = "Hammer"
sku = 738594937

[[products]]  # 配列内の空のテーブル

[[products]]
name = "Nail"
sku = 284758393

color = "gray"

# 上記のテーブルの配列だけを JSON で記述すると以下のような構造になる
# {
#   "products": [
#     { "name": "Hammer", "sku": 738594937 },
#     { },
#     { "name": "Nail", "sku": 284758393, "color": "gray" }
#   ]
# }
```

[PEP 518](https://peps.python.org/pep-0518/) は、パッケージングツールや関連ツール群の共通設定ファイルとして `pyproject.toml` を規定している。それによれば `[tool]` テーブルが各関連ツールに特化したサブテーブルを保持するために使われる。`pyproject.toml` はプロジェクトルートに置く。

リンターとフォーマッター
------------------------

### リンター

ソースコードを読み込んで内容を分析し、問題点を指摘してくれるツールのことを**静的解析ツール**または**リンター**（Linter）という。

Python の代表的なリンターは次のとおり。

  * [Pyflakes](https://github.com/PyCQA/pyflakes)  
  「コードを実行しなくてもわかる明らかな間違い」を見つけるリンター。ライセンスは MIT License。
  * [pycodestyle](https://pycodestyle.pycqa.org/en/latest/)  
  PEP 8 に準拠しているかをチェックするリンター。ライセンスは MIT License。
  * [autoflake](https://github.com/PyCQA/autoflake)  
  「未使用のインポート文」や「未使用の変数」を自動的に削除するためのリンター。ライセンスは MIT License。
  * [Flake8](https://pypi.org/project/flake8/):  
  Pyflakes や pycodestyle などのリンターを統合していて、さらにプラグインをインストールすることでチェックを強化できる。ライセンスは MIT License。
  * [Pylint](https://pypi.org/project/pylint/):  
  VSCode 用の Microsoft 謹製 Python 拡張機能に付属しているリンター。ライセンスは GPL v2.0。

### フォーマッター

ソースコードを、一定のルールに従って整形してくれるツールを**フォーマッター**（formatter）という。

Python の代表的なフォーマッターは [Black](https://github.com/psf/black) である。Black の特徴は、設定がほとんどできないため、妥協の余地なく次のようなスタイルで整形されることである：

  * PEP 8 に準拠したスタイル
  * 改行スタイルの統一
  * シングルクォートをダブルクォートに統一

### Ruff

[Ruff](https://docs.astral.sh/ruff/) は、Python リンター兼フォーマッターである。Rust で作られているため高速に動作する。Ruff の公式サイトには、動作速度が比較されている（グラフは Ruff の公式サイトから引用）。

![](https://user-images.githubusercontent.com/1309177/232603516-4fb4892d-585c-4b20-b810-3db9161831e4.svg#only-light)

  * リンターとしての機能は、Flake8 とそのプラグインの機能を完全に内蔵している。
  * フォーマッターとしての機能は、Black と互換性がある。
  * ライセンスは MIT License。

Python 環境に Ruff をインストールするには `pip` コマンドを使う:

``` shell
pip install ruff
```

インストールに成功すれば、コマンドラインで `ruff` コマンドを以下のように実行できるはずである。

``` shell
PS> ruff --version
ruff 0.3.2
```

### Ruff リンターの使い方

Python 環境にインストールした Ruff で特定のファイルまたはディレクトリ下のファイルに対してチェックを行うには、コマンドラインで次のように実行する:

``` shell
ruff check [OPTIONS] [FILES]...
```

`[FILES]...` には、ファイルまたはディレクトリ（のリスト）を指定する。この中に含まれる Python ファイルを全てチェックする。`[FILES]...` を省略した場合は、カレントディレクトリを対象とする。

エラーが見つかった場合、エラーの内容が出力される。出力形式は Flake8 と同様であり、次のようになる：

``` shell
ファイル名:行番号:桁位置: エラーコード エラーメッセージ
```

エラーメッセージの前に `[*]` が付いた問題は、`--fix` オプションを付けて Ruff リンターを実行すると修正される（ソースファイルを書き換える）ことを意味する。

Ruff は Flake8 やそのプラグイン、その他多くのリンターにインスパイアされた解析ルールが実装されており、エラーコードの先頭 1 文字（または 2 文字または 3 文字）はエラーが発生した解析ルールを表している。主な解析ルールとエラーコードの関係は、次の表のとおり。

| ルールの名称 | 機能 | エラーコード |
|:---|:---|:---|
| Pyflakes | 不具合のもとになりそうな箇所はないかチェックする | F〇○○ |
| pycodestyle | PEP 8 に準拠しているかチェックする。2 種類のエラーがある<br /><br />　・エラー（Error）<br /><br />　・警告（Warning） | <br />E〇〇〇<br /><br />W〇〇〇 |
| mccabe | 「サイクロマティック複雑度」をチェックする。これはソフトウェア測定法の 1 つであり、関数定義<br /><br />における if 条件や for ループの多さを測るのに使われる。複雑度が 10 をこえるような関数は、<br /><br />全ての分岐を確認するようなテストを作るのが困難で、バグを発見しにくいといわれている | C90○ |
| isort | import の順序をチェックする | I〇○○ |
| pep8-naming | PEP 8 の命名規則をチェックする | N〇○○ |
| pydocstyle | docstring のフォーマットをチェックする | D〇○○ |
| pyupgrade | Python の古いバージョンで使われていた記法をチェックする | UP〇○○ |
| flake8-bandit | コードのセキュリティ問題をチェックする | S〇○○ |
| flake8-bugbear | バグになりそうな問題をチェックする | B〇○○ |
| flake8-builtins | 組み込みオブジェクトの名前と被っている変数や関数名をチェックする | A〇○○ |
| flake8-comprehensions | より良い list/set/dict の内包表記を作成するのに役立つルール | C4○○ |
| flake8-debugger | デバッガーの呼び出しとインポートの存在をチェックする | T10○ |
| flake8-print | `print()` 関数などの使用をチェックする | T20○ |
| flake8-return | return の一貫性をチェックする | RET〇〇〇 |
| flake8-simplify | コードの可読性を高めるために、より簡潔で分かりやすい書き方に修正できる箇所（リファクタ<br /><br />リング対象）をチェックする | SIM〇〇〇 |
| flake8-pytest-style | pytest ベースのテストにおける一般的なスタイル上の問題や不整合をチェック | PT〇〇〇 |
| flake8-django | Django に応じた追加ルール | DJ〇〇〇 |
| FastAPI | FastAPI に応じた追加ルール | FAST〇〇〇 |
| NumPy-specific rules | NumPy に応じた追加ルール | NPY〇〇〇 |
| pandas-vet | Pandas に応じた追加ルール | PD〇〇〇 |
| Pylint Convention | コードの可読性や一貫性を高めるための慣習的なルール | PLC○○○○ |
| Pylint Error | 実行時にエラーになる可能性が高いコードをチェックする | PLE○○○○ |
| Pylint Refactor | コードの品質を一段階引き上げるための設計アドバイスのようなルール | PLR○○○○ |
| Pylint Warning | 意図しない動作を招く恐れのあるコードをチェックする | PLW○○○○ |
| Ruff-specific rules | Ruff 独自のルール | RUF〇○○ |

エラーコードの○には数字が入り、それ以外の文字はプレフィックスであることを表す。

例えば、`'PLW0120'` ルールは、break 文を持たないループの `else` の使用をチェックする。

ただし、デフォルトではエラーコード E4〇〇（import 文に関するルール）、E7〇〇（文の書き方に関するルール）、E9〇〇（io-error）、F〇○○（Pyflakes）の解析ルールだけでチェックが行われる。

ソースコードのインラインコメントに `# noqa: エラーコード` と書くと、その行だけエラーコードを無視することができる。エラーコードは省略できるし、カンマで区切って複数のエラーコードを指定することもできる。

例えば、次のコードはエラーコード E731（ラムダ式を変数に代入する代入文をチェック）を無視する。

``` python
example = lambda: 'example'  # noqa: E731
```

独自ルール `'RUF100'` を有効にすると、行のコードと関係のないルールが指定されてる `noqa` をチェック・削除できる。

`ruff check` コマンドのオプションは、`ruff check -h` または `ruff check --help` を実行することで一覧表示される。主なオプションは以下のとおり。

| オプション | 意味 |
|:---|:---|
| `--fix` | ファイルのエラー箇所を修正する |
| `--diff` | エラーを修正した場合の差分を表示するが、ファイルを修正しない |
| `-w`, `--watch` | ファイルの変更を監視する。ファイルに変更がある場合に自動的にチェックされ、その結果が出力される |
| `--ignore-noqa` | 全ての `# noqa` コメントを無視する |
| `--add-noqa` | エラー行に対し、自動で `# noqa` コメントを挿入する |
| `--show-settings` | 現在の設定を出力する |
| `--config=<Path>` | 設定ファイルを指定する |

コマンドラインのリターンコードでチェックの結果を確認できる。

  * `0`: エラーが見つからなかった場合。または、存在するすべてのエラーが自動的に修正された場合
  * `1`: エラーが見つかった場合
  * `2`: 無効なオプションまたは内部エラーにより Ruff が異常終了した場合

### Ruff フォーマッターの使い方

特定のファイルまたはディレクトリ下のファイルに対して整形を行うには、コマンドラインで次のように実行する:

``` shell
ruff format [OPTIONS] [FILES]...
```

`[FILES]...` には、ファイルまたはディレクトリ（のリスト）を指定する。この中に含まれる Python ファイルを全てチェックする。`[FILES]...` を省略した場合は、カレントディレクトリを対象とする。

`[OPTIONS]` に以下の引数を指定してフォーマッターの動作を設定できる。

| オプション | 内容 |
|:---|:---|
| `--check` | 問題がなければ 0 が出力され、問題があれば 1 が出力されるが、ファイルを整形しない |
| `--diff` | 整形前と整形後の差分が出力されるが、ファイルを整形しない |

文の末尾のインラインコメントに `# fmt: skip` を書いた場合、その文を対象とする整形が抑制される。

``` python
data = [
    "spam",
    "ham",
    "eggs"
]  # fmt: skip
```

if などのケースヘッダーや、関数定義のヘッダー、クラス定義のヘッダーに対して、インラインコメントに `# fmt: skip` を書いた場合、その行を対象とする整形が抑制される。その下のインデントブロック内（中身）の整形まで抑制されるわけではない。

``` python
if data==["spam"]:  # fmt: skip
    pass

def test(a,b,c,d,e,f):  # fmt: skip
    pass
```

ブロック全体をスキップしたい場合は、開始位置に `# fmt: off`、終了位置に `# fmt: on` を記述する必要がある。`# fmt: off` と `# fmt: on` で囲まれた領域は、文を対象とする整形が抑制される。

``` python
# fmt: off
not_formatted=3
also_not_formatted=4
# fmt: on
```

ただし、`# fmt: off` と `# fmt: on` は式を対象とする整形を抑制しない。

### Ruff の設定

Ruff の設定ファイルは、`pyproject.toml`、`ruff.toml`、`.ruff.toml` のいずれかを使用する。

同じディレクトリに複数ある場合は、上からの順序で 1 つだけが採用される。

  1. `.ruff.toml`
  2. `ruff.toml`
  3. `pyproject.toml` （ただし `[tool.ruff]` テーブルがなければ無視される）

設定ファイルの探索には、次のような優先順位がある。

  1. `--config=<Path>` オプションで指定したファイル
  2. ソースコードと同じディレクトリにある設定ファイル
  3. ソースコードのあるディレクトリから親ディレクトリを辿って、最も近いディレクトリにある設定ファイル
  4. `${config_dir}/ruff`
      * Windows: `$env:LocalAppData\ruff`
      * macO: `~/Library/Application Support/ruff`
      * Linux: `~/.config/ruff`

設定ファイル内の相対パスは

  * `--config=<Path>` で設定ファイルが直接指定された場合と、`${config_dir}/ruff` 内の設定ファイルが使用された場合、現在の作業ディレクトリを基準に解決される。
  * それ以外の場合は、その設定ファイルが置かれているディレクトリを基準に解決される。

設定ファイルの項目は、コマンドラインのオプションとしても指定可能であり（例：`--select`）、オプション指定は設定ファイル内の設定を上書きする。

■ リンター・フォーマッター共通の設定

リンター・フォーマッターに共通するオプションは、設定ファイルのトップレベル（`pyproject.toml` の場合は `[tool.ruff]` テーブル）で設定する。

主なものは次のとおり。

| オプション | データ型 | 意味 |
|:---|:---|:---|
| `extend` | 文字列 | 設定ファイルのパスを指定すると、まずその設定ファイルで設定を構成し、それに現在の設定ファイルによる設定をマージ<br /><br />する。デフォルトは `null` |
| `fix` | ブール値 | `true` の場合、エラーを自動的に修正する。コマンドラインの `--fix` が優先。デフォルトは `false` |
| `unsafe-fixes` | ブール値 | `true` の場合、安全でない自動修正を有効にする。`false` の場合（デフォルト）、安全でない修正が利用可能な場合にヒン<br /><br />トが表示される |
| `show-fixes` | ブール値 | `true` の場合、修正されたすべてのルール違反の列挙を表示する。デフォルトは `false` |
| `exclude` | 文字列の配列 | 除外するファイルやディレクトリのパターンのリスト。デフォルトは[公式ドキュメント](https://docs.astral.sh/ruff/settings/#exclude)参照 |
| `extend-exclude` | 文字列の配列 | `exclude` で指定されたものに加えて除外するファイルやディレクトリのパターンのリスト。デフォルトは空のリスト |
| `include` | 文字列の配列 | 解析するファイルのパターンのリスト。デフォルトは `["*.py", "*.pyi", "*.pyw", "*.ipynb", "**/pyproject.toml"]` |
| `extend-include` | 文字列の配列 | `include` で指定されたファイルパターンに加えて解析時に含めるファイルパターンのリスト。デフォルトは空のリスト |
| `line-length` | 整数 | 1 行の最大文字数。デフォルトは 88 文字 |
| `indent-width` | 整数 | 字下げ幅。デフォルトは 4 |
| `target-version` | 文字列 | 指定した Python バージョンに対応する。デフォルトは `"py310"` |
| `required-version` | 文字列 | Ruff のバージョン要件。値は `">=0.3.1"` のような PEP 440 のバージョン指定子とする。デフォルトは `null` |
| `cache-dir` | 文字列 | キャッシュディレクトリのパス。デフォルトは `.ruff_cache` |

■ リンターの設定

リンターのオプションは、`pyproject.toml` の場合 `[tool.ruff.lint]` テーブル、`ruff.toml` の場合は `[lint]` テーブルで設定する。

主なものは次のとおり。

| オプション | データ型 | 意味 |
|:---|:---|:---|
| `preview` | ブール値 | `true` の場合、プレビューモードが有効となり、不安定なルールおよび修正を使用するようになる。デフォルトは `false` |
| `select` | 文字列の配列 | 有効にするルールのエラーコードのリスト。エラーコードは前方一致で指定できる。`["ALL"]` を指定すると、競合のない限<br /><br />り、全てのルールを適用する。デフォルトは `["E4", "E7", "E9", "F"]` |
| `extend-select` | 文字列の配列 | `select` で指定されたものに加えて、有効にするルールのエラーコードまたはプレフィックスのリスト。デフォルトは空のリ<br /><br />スト |
| `ignore` | 文字列の配列 | 無視するルールのエラーコードのリスト。エラーコードは前方一致で指定できる。デフォルトは空のリスト |
| `fixable` | 文字列の配列 | 修正可能とみなされるルールのエラーコードまたはプレフィックスのリスト。デフォルトは `["ALL"]` で、すべてのルールは<br /><br />修正可能とみなされる |
| `unfixable` | 文字列の配列 | 修正不可能とみなされるルールのエラーコードまたはプレフィックスのリスト。デフォルトは空のリスト |
| `exclude` | 文字列の配列 | グローバルに除外されるファイルに加えて、リンターとして除外するファイルのパターンのリスト。デフォルトは空のリスト |
| `dummy-variable-rgx` | 文字列 | ダミー変数として扱う変数名の正規表現。ダミー変数は `F841`（使用されていないローカル変数）などのチェックで無視さ<br /><br />れる。デフォルトは `_` と `__` が一致するが `_var_` には一致しないような正規表現 |
| `per-file-ignores` | テーブル | `"test_*.py"` のようなファイルパターンごとに無視するルールのエラーコードのリストを指定する。先頭に `!` を付ける<br /><br />と、そのファイルパターンを否定する。エラーコードは前方一致で指定できる |

個別のルールに適用されるオプションは、`pyproject.toml` の場合 `[tool.ruff.lint]` テーブル、`ruff.toml` の場合は `[lint]` テーブルのサブテーブで設定する。

isort の設定（`[tool.ruff.lint.isort]`）:  
| オプション | データ型 | 意味 |
|:---|:---|:---|
| `combine-as-imports` | ブール値 | `true` にすると同一行の import を複数行に分割することは一切しない。デフォルトは `false` |
| `known-first-party` | 文字列の配列 | 自分のパッケージ名 |

mccabe の設定（`[tool.ruff.lint.mccabe]`）:  
| オプション | データ型 | 意味 |
|:---|:---|:---|
| `max-complexity` | 整数 | サイクロマティック複雑度の最大値。デフォルトは 10 |

pydocstyle の設定（`[tool.ruff.lint.pydocstyle]`）:  
| オプション | データ型 | 意味 |
|:---|:---|:---|
| `convention` | 文字列 | docstrings のスタイル。`"google"`, `"numpy"`, `"pep257"` を指定できる。`"pep257"` を指定した場合、PEP 257 のルールだけチェック<br /><br />する。デフォルトは `null` |

■ フォーマッターの設定

フォーマッターオプションは、`pyproject.toml` の場合は `[tool.ruff.format]` テーブル、`ruff.toml` の場合は `[format]` テーブルで設定する。

主なものは次のとおり。

| オプション | データ型 | 意味 |
|:---|:---|:---|
| `line-ending ` | 文字列 | 改行文字を指定する。以下のいずれかを指定する<br /><br />・`"lf"`: `\n`<br /><br />・`"cr-lf"`: `\r\n`<br /><br />・`"native"`: Unix 上では `\n`、Windows 上では `\r\n`<br /><br />・`"auto"`: （デフォルト）ファイルごとに自動的に改行文字が検出される。改行文字が混在しているファイル<br /><br />　は、最初に検出された改行文字に変換される（改行文字を含まないファイルのデフォルトは `\n`） |
| `quote-style` | 文字列 | 文字列の引用符の統一スタイルを指定する。以下のいずれかを指定する<br /><br />・`"double"`: （デフォルト）ダブルクォート<br /><br />・`"single"`: シングルクォート<br /><br />・`"preserve"`: すべての文字列の引用符が変更されない |
| `indent-style` | 文字列 | `"tab"` を指定するとインデントにタブを使用する。デフォルトは `"space"` |
| `skip-magic-trailing-comma` | ブール値 | `false` の場合、関数の引数やリストなどに末尾のカンマがあると、`line-length` の制限内であってもカン<br /><br />マで折り返す。`true` の場合、`line-length` の制限内ならカンマで折り返さない。デフォルトは `false` |
| `docstring-code-format` | ブール値 | `true` の場合、docstring に含まれる、関数の対話モードでの使用例を整形する。デフォルトは `false` |
| `docstring-code-line-length` | 整数 or<br /><br />文字列 | docstring を整形する場合の 1 行の最大文字数。文字数ではなく `"dynamic"` （デフォルト）を指定した場合、<br /><br />Python コードに適用される `line-length` に準拠する |

■ デフォルト設定

何も指定しない場合、Ruff のデフォルト設定は次の内容と等価である。

`pyproject.toml`:  
``` ini
[tool.ruff]
# Exclude a variety of commonly ignored directories.
exclude = [
    ".bzr",
    ".direnv",
    ".eggs",
    ".git",
    ".git-rewrite",
    ".hg",
    ".ipynb_checkpoints",
    ".mypy_cache",
    ".nox",
    ".pants.d",
    ".pyenv",
    ".pytest_cache",
    ".pytype",
    ".ruff_cache",
    ".svn",
    ".tox",
    ".venv",
    ".vscode",
    "__pypackages__",
    "_build",
    "buck-out",
    "build",
    "dist",
    "node_modules",
    "site-packages",
    "venv",
]

# Same as Black.
line-length = 88
indent-width = 4

# Assume Python 3.10
target-version = "py310"

[tool.ruff.lint]
# Enable Pyflakes (`F`) and a subset of the pycodestyle (`E`) codes by default.
# Unlike Flake8, Ruff doesn't enable pycodestyle warnings (`W`) or
# McCabe complexity (`C901`) by default.
select = ["E4", "E7", "E9", "F"]
ignore = []

# Allow fix for all enabled rules (when `--fix`) is provided.
fixable = ["ALL"]
unfixable = []

# Allow unused variables when underscore-prefixed.
dummy-variable-rgx = "^(_+|(_+[a-zA-Z0-9_]*[a-zA-Z0-9]+?))$"

[tool.ruff.format]
# Like Black, use double quotes for strings.
quote-style = "double"

# Like Black, indent with spaces, rather than tabs.
indent-style = "space"

# Like Black, respect magic trailing commas.
skip-magic-trailing-comma = false

# Like Black, automatically detect the appropriate line ending.
line-ending = "auto"

# Enable auto-formatting of code examples in docstrings. Markdown,
# reStructuredText code/literal blocks and doctests are all supported.
#
# This is currently disabled by default, but it is planned for this
# to be opt-out in the future.
docstring-code-format = false

# Set the line length limit used when formatting code snippets in
# docstrings.
#
# This only has an effect when the `docstring-code-format` setting is
# enabled.
docstring-code-line-length = "dynamic"
```

### 推奨設定

Ruff の公式ドキュメントには、以下の「[解析ルールの選択のガイドライン](https://docs.astral.sh/ruff/linter/#rule-selection)」が提示されている。

  * ルール集合を明示的にするため、`lint.extend-select` よりも `lint.select` を優先する。
  * `ALL` の使用は慎重に行う。`ALL` を有効にすると、アップグレード時に新しいルールが暗黙的に有効化される。
  * 小さなルール集合（`select = ["E", "F"]`）から始め、カテゴリを一つずつ追加する。例えば、人気のある `flake8-bugbear` 拡張を有効にするために、`select = ["E", "F", "B"]` に拡張することが考えられる。

■ Ruff 公式の推奨ルール（`pyproject.toml`）:  
``` ini
[tool.ruff.lint]
select = [
    "E",
    "F",
    "UP",
    "B",
    "SIM",
    "I",
]
```

■ 実務向け設定（`pyproject.toml`）:  
``` ini
[tool.ruff]
target-version = "py310"  # pyupgrade の提案に影響

[tool.ruff.lint]
select = [
  "E",      # pycodestyle errors
  "F",      # Pyflakes
  "I",      # isort: インポート順序
  "B",      # flake8-bugbear: バグになりやすいコード
  "UP",     # pyupgrade: 最新の Python 文法への自動変換
  "N",      # pep8-naming: 命名規則
  "S",      # flake8-bandit: 軽めのセキュリティチェック
  "A",      # flake8-builtins: 組み込み名の上書き防止
  "C4",     # flake8-comprehensions: 内包表記の改善
  "RET",    # flake8-return: return の一貫性
  "SIM",    # flake8-simplify: コードの簡素化
  "RUF",    # Ruff 固有のルール
  "PLW01",  # コードの意図が不明確で読み手を混乱させる書き方
]

# 無視するルール (必要に応じて調整)
ignore = [
  "E501",    # 行長はフォーマッターに任せる場合
  "RUF001",  # 文字列内の ASCII 以外の文字をチェックさせない
  "RUF002",  # docstring 内の ASCII 以外の文字をチェックさせない
  "RUF003",  # コメント内の ASCII 以外の文字をチェックさせない
]

[lint.per-file-ignores]
"test_*.py" = [
  "S101",    # assert の使用を許可
  "S311",    # 標準の擬似乱数ジェネレーターの使用を許可
]

[tool.ruff.lint.isort]
known-first-party = ["your_package_name"]  # 自分のパッケージ名
```

■ ライブラリ開発の場合のルール追加
``` ini
[tool.ruff.lint]
select = [
  "E", "F", "I", "B", "UP", "N", "S", "A", "C4", "RET", "SIM", "RUF",
  "D",    # pydocstyle: ドキュメント
  "T20",  # flake8-print: print 禁止（ログに統一）
]

[tool.ruff.lint.pydocstyle]
convention = "google"
```

### VSCode 拡張機能

VSCode のエディタ画面上で Ruff を使用するだけなら、[Rust 公式の VSCode 拡張機能](https://marketplace.visualstudio.com/items?itemName=charliermarsh.ruff)をインストールするだけでよい（Python 環境に Ruff をインストールする必要はない）。

拡張機能が有効（デフォルトで有効）なら、エディタ画面上でエラーが見つかった箇所が強調され、デフォルトでは Quick Fix が可能である。

`ruff check` に渡す追加のコマンドライン引数や、Quick Fix のオンオフ、`# noqa` コメント で Quick Fix を無視するか否かなど、Ruff 拡張機能独自の設定もできる。

VSCode 上でファイルの保存時に Ruff フォーマッターを自動実行することもできる。Ruff 公式の VSCode 拡張機能を導入しているなら、VSCode の設定ファイル `settings.json` に次の設定を加えると、この機能が使える:

``` javascript
"editor.codeActionsOnSave": {
    "source.fixAll": "explicit",
    "source.organizeImports.ruff": "explicit",
},
"[python]": {
  "editor.defaultFormatter": "charliermarsh.ruff",
},
```