## 項目88 循環依存を取り除く方法を知る

他の人と協働していると、不可避的に、モジュール間で相互依存性が見つかるものです。単一のプログラムのさまざまな部分について独りで作業しているときにも、相互依存が生じることがあります。

例えば、GUI アプリケーションで、どこに文書を保存するか選ぶためのダイアログボックスを表示するとします。表示データは、イベントハンドラへの引数で指定できるでしょう。しかし、ダイアログを適切にレンダリングするためには、ユーザ設定などのグローバル状態を読み取っておく必要があります。

ここでは、グローバルな設定からデフォルトの文書保存場所を得るダイアログを定義します。


In [None]:
# dialog.py
import app

class Dialog:
    def __init__(self, save_dir):
        self.save_dir = save_dir

save_dialog = Dialog(app.prefs.get('save_dir'))

def show():
    print('Showing the dialog!')

問題は、prefs オブジェクトを含む app モジュールが、 プログラム開始のダイアログを表示するために、dialog クラスをインポートしていることです。

In [None]:
# app.py
import dialog

class Prefs:
    def get(self, name):
        pass

prefs = Prefs()
dialog.show()


これは、循環依存になっており、app モジュールをメインプログラムから次のように使おうとすると、例外が発生します。

In [None]:
# main.py
import app

```python
Traceback (most recent call last):
  File "...\main.py", line 17, in <module>
    import app
  File "...\app.py", line 17, in <module>
    import dialog
  File "...\dialog.py", line 23, in <module>
    save_dialog = Dialog(app.prefs.get('save_dir'))
AttributeError: partially initialized module 'app' has no attribute 'prefs' (most likely due to a circular import)
```

ここで、何が起こっているかを理解するには、 Pythonの一般的なインポート機構を知る必要があります (詳細は組み込みパッケージ importlib 参照)。モジュールがインポートされたとき、Python が実際に行うことは、深さ順に次のようになります。

1. sys.path から始めてモジュールの位置を特定する([参考](https://note.nkmk.me/python-import-module-search-path/#syspath))。
2. モジュールからコードをロードして、コンパイルできることを確かめる。
3. 対応する空モジュールオブジェクトを作る。
4. モジュールを sys.module に挿入する。
5. モジュールオブジェクトのコードを実行して、内容を定義する。

循環依存の問題は、モジュールの属性が属性のためのコードが実行されるまで (ステップ5の後) 定義されないことです。しかし、モジュールは sys.module に挿入された直後 (ステップ4の後) に import 文でロードされるのです。

先ほどの例では、app モジュールが定義の前に dialog をインポートします。そして、dialog モジュールがappをインポートします。app はまだ実行が完了していない (dialog をインポート中) ので、app モジュールは空のシェル (ステップ4) のままです。すると、prefs を定義するコードがまだ実行していない (appのステップ5は終わっていない) ため、AttributeError が dialog のステップ5の途中で起こります。 

この問題に対する最適解は、コードをリファクタリングして、prefs のデータ構造が依存木の底に来るようにすることです。そうすると、app も dialog もともに同じユーティリティモジュールをインポートできて、循環依存を回避できます。しかし、そのようなすっきりした分割が常に可能とは限りませんし、労力の割に報われないリファクタリングの作業があまりにも多く必要とされるかもしれません。

循環依存を取り除くには、他に3つの方法があります。

### インポートの順序を変更する


第1の方式は、インポートの順序を変えることです。例えば、dialog モジュールを app モジュールの下のほうで、その内容を順番に実行した後でインポートすれば、AttributeError が解消します。


In [None]:
# app.py ver2
class Prefs:
    def get(self, name):
        pass

prefs = Prefs()

import dialog  # Moved
dialog.show()

これがうまくいくのは、dialog モジュールが後でロードされたとき、その再帰的な app のインポートで app.prefs が既に定義されていること (app のステップ5がほぼ終了) がわかるからです。

これは、AttributeError を回避しますが、PEP 8 スタイルガイド (「項目2 PEP 8 スタイルガイドに従う」参照) に違反しています。スタイルガイドは、インポートを Python ファイルの先頭に置くよう指示しています。モジュールの依存関係が、コードの新たな読者にも明確になります。また、依存しているすべてのモジュールが、モジュールのすべてのコードのスコープにあって利用可能なことを保証します。

インポートがファイルの後ろのほうにあるということは、扱いにくく、コードの順番のちょっとした変更で、モジュール全体がダメになる危険性があります。したがって、循環依存の問題を解決するために、インポートの順番を変えるのは避けるべきです。


### インポート、構成、実行

循環インポート問題の第2の解法は、インポート時のモジュールの副作用を最小化することです。モジュールでは、関数、クラス、定数の定義だけを行います。インポート時には、関数を実際に実行しないようにします。そして、他のすべてのモジュールのインポートが終わったら、各モジュールが提供した configure 関数を実行します。configure の目的は、他のモジュールの属性にアクセスして、各モジュールの状態を準備しておくことにあります。すべてのモジュールがインポートされた (ステップ5が完了) 後で configure を実行するので、すべての属性が定義されています。

ここでは、dialog モジュールを再定義して、configure が呼ばれたときに、prefs オブジェクトだけにアクセスするようにします。


In [None]:
# dialog.py ver3
import app

class Dialog:
    def __init__(self):
        pass

save_dialog = Dialog()

def show():
    print('Showing the dialog!')

def configure():
    save_dialog.save_dir = app.prefs.get('save_dir')

app モジュールも再定義して、インポートしたときに何も実行しないようにします。

In [None]:
# app.py ver3
import dialog

class Prefs:
    def get(self, name):
        pass

prefs = Prefs()

def configure():
    pass

最後に、mainモジュールが、すべてをインポート、すべてを configure、最初のアクティビティを実行するという3段階を実行します。

In [None]:
# main.py ver3
import app
import dialog

app.configure()
dialog.configure()

dialog.show()

これは、多くの状況でうまく働き、**依存注入（Dependency Injection: DI）** のようなパターンを可能にします。 しかし、時には、 明示的な configure ステップが可能となるようにコードを構造化することが困難なことがあります。2つの異なる段階をモジュールの中に持つのも、オブジェクトの定義をその構成から分離するために、コードを読みにくくしています。


### 動的インポート

第3の、しばしば最も簡単な循環インポート問題の解決法は、関数またはメソッドの中で import 文を使うことです。
これは、モジュールのインポートが、プログラムが最初に開始してモジュールを初期化しているときではなく、プログラムの実行中に起こるので、動的インポートと呼ばれます。

ここでは、dialogモジュールを再定義して動的インポートを使います。
dialog モジュールが初期化時に app をインポートするのではなくて、dialog.show 関数が実行時に app モジュールをインポートします。


In [None]:
# dialog.py ver4

class Dialog:
    def __init__(self):
        pass

# Using this instead will break things
# save_dialog = Dialog(app.prefs.get('save_dir'))
save_dialog = Dialog()

def show():
    import app  # Dynamic import
    save_dialog.save_dir = app.prefs.get('save_dir')
    print('Showing the dialog!')


dialogを最初にインポートして dialog.show を最後に呼び出します (app モジュールは、元々の例にあったのと同じで構いません)。



In [None]:
# app.py ver1
import dialog

class Prefs:
    def get(self, name):
        pass

prefs = Prefs()
dialog.show()


この方式は、1つ前の「インポート、構成、実行方式」と同様の効果があります。違いは、この方式がモジュールが定義されインポートされる方式に構造上の変更を必要としないことです。単に、循環インポートを他のモジュールにアクセスしなければならない瞬間まで遅らせるだけです。その時点では、他のすべてのモジュールが既に初期化されている (ステップ5がすべてで完了している) と考えられるでしょう。

ただし、一般にはこのような動的インポートは避けるべきです。import 文のコストは無視できませんし、ループでは特にひどく高価になりかねません。実行遅延によって、動的インポートは、実行時に、プログラムが開始してから随分時間が経ったのに、SyntaxError 例外が発生するなどという致命的なエラー (「項目76 関係する振る舞いをTestCase サブクラスで検証する」参照) を犯す危険もあります。しかし、これらの弱点も、プログラム全体を再構成するという別の解決策よりはましだという場合がしばしばあります。


### 覚えておくこと

- 循環依存は、2つのモジュールがインポート時に互いに呼び出すときに生じる。これは、プ
ログラムを開始時にクラッシュさせる。
- 循環依存を断ち切る最良の方法は、相互依存をリファクタリングして、依存木の底に切り離されたモジュールが来るようにすることである。
- 動的インポートが、 リファクタリングと複雑さを最小化して、モジュール間の循環依存を断ち切る最も単純な方式である。



## 項目 89 リファクタリングと利用のマイグレーションに warnings を考える

以前は予期されていなかったニーズを満たす新たな要求のために、API が変更されることはよくあります。API が小さくて、上にも下にも依存がわずかな間は、そのような変更は簡単です。プログラマが1人で、小さな API と、そのすべての呼び出し元を更新して、1回コミットすれば解決することはよくあります。

しかし、コードベースが大きくなると、API の呼び出し元が多くなったり、複数のソースリポジトリに分かれていて、API の変更で一度に呼び出し元を変更することが実際的でなかったり、不可能になってしまいます。その代わりに、協働してコードをリファクタリングし、API の使用法を最新の形式にマイグレーションしてくれるように、人々に注意して励ますための方法を考えないといけません。

例えば、自動車で平均速度と時間を指定し、どのくらいの距離を走行できるかを計算するモジュールを作るとします。つまり、平均速度 (マイル/時) と運転時間を引数として取る関数として定義します。


In [8]:
# Example 1
def print_distance(speed, duration):
    distance = speed * duration
    print(f'{distance} miles')

print_distance(5, 2.5)

12.5 miles


この関数はうまく動作し、この関数に依存するコードが多数あったとします。協働するプログラマは、このような距離を計算して出力する必要が共有コードベース全体であります。

現状うまくいっているようにも見えますが、このコードベースには、引数の距離の単位が明示されていないので間違いが起こりやすいという欠点があります。例えば、弾丸が秒速1,000メートルで3秒経ったときに、どこまで進んでいるか知ろうとしたときに、次のような間違った結果を得てしまうことがあり得ます。


In [9]:
# Example 2
print_distance(1000, 3)

3000 miles


この問題に対して、print_distance の API にオプションのキーワード引数 (「項目23 キーワード引数にオプションの振る舞いを与える」および「項目25 キーワード専用引数と位置専用引数で明確さを高める」参照) で speed, duration, 計算した距離の単位を指定できるようにします。

In [10]:
# Example 3
CONVERSIONS = {
    'mph': 1.60934 / 3600 * 1000,   # m/s
    'hours': 3600,                  # seconds
    'miles': 1.60934 * 1000,        # m
    'meters': 1,                    # m
    'm/s': 1,                       # m
    'seconds': 1,                   # s
}

def convert(value, units):
    rate = CONVERSIONS[units]
    return rate * value

def localize(value, units):
    rate = CONVERSIONS[units]
    return value / rate

def print_distance(speed, duration, *,
                   speed_units='mph',
                   time_units='hours',
                   distance_units='miles'):
    norm_speed = convert(speed, speed_units)
    norm_duration = convert(duration, time_units)
    norm_distance = norm_speed * norm_duration
    distance = localize(norm_distance, distance_units)
    print(f'{distance} {distance_units}')

弾丸の飛距離の関数呼び出しで、 正しい結果をマイルへの単位変換を指定するよう修正します。

In [11]:
# Example 4
print_distance(1000, 3,
               speed_units='meters',
               time_units='seconds')

1.8641182099494205 miles


この関数に単位指定を要求するのは良い方法に思えます。明示することでエラーの可能性が減り、初めての人にもコードが理解しやすくなります。しかし、API のすべての呼び出し元に、常に単位を指定するように移行することをどうすればできるでしょうか。 print_distance に依存するどのコードでも問題発生を最小限にして、呼び出し元が新たな単位引数をできるだけ早く採用するようにするにはどうすればいいでしょうか。

Python の組み込みモジュール warningsを使ってこの問題を解決します。warnings を使用する と、依存しているライブラリの変更に合わせてコードを修正するようにという通知を他のプログラムにするようプログラムできます。例外が主としてマシンによる自動エラー処理 (「項目87 APIからの呼び出し元を分離するために、ルート例外を定義する」 参照) であるのに対して、警告 (warnings) は、互いの協働で何を期待するかという人間間のコミュニケーションについてのものです。

print_distance を修正して、単位を指定するキーワード引数がないと警告を発するようにしま す。こうしておくと、引数はとりあえずオプションのままですが (「項目24 動的なデフォルト引数を 指定するときにはNoneとdocstring を使う」参照)、依存しているプログラムを実行している人々に、対応しないと将来問題が起きるかもしれないという注意を明示的に促すことができます。


In [12]:
# Example 5
import warnings

def print_distance(speed, duration, *,
                   speed_units=None,
                   time_units=None,
                   distance_units=None):
    if speed_units is None:
        warnings.warn(
            'speed_units required', DeprecationWarning)
        speed_units = 'mph'

    if time_units is None:
        warnings.warn(
            'time_units required', DeprecationWarning)
        time_units = 'hours'

    if distance_units is None:
        warnings.warn(
            'distance_units required', DeprecationWarning)  # 下記のwarning箇所
        distance_units = 'miles'

    norm_speed = convert(speed, speed_units)
    norm_duration = convert(duration, time_units)
    norm_distance = norm_speed * norm_duration
    distance = localize(norm_distance, distance_units)
    print(f'{distance} {distance_units}')

このコードが警告を発することを検証するため、関数を以前と同じ引数で呼び出し、warnings モジュールの sys.stderr 出力を捕捉します。


In [13]:
# Example 6
import contextlib
import io

fake_stderr = io.StringIO()
with contextlib.redirect_stderr(fake_stderr):
    print_distance(1000, 3,
                   speed_units='meters',
                   time_units='seconds')    # warning を出してほしいところ

print(fake_stderr.getvalue())


1.8641182099494205 miles



この関数に警告を追加するには、多数の定型句を繰り返す必要があり、可読性も保守性も悪くなります。警告メッセージは、warnings.warn が呼ばれた行を示していますが、本当に表示したかったのは、もうすぐ必要になるキーワード引数なしに print_distance が呼ばれた箇所です。

幸い、warnings.warn 関数は stacklevel パラメータをサポートしており、警告の原因となったスタック上の正しい場所を報告することが可能です。stacklevel を使うと、定型句を省略して他のコードのための警告を発することも可能です。オプション引数がないと警告を発し、デフォルト値を与えるヘルパー関数を次のように定義します。


In [14]:
# Example 7
def require(name, value, default):
    if value is not None:
        return value
    warnings.warn(
        f'{name} will be required soon, update your code',
        DeprecationWarning,
        stacklevel=3)
    return default

def print_distance(speed, duration, *,
                   speed_units=None,
                   time_units=None,
                   distance_units=None):
    speed_units = require('speed_units', speed_units, 'mph')
    time_units = require('time_units', time_units, 'hours')
    distance_units = require(
        'distance_units', distance_units, 'miles')

    norm_speed = convert(speed, speed_units)
    norm_duration = convert(duration, time_units)
    norm_distance = norm_speed * norm_duration
    distance = localize(norm_distance, distance_units)
    print(f'{distance} {distance_units}')

捕捉した出力を調べて、 これが問題の行を正しく把握したか検証します。

In [15]:
# Example 8
import contextlib
import io

fake_stderr = io.StringIO()
with contextlib.redirect_stderr(fake_stderr):
    print_distance(1000, 3,
                   speed_units='meters',
                   time_units='seconds')

print(fake_stderr.getvalue())


1.8641182099494205 miles
  print_distance(1000, 3,



warnings モジュールでは、警告が発生したときの動作を設定することもできます。選択肢の1つとしては、すべての警告がエラーになることで、警告を sys.stderr に出力する代わりに例外として上げることです。

In [16]:
# Example 9
warnings.simplefilter('error')
try:
    warnings.warn('This usage is deprecated',
                  DeprecationWarning)
except DeprecationWarning:
    pass  # Expected
else:
    assert False

warnings.resetwarnings()

この例外を送出する振る舞いは、自動化テストにおいて、依存性の上流で変更を検出し、テスト時にエラーを送出させるので、特に役立ちます。このようなテスト時に警告を発生させることは、共同している人々にコード変更の必要性を明確にする非常に良い方法です。Python インタプリタで -W error コマンドライン引数を使うか、このオプションを省略するために環境変数 PYTHONWARNINGS を error 等の値に設定することでも適用できます。

```
$ python -W error example_test.py
Traceback (most recent call last):
File ".../example_test.py", line 6, in <module>
warnings.warn('This might raise an exception ! ' )
UserWarning: This might raise an exception!
```

非推奨APIに依存するコードの責任者が、マイグレーションの必要性に気付いたなら、warnings モジュールで simplefilter と filterwarnings 関数を用い、エラーを無視するように設定することもできます (詳細については https://docs.python.org/ja/3/library/warnings.html 参照)。

In [17]:
# Example 10
warnings.resetwarnings()

warnings.simplefilter('ignore')
warnings.warn('This will not be printed to stderr')

warnings.resetwarnings()

プログラムをプロダクションに使い出すと、警告からエラーを起こさせるのは、極めて重大な時期にプログラムをクラッシュさせるので、意味がなくなります。それよりも良い方式は、警告を組み込みモジュール logging に複製することです。次のコードでは、logging.captureWarnings 関数を呼び出し、対応する py.warnings ロガーを構成します。

In [18]:
# Example 11
import logging

fake_stderr = io.StringIO()
handler = logging.StreamHandler(fake_stderr)
formatter = logging.Formatter(
    '%(asctime)-15s WARNING] %(message)s')
handler.setFormatter(formatter)

logging.captureWarnings(True)
logger = logging.getLogger('py.warnings')
logger.addHandler(handler)
logger.setLevel(logging.DEBUG)

warnings.resetwarnings()
warnings.simplefilter('default')
warnings.warn('This will go to the logs output')

print(fake_stderr.getvalue())

warnings.resetwarnings()





ロギングを使って警告を捕捉すると、プログラムで使っているエラー報告システムがプロダクションで重要な警告も受け取るようになることが確実になります。これは、テストがあらゆる極端な利用の場合を網羅しているわけではないため、特に有用です。

APIライブラリの保守担当者も正しい環境で明確で対応可能なメッセージを警告として出せていることを検証するユニットテストを検証すべきです (「項目76 関係する振る舞いを TestCase サブクラスで検証する」参照)。次のコードでは、warnings.catch_warnings 関数をコンテキストマネジャーとして使い (背景は「項目66 contextlib と with 文を try/finally の代わりに考える」参照) 上で定義 した require 関数の呼び出しをラップします。


In [19]:
# Example 12
with warnings.catch_warnings(record=True) as found_warnings:
    found = require('my_arg', None, 'fake units')
    expected = 'fake units'
    assert found == expected

警告メッセージを集めたら、番号、詳細メッセージ、カテゴリが自分の期待と合致しているか検証できます。

In [20]:
# Example 13
assert len(found_warnings) == 1
single_warning = found_warnings[0]
assert str(single_warning.message) == (
    'my_arg will be required soon, update your code')
assert single_warning.category == DeprecationWarning

### 覚えておくこと

- warnings モジュールは、APIの呼び出し元に非推奨利用について警告するのに使う。警告メッセージは、後でプログラムが変更により失敗する前に、 呼び出し元がコードを修正でき るようになる。
- -W error コマンドライン引数を使ってPython インタプリタに警告をエラーとして上げる。これは、依存性を減らす可能性を持つ自動化テストにおいて特に有用だ。
- プロダクションでは、警告を logging モジュールに複製して、既存のエラー報告システムが実行時に警告を捕捉することを確かにする。
- コードで起きる警告をテストして、依存する下流のコードで適切なときに警告が出されることを確かめる。


## 項目90 バグを回避するために静的解析を検討する

ドキュメントが提供されていると、 APIの利用者が正しい使い方を理解するのにとても役立ちますが (「項目84 すべての関数、クラス、モジュールについて docstring を書く」参照)、それだけでは十分でないことが多く、相変わらず不適切な使用によりバグを引き起こします。理想的には、呼び出し元がAPIを正しく使っていることと、APIで下流での依存関係を正しく使っていること確認する仕組みがプログラムにあることです。多くのプログラミング言語で、この必要性に答えて、ある種のバグを検出して取り除くためにコンパイル時の型チェックを取り入れています。

歴史的に Python は、動的な機能に焦点を絞っており、いかなるコンパイル時の型安全性も提供しませんでした。しかし、最近 Python は、特別な構文と組み込みの typing モジュールを導入し、変数、クラスフィールド、関数、メソッドに型情報を与えられるようにしました。これらの型ヒントは、緩やかな型付けを可能にするとともに、望ましい型を緩やかに指定できるようにします。

Python プログラムに型情報を追加する利点は、静的解析ツールを実行してプログラムのソースコードに対して、どこにバグが潜んでいるかを検出できることです。組み込みモジュール typing 自体は、いかなる型チェック機能も実装していません。ジェネリクスを含めて型を定義するための共通ライブラリを提供しているだけです。これは、Python コードに適用して、別のツールでその結果を利用できます。

Python インタプリタには複数の異なる実装 (例: CPython、PyPy) があるので、typing を利用する 静的解析ツールも複数の実装があります。 本書執筆時点(2019年秋) において、最もよく使われてい るのは、mypy (https://github.com/python/mypy)、pytype (https://github.com/google/pytype)、pyright (https://github.com/microsoft/pyright)、 pyre (https://pyre-check.org) です。 本書で取 り上げた typing事例には、--strict フラグでmypyを使いました。 ツールで扱うすべての警告を扱 います。 コマンドラインの実行例を示します。

