<a href="https://colab.research.google.com/github/suwatoh/Python-learning/blob/main/105_%E3%82%AA%E3%83%96%E3%82%B8%E3%82%A7%E3%82%AF%E3%83%88%E5%8F%82%E7%85%A7%E3%81%A8%E3%82%B3%E3%83%94%E3%83%BC.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

オブジェクト参照とコピー
========================

オブジェクトの型と値
--------------------

Pythonでは、あらゆるデータを扱うための基本的な仕組みとして**オブジェクト**（object）が用意されている。数値や文字列のような基本的なデータも含め、プログラム中の全てのデータはオブジェクト、あるいはオブジェクト同士の関係として表される。

全てのオブジェクトは、**同一性**（identity）、**型**（type）、**値**（value）を持つ。

オブジェクトの同一性は、オブジェクトを一意に識別するための整数であり、オブジェクトが生成されたあとは変更されない。CPython では、これはオブジェクトのメモリアドレスである。

`is` 演算子は 2 つのオブジェクトの同一性を比較する。組み込み関数 `id()` は、引数として渡されたオブジェクトの同一性を表す整数を返す。

In [None]:
a = 'Hello, world!'
b = 'Hello, world!'
# 同じ文字列でも別々に生成されメモリ上に配置されることがある
try:
    assert a is b
except AssertionError:
    print(f"{id(a)=}, {id(b)=}")

id(a)=132854979180208, id(b)=132854979181936


オブジェクトの型は、オブジェクトの種類のことであり、`__class__` 属性で参照できる。例えば、`int` は整数の組み込み型であり、`str` は文字列の組み込み型である。

組み込み関数 `type(object)` は、`object.__class__` を返す。

In [None]:
var = 'hoge'
assert type(var) == var.__class__ == str

また、オブジェクトの型を調べるのに組み込み関数 `isinstance()` も使える。

``` python
isinstance(object, classinfo)
```

第 1 引数に指定したオブジェクトの型が、第 2 引数に指定した型と一致するときに `True`、そうでないときに `False` を返す。第 2 引数に「型のタプル」を指定して、その中のどれかと一致するかどうかチェックすることもできる。

In [None]:
assert isinstance('hello', (int, str))

オブジェクトの値は、メモリ上のデータそのものである。

オブジェクトは、値が変更可能なら**ミュータブル**（mutable）、変更不可能なら**イミュータブル**（immutable）と呼ぶ。数値（`int`, `float`）や文字列・バイト列（`str`, `bytes`）、タプル（`tuple`）といったオブジェクトはイミュータブルであり、一度値が生成されると、二度と変更されることはない。

`==` 演算子や `!=` 演算子は、2 つのオブジェクトの値を比較する。

In [None]:
a = 'Hello, world!'
b = 'Hello, world!'
assert a == b

組み込みオブジェクト `None`、`NotImplemented`、`Ellipsis` は、それぞれ専用の型を持ち、その型にはその値だけが存在する。つまり、これらの組み込み型には単一の値しかなく、その値を表すオブジェクトは `None`、`NotImplemented`、`Ellipsis` の各組み込み名で参照されるものだけである。

| オブジェクト | 意味 |
|:---|:---|
| `None` | 値の非存在を表すリテラル |
| `NotImplemented` | 関数やメソッドが（他の型に対して）実装されていないことを示すために返す特殊な値のリテラル |
| `Ellipsis` | `...` と同じ。拡張スライス構文で使われるほか、値は存在するが省略されていることを表すために使われる特殊な値のリテラル。<br /><br />`pass` に似ているが、`pass` は文であるのに対し、`Ellipsis` はアトムであり式として評価される |

とくに `None` はキーワードとして予約され、常に 1 つだけ存在するので、`is` 演算子で安全に比較できる。

In [None]:
print(f"{type(None) = }")
print(f"{type(NotImplemented) = }")
print(f"{type(Ellipsis) = }")
assert Ellipsis is ...

type(None) = <class 'NoneType'>
type(NotImplemented) = <class 'NotImplementedType'>
type(Ellipsis) = <class 'ellipsis'>


代入と参照
----------

### 代入文

変数に対して実際にデータを関連付ける操作を**代入**（assignment）という。変数に代入したデータを利用する操作は**参照**（reference）と呼ばれる。Python では、事前に変数の**宣言**（declaration）をすることなく、いきなり代入することで変数を定義できる。。

Python で代入は、典型的には、**代入文**（assignment statement）によって実行される。代入文の完全な構文は次のようになっている。

``` python
target_list =[ target_list =[...]] 式
```

先に右辺の式が評価され、右辺が「式のリスト」（カンマ区切りリスト）ならタプル評価（**パック**; pack）される。

代入は target_list の形式に従って以下のように行われる。

■ target_list が単一の変数の場合:  
変数への代入が行われる。

■ target_list がカンマ区切りの変数リストの場合:  
右辺はイテラブルなオブジェクトを返す必要があり、**アンパック**（unpack）される。すなわち、イテラブルから要素を 1 つずつ取得し、取得した順序で各要素を target_list の変数リストに対して左から右へと代入していく。右辺が辞書の場合は、各キーを取得する。右辺が「式のリスト」の場合はタプル評価（パック）ののち、アンパックされる（**多重代入**と呼ばれる）。取得した順序を保つ性質を利用して変数の値の入れ替え（スワッピング）が可能である。target_list に丸括弧が使われているときは再帰的に代入が行われる。右辺がイテラブルでなかったり、あるいは、target_list の変数の数とイテラブルから得られる要素の数が一致しないと `ValueError` 例外が発生する。

In [None]:
# アンパックは右辺の要素を順番どおりに左辺の左から右へと代入していく
a, b, c = [1, 2, 3]
assert a == 1 and b == 2 and c == 3

# 右辺が辞書の場合、キーを取得する
a, b = {'a': 1, 'b': 2}
assert a == 'a' and b == 'b'

# 多重代入
a, b, c = 1, 2, 3
assert a == 1 and b == 2 and c == 3

# スワッピング
b, a = a, b
assert a == 2 and b == 1

# target_list に丸括弧が使われているとき、代入は再帰的に行われる
(a, b), (c, d, e), (f, g) = (-1, 0), (1, 2, 3), (4, 5)
print(f"{a=}, {b=}, {c=}, {d=}, {e=}, {f=}, {g=}")

a=-1, b=0, c=1, d=2, e=3, f=4, g=5


■ target_list が 1 個のスター付き変数を含む変数リストの場合  
target_list が変数リストで、頭にアスタリスク `'*'` が 1 つ付いた変数（スター付き変数）が 1 つだけ含まれる場合には、まず、スター付き変数より前の変数に、右辺のイテラブルの要素が左から右へ順に代入される。次に、スター付き変数より後ろの変数に、同じ数だけのイテラブルの末尾の要素が代入される。最後に、スター付き変数に、イテラブルの残った要素の<font color="red">リスト</font>が代入される（リストは空の場合もある)。この操作のどこかで、イテラブルの要素が足りないということがあれば、`ValueError` 例外が発生する。

In [None]:
t = tuple(range(7))
a, b, *c, d, e = t
print(f"{a=}, {b=}, {c=}, {d=}, {e=}")  # c はタプルではないことに注意！

a=0, b=1, c=[2, 3, 4], d=5, e=6


Python では必要のない値は慣例的にアンダースコア `_` に代入することがある。アンパックで必要のない要素を `_` にまとめて代入するという手法がよく使われる。

In [None]:
t = 1, 2, 3, 4, 5
x, y, *_ = t  # x, y = t[0:2] と同じ
assert x == 1 and y == 2

**target_list が属性参照の場合**:  
target_list が `a.x` のようにドットを使った属性参照の場合、属性への代入が行われる。モジュール内の名前に対する参照も属性の参照である。`modname` というモジュールをインポートした場合、式 `modname.funcname` では `modname` はモジュールオブジェクトで `funcname` はその属性である。

**target_list が添字表記の場合**:  
target_list が `a[i]` のように `[]` を使った添字表記の場合、それにより参照される要素への代入が行われる。

**target_list がスライスの場合**:  
target_list が `a[i:j]` のように `[]` とコロン `:` を使ったスライスの場合、スライスでアクセスされる各要素への代入が、カンマ区切りリストの場合と同様に行われる。

In [None]:
li = ["あ", "い", "う", "え", "お"]
li[3:] = "エ", "オ"
assert li == ["あ", "い", "う", "エ", "オ"]

1 つの代入文で `=` を複数使用することが特別な構文として許可されている。

In [2]:
a = b, c = d = 3, 5
assert a == d == (3, 5) and b == 3 and c == 5

`=` の複数使用は、`=` を演算子としてチェーンさせているわけではないことに注意する。Python では `=` は代入文という文を構成し、値を返さない。したがって、次のような書き方はできない。

``` python
# 構文エラーとなる
a = (b = 1)
```

### 拡張代入文

**拡張代入文**または**累算代入文**（augmented assignment statement）は、二項演算と代入文を組み合わせて 1 つの文にしたものである。

``` python
target <二項演算子>= <式のリスト>
```

`<二項演算子>` に入る演算（拡張代入型の二項演算）は、全ての算術演算とビット演算である。

  * `+=`、`-=`、`*=`、`@=`、`/=`、`//=`、`%=`、`**=`
  * `>>=`、`<<=`、`&=`、`^=`、`|=`

拡張代入文は、target と式のリストを評価し、それら 2 つの被演算子間で特定の拡張代入型の二項演算を行い、結果をもとの target に代入する。

通常の代入文と違って、アンパックは起こらない。

また、通常の代入文と違って、拡張代入文は右辺を評価する前に左辺を評価する。例えば、`a[i] += f(x)` はまず `a[i]` を調べ、`f(x)` を評価して加算を行い、最後に結果を `a[i]` に割り当てる。

拡張代入型の二項演算は、右辺をすべて評価した後に行われる。

In [None]:
n = 2
n *= 3 + 5  # 右辺が評価された後に * が計算されるので n = n * (3 + 5)　と同じ)
assert n == 16

**Python の拡張代入は、単に二項演算と通常の代入をまとめた省略記法ではなく、両者は厳密には同じ動作にはならない**。

① target は一度しか評価されない。

In [None]:
def f():
    print("f called")
    return [10]

print("通常代入:")
f()[0] = f()[0] + 1  # f()[0] が 2 回評価される

print("拡張代入:")
f()[0] += 1          # f()[0] が 1 回評価される

通常代入:
f called
f called
拡張代入:
f called


② 拡張代入型の二項演算は、可能な限り「インプレース」（in-place）で実行される。つまり、新しいオブジェクトを作成してそれを代入するのではなく、既存のオブジェクト自体が変更される。

In [None]:
a = [1, 2, 3]
print(id(a))
# 拡張代入：元のリストがそのまま変更される
a += [4]  # 実際には a.append(4) と同じ操作
print(id(a))

# 通常の代入：新しいリストが作られて a に再代入される
a = a + [5]
print(id(a))

136513589214208
136513589214208
136513812221056


### for ループ

Python の for ループは、反復処理の際に代入を行う。

for ループは、典型的には、for 文によって実行される。for 文の完全な構文は次のようになっている。

``` python
for target_list in <式>:
    ...
[else: ...]
```

`in` の右辺は、一度だけ評価され、イテラブルなオブジェクトを返す必要がある。イテラブルから取得される各値について、通常の代入文と同じルールに従って target_list への代入が行われる。

In [None]:
for x, *y, z in [(1, 2, 3, 4), (5, 6, 7, 8)]:
    print(f'{x} + {z} = {x + z}')
    print(f'{y = }')

1 + 4 = 5
y = [2, 3]
5 + 8 = 13
y = [6, 7]


for ループは、[リスト内包表記](https://docs.python.org/ja/3/tutorial/datastructures.html#list-comprehensions)、[集合内包表記](https://docs.python.org/ja/3/tutorial/datastructures.html#sets)、[辞書内包表記](https://docs.python.org/ja/3/tutorial/datastructures.html#dictionaries) の式でも実行される。

In [None]:
# リスト内包表記
a = [y for x, *y, z in [(1, 2, 3, 4), (5, 6, 7, 8)]]
print(f'{a = }')

# 集合内包表記
b = {tuple(y) for x, *y, z in [(1, 2, 3, 4), (5, 6, 7, 8)]}
print(f'{b = }')

# 辞書内包表記
c = {x: y for x, *y, z in [(1, 2, 3, 4), (5, 6, 7, 8)]}
print(f'{c = }')

a = [[2, 3], [6, 7]]
b = {(2, 3), (6, 7)}
c = {1: [2, 3], 5: [6, 7]}


### 代入式

`:=` 演算子を用いる**代入式**（assignment expression）は、式の中で代入でき、代入した値をそのまま式の値として利用できる。ただし、通常の代入文のルールがサポートされておらず、最もシンプルな代入（左辺が単一の変数で右辺が単一のオブジェクト）のみ可能である。右辺のタプル評価（パック）やアンパックは行われないので注意する。

In [None]:
if var1 := ('red', 'blue'):  # var1, var2 := 'red', 'blue' も var1, var2 := ('red', 'blue') も構文エラーとなる
    print('OK')

print(f'{var1=}')

OK
var1=('red', 'blue')


`:=` 演算子は、セイウチ（walrus）の目と牙に似ているため、「セイウチ演算子」や「ウォルラス演算子」の愛称で呼ばれている。演算子の優先順位は最下位（ラムダ式よりも低い）なので、基本的に丸括弧で囲む必要がある。

代入文は、式文として使用できないという構文上の制約がある。このため、単独で使うと式文として使用していると解釈され、構文エラーとなる。

``` python
# 構文エラーとなる
x := 1
```

したがって、代入文は式が必要な場所にしか置けない。例えば、次の場所で使用できる。

  * if / elif / while の条件
  * 内包表記
  * assert 文の条件
  * 関数呼び出しの引数

代入文と for 文の target_list には代入式を置けない。

``` python
# 構文エラーとなる
(x := y) = 1
for (x := y) in data:
    ...
```

### 代入のセマンティクス

プログラミングにおける「代入」の振る舞いには、大きく分けて「値セマンティクス」と「参照セマンティクス」の 2 種類が存在する。

**値セマンティクス（箱のモデル）**:  
C では、変数は「値を入れる箱」に例えられる。変数を宣言すると、型に応じた固定サイズのメモリ領域（箱）が確保され、代入はその箱の中に値を書き込む操作となる。同じ変数に再代入すると、箱の中身が新しい値で上書きされる。変数を別の変数に代入すると、値がコピーされるため、それぞれは独立したメモリ領域を持つ。したがって、コピー先を変更してもコピー元には影響しない。これを**値セマンティクス**（value semantics）と呼ぶ。

**参照セマンティクス（ラベルのモデル）**:  
Python では、変数は「オブジェクトに貼られたラベル」に例えられる。Python では全てがオブジェクト（CPython の実装では C 構造体）であり、変数はそのオブジェクトを一意に特定するための情報（同一性）を「参照」として保持する。代入は変数名（ラベル）をオブジェクトに**束縛**（bind）する操作となり、再代入は別のオブジェクトにラベルを付け替える**再束縛**（rebind）に相当する。del 文はこの束縛を**解除**（unbind）する操作である。変数を別の変数に代入すると、参照がコピーされるため、2 つの変数が 1 つのオブジェクトを共有することになる。これを**参照セマンティクス**（reference semantics）と呼ぶ。

In [None]:
# Python では変数のコピーは、値をコピーするのではなく、参照をコピーする
a = 'Hello, world!'
b = a
assert a is b  # 2 つの変数は同じオブジェクトを参照している
a = 'Hello, Python!'  # 文字列は変更不可能なので、再代入している
assert b == 'Hello, world!'  # b は変化なし

数値や文字列、タプルなどのイミュータブルな基本型では、代入するオブジェクト自体が変化しないため、2 つのセマンティクスの違いが表面化しない。一方、リストや辞書などのミュータブルなオブジェクトでは、代入した変数は C のポインタのように振る舞う。変数がコピーされると、一方の変数で行ったオブジェクトに対する変更を他方の変数から見ることができる。

In [None]:
a = ['spam', 'ham', 'eggs']
b = a
assert a is b  # 同じオブジェクトを指している
a.append('bacon')
assert b == ['spam', 'ham', 'eggs', 'bacon']  # b からも変更が見える

変数を参照する際、C では変数に割り当てられたメモリ領域から直接値を読み出すのに対し、Python ではまず変数がどのオブジェクトに束縛されているかを解決し、そのオブジェクトにアクセスして値を取得するという違いがある。

### スコープと名前空間

Python では、名前の束縛は代入だけでなく、関数定義、クラス定義、import 文などでも起こる。どれも本質的には同じで、「（変数名、関数名、クラス名、モジュール名といった）名前」と「オブジェクトへの参照」の対を、**名前空間**（namespace）と呼ばれる構造に登録している。ほとんどの名前空間は、現状では Python の辞書として実装されている。名前を参照する際には、この名前空間が使用される。束縛の解除（del 文）は、名前空間から名前の登録を削除している。

一方、プログラミング言語には「名前を参照できる範囲」として**スコープ**（scope）という概念があり、Python でそれは「**名前を名前空間から直接参照できるようなコードブロック**」のことを指す。ここで「直接参照できる」とは、`spam.egg` のようなドット修飾された形式ではなく単に `egg` のように名前を参照した際に、その名前空間から名前を見つけようと試みることを意味する。

Python では以下のスコープを英語名の頭文字をとって **LEGB** と呼んでいる。

  1. **ローカルスコープ（Local scope）**:  
  現在の関数のスコープ
  2. **エンクロージングスコープ（Enclosing scope）**:  
  ローカルスコープを囲む関数のスコープ
      * Python では、関数定義のネスト（入れ子）が可能であり、ネストされた（内側の）関数と外側の関数でそれぞれ独自のスコープが形成される。
  3. **グローバルスコープ（Global scope）**:  
  モジュール（Python ファイル）のスコープ
      * モジュール（ファイル）全体が「ひとつのコードブロック」である。
      * インタプリタのトップレベルで実行された文は、スクリプトファイルから読み出されたものでも、対話的に読み出されたものでも、`__main__` という名前のモジュールの一部分であるとみなされ、独自のスコープが形成されている。
  4. **ビルトインスコープ（Builtins scope）**:  
  どのモジュールのファイルも含まれるスコープ

このようにコードブロックによって決まるスコープは、**レキシカルスコープ**（lexical scope）あるいは**静的スコープ**（static scope）と呼ばれる。

``` text
┌───────────────────────────────────────────────────────────┐
│<ビルトインスコープ>                                                                                                  │
│┌────────────────┐┌────────────────┐┌─────────────────────┐│
││<__main__ のグローバルスコープ> ││<module_A のグローバルスコープ> ││<module_B のグローバルスコープ>           ││
││import module_A                 ││import module_B                 ││def func(arg):                            ││
││                                ││                                ││  ┌──────────────────┐││
││def func(arg):                  ││def func(arg):                  ││  │<func のローカルスコープ>           │││
││  ┌─────────────┐││  ┌─────────────┐││  │<subfunc のエンクロージングスコープ>│││
││  │<func のローカルスコープ> │││  │<func のローカルスコープ> │││  │                                    │││
││  │                          │││  │                          │││  │def subfunc(arg):                   │││
││  │                          │││  │                          │││  │  ┌───────────────┐│││
││  │                          │││  │                          │││  │  │<subfunc のローカルスコープ>  ││││
││  │                          │││  │                          │││  │  │                              ││││
││  │                          │││  │                          │││  │  └───────────────┘│││
││  └─────────────┘││  └─────────────┘││  └──────────────────┘││
│└────────────────┘└────────────────┘└─────────────────────┘│
└───────────────────────────────────────────────────────────┘
```

LEGB の特徴は、それぞれ自分専用の名前空間を持っていて、名前を参照するときにそれを使用することである。それらの名前空間は、作成される時点と寿命（**生存期間**と呼ばれる）が次のように異なる。

| 名前空間 | 生存期間 |
|:---|:---|
| **関数の名前空間** | 関数が呼び出されたときに作成され、関数から戻ったときや、関数内で例外が送出され、かつ関数内で処理されなかった場合に削除さ<br /><br />れる。再帰呼出しのときには、各々の呼び出しで各自の名前空間が作成される |
| **モジュールの名前空間** | モジュールが最初にインポートされたときに作成され、通常はインタプリタが終了するまで残る |
| **組み込み名の名前空間** | インタプリタが起動したときに作成され、組み込み変数・組み込み関数・組み込み例外の名前が自動的に登録され、決して削除されない |

組み込み名の名前空間は、標準ライブラリの `builtins` モジュールとして実装されている。例えば `builtins` をインポートすると組み込み関数 `open()` を `builtins.open()` として呼び出せる。

異なる名前空間に同じ名前があっても、それらは別物として扱われるため、名前の衝突が起こらない。例えば関数 `builtins.open()` と `os.open()` と `gzip.open()` は同じ `open` という関数名が使われているが、名前空間で区別されている（それぞれ組み込み名の名前空間、`os` モジュールの名前空間、`gzip` モジュールの名前空間）。

現在実行中のスコープ内で束縛された名前は、そのスコープで**ローカル**（local）という。対する語は**グローバル**（global）であるが、Python では「モジュールレベル（関数の外側）で束縛された」ことを指している。Python で両者は対立する概念ではない。モジュールレベルで定義された変数は「グローバル」である一方、そのグローバルスコープに対しては「ローカル」である。

名前の束縛操作には、その名前が `nonlocal` または `global` と宣言されない限り、「**スコープのローカルな名前はそのスコープの名前空間に登録される**」というルールがある。

したがって、デフォルトでは、関数内での名前束縛がグローバルな名前や組み込み名を上書きしたり、グローバル変数の定義が別のモジュールの変数や組み込み名を上書きするようなことは起こらない。

次のコードでは、2 行目で変数 `list` にリストを代入した後でも、`builtins.list` として組み込み関数を呼び出せること、さらに、5 行目の `del list` によって変数 `list` を解放すると、`builtins.` の修飾なしに直接組み込み関数を呼び出せることを示している。

In [None]:
import builtins
list = [0, 1, 2, 3]
numbers1 = builtins.list(range(4))  # builtins 経由なら組み込み関数を呼び出せる
print(f"{numbers1=}")
del list
numbers2 = list(range(4))  # グローバル変数名の削除後は組み込み名にアクセスできる
print(f"{numbers2=}")

numbers1=[0, 1, 2, 3]
numbers2=[0, 1, 2, 3]


組み込み関数 `globals()` と `locals()` で現在の名前空間の中身を辞書として直接見ることができる。

In [None]:
global_var = 1

def f():
    local_var = 100
    print(f'{locals() = }')  # locals() は今いるスコープの現在の名前空間を見る

f()
assert globals()['global_var'] == 1  # globals() は現在のモジュールの名前空間を見る

locals() = {'local_var': 100}


### LEGB ルールと自由変数

Python がドット修飾されない名前を解決するときのスコープの探索順序は、LEGB の順序に従うことから、**LEGB ルール**と呼ばれる。すなわち

  * まず今いるスコープで名前を探す。名前が見つからなければ、すぐ外側のスコープで名前を探す。こうした探索を近いほうから外側へ順に繰り返していき、最初に見つかったものを使う。これにより、内側のスコープのローカル変数は外側のスコープのローカル変数を「覆い隠す」。
  * 逆に、外側のスコープから、内側のスコープで名前を探す方法はない。これにより、関数のブロックの外側からは関数のローカル変数が「見えない」。

変数が、あるコードブロック内で使用されているが、そのブロック内で定義されていない場合、その変数は**自由変数**（free variable）と呼ばれる。自由変数は、ローカル変数ではないから、外側のスコープで定義されていれば有効であるが、そうでなければ `NameError` 例外が送出される。

In [None]:
x = 10  # モジュールレベルで束縛

def f():
    print("In f:")
    print(f"{x=}")  # この x は自由変数で、モジュールの名前空間から参照される

def g():
    print("In g:")
    print(f"{y=}")  # この y は無効

try:
    f()
    g()
except NameError:
    print("無効な参照")

In f:
x=10
In g:
無効な参照


同じスコープ内で変数を参照した後に代入を行うと、`UnboundLocalError` 例外が発生する。これは、代入がある時点でその変数はスコープ全体でローカル変数とみなされるのであって、外側のスコープを参照する自由変数にはならないからである。Python のインタプリタはソースコードを逐次そのまま実行しているわけではなく、関数を実行する前に関数全体を読み取って、どの変数がローカルになるかを先に決める。そのため、実行時には「ローカル変数が定義前に使われた」と解釈されて `UnboundLocalError` 例外が送出される。

In [None]:
x = 0  # グローバル変数

def f():
    print(f"f scope: {x = }")  # この x はローカル変数で、この位置での参照は不可能
    x = 100

try:
    f()
except UnboundLocalError as err:
    print("無効な参照:", err)

無効な参照: cannot access local variable 'x' where it is not associated with a value


拡張代入文は更新しているだけに見えるため気づきにくいが、先に左辺の変数を参照してから変数を束縛する（ローカル変数として扱う）ため、同じ種類のエラーを引き起こす。

In [None]:
x = 0  # グローバル変数

def f():
    x += 1
    print(f"f scope: {x = }")

try:
    f()
except UnboundLocalError as err:
    print("無効な参照:", err)

無効な参照: cannot access local variable 'x' where it is not associated with a value


このような種類のエラーを回避するには、`global` または `nonlocal` を使用する。

現在のローカルスコープ内で `global` と宣言された変数は、グローバル変数とみなされる。これにより、自由変数はモジュールと共有され、ローカルスコープ内で変更することができる。global 文の構文は次のとおり:

``` python
global 識別子[, 識別子...]
```

現在のローカルスコープ内で `nonlocal` と宣言された変数は、そのスコープを囲む 1 つ外側のローカルスコープ（エンクロージングスコープ）のローカル変数とみなされる。これにより、自由変数は 1 つ外側の関数と共有され、現在のローカルスコープ内で変更することができる。nonlocal 文の構文は次のとおり:

``` python
nonlocal 識別子[, 識別子...]
```

[公式チュートリアル](https://docs.python.org/ja/3/tutorial/classes.html#scopes-and-namespaces-example)には、異なるスコープと名前空間がどのように参照されるか、また `global` および `nonlocal` が変数の束縛にどう影響するかを実演するコード例を載せている。以下に引用する。

In [None]:
def scope_test():
    def do_local():
        spam = "local spam"

    def do_nonlocal():
        nonlocal spam
        spam = "nonlocal spam"

    def do_global():
        global spam
        spam = "global spam"

    spam = "test spam"
    do_local()
    print("After local assignment:", spam)
    do_nonlocal()
    print("After nonlocal assignment:", spam)
    do_global()
    print("After global assignment:", spam)

scope_test()
print("In global scope:", spam)

After local assignment: test spam
After nonlocal assignment: nonlocal spam
After global assignment: nonlocal spam
In global scope: global spam


このとおり、（デフォルトの）ローカルな代入は `scope_test()` 上の `spam` への束縛を変更しない。`nonlocal` と宣言された変数への代入は `scope_test()` 上の `spam` への束縛を変更し、`global` と宣言された変数への代入はモジュールレベルの束縛を変更している。

### スコープの粒度

Python は同じくレキシカルスコープを採用する JavaScript や C# といった言語ほど細かくはスコープを形成しない。実行時の名前解決に影響するスコープは、ファイルより狭い領域では、関数定義によって作られるものだけである。if 文などは新しいスコープを作らないことに注意する。

In [None]:
%reset -f

# if 文ではスコープは形成されない
if True:
    x = 10
assert x == 10  # if 文の外側から if 文の中で定義された x を参照できる

なお、若干の補足説明が必要である。

■ ラムダ式  
ラムダ式は、意味付け的には単に通常の関数定義に構文的な糖衣をかぶせたもの（**シンタックスシュガー**）に過ぎないため、関数のローカルスコープが形成される:

In [None]:
a = 1
f = lambda: locals()  # noqa: E731 (PEP 8 違反)
assert f() == {}

■ 内包表記  
内包表記の式は、特別に、ネストされた関数として実行されているかのように振る舞う。Python 3.11 以前では、実際に「要素を計算するための関数」が暗黙的に作成され、その関数を実行する形で要素を生成する仕組みになっていたため、本物のローカルスコープが形成されていた。しかし、実行の度に一度しか使われない関数を作成するのは効率が悪いことから、Python 3.12 で暗黙的な関数作成が廃止され、直接的に要素を計算・生成する仕組みに変更された（インライン化）。インライン化によって内包表記の反復変数はそれを含むスコープのローカル変数となったが、外側変数の値を一時的に保存・復元することで、外側変数には影響を残さないようにしている。このため、ネストされた関数のような振る舞いに変更はない。

In [None]:
def myfunc():
    a = "spam"
    x = 100
    li = [(x, locals()) for x in range(3)]
    print(f"{li = }")  # Python 3.12 で内包表記内の locals() は関数のローカル変数を全て返すようになった
    print(f"{x = }")  # 外側変数への影響はない

myfunc()

li = [(0, {'a': 'spam', 'x': 2}), (1, {'a': 'spam', 'x': 2}), (2, {'a': 'spam', 'x': 2})]
x = 100


対照的に、for 文では反復変数の初期化によって外側変数を束縛してしまう。他のプログラミング言語とは異なり、Python の for 文では新しいスコープが形成されないからである。

In [None]:
%reset -f

# for 文ではスコープが形成されない
for x in range(10):
    pass
assert x == 9  # for 文の外側から反復変数 x を参照できる

仮引数と実引数
--------------

### 引数の受け渡し

関数定義のヘッダーに表れる変数を**仮引数**または**パラメータ**（parameter）という。関数を呼び出す際に関数に引き渡される式は**実引数**または単に**引数**（argument）という。

例えば、`def func(arg): pass` という関数定義において変数 `arg` は仮引数であり、`func` の呼び出し形式 `func(1)` において整数 `1` は実引数である。

多くのプログラミング言語では、引数の受け渡しの方法が次の 2 種類で説明される。

  * **値渡し**（call by value）: 関数に引数が保持する「値のコピー」を渡す。
  * **参照渡し**（call by reference）: 関数に引数の「別名」（変数そのものの参照）を渡す。

一方、Python の[公式 FAQ](https://docs.python.org/ja/3/faq/programming.html#how-do-i-write-a-function-with-output-parameters-call-by-reference) には、「*前提として、Python では引数は代入によって渡されます。*」（*Remember that arguments are passed by assignment in Python.*）とある。これは、次の 2 つのことを意味している。

  1. 関数に「オブジェクトへの参照」のコピーを渡す。
  2. 仮引数は関数のローカル変数になる。

Python の変数が保持しているのは常にオブジェクトへの参照だけなので、1 は「値渡し」である。

なお、「値渡し」「参照渡し」という用語は、関数内で仮引数を変更したときに呼び出し側の変数に影響しないのかどうかで説明されることがあるが、これは本来「受け渡しの方法」とは別の問題である。この点については、Java に関するものではあるが次の記事が参考になる。

  * [もう参照渡しとは言わせない - Qiita](https://qiita.com/mdstoy/items/2ef4ada6f88341466783)

Python では、ローカル変数の再束縛と、引き渡されたオブジェクトの変更可能性によって、呼び出し側の変数への影響が説明される。

関数にイミュータブルなオブジェクトが渡された場合、仮引数に対する変更は再束縛だけであるが、ローカル変数の変更は名前空間が異なる呼び出し側の変数に影響することはない。以下のコードで確認できる:

In [None]:
def func(arg):
    arg = arg * 2

a = 1
func(a)
print(f"{a=}")  # 呼び出し側には影響がない

a=1


関数にミュータブルなオブジェクトが渡された場合、そのオブジェクト自体が変更されると、関数の呼び出し側にも反映される。これは、代入の参照セマンティクスにより、仮引数と実引数が同じオブジェクトを共有しているために起こったことである。

In [None]:
def func(arg):
    arg[0] = 'baa'
    print(f"{id(arg)=}")

li = ['hoge', 'fuga']
func(li)
assert li == ['baa', 'fuga']
print(f"{ id(li)=}")

id(arg)=132854979190464
 id(li)=132854979190464


ミュータブルなオブジェクトが渡された場合でも、関数の本体で仮引数に対して再代入を行うと、その時点で共有関係は解消されるので、以降に仮引数に対して行った操作は呼び出し側の変数に影響を与えない。

In [None]:
def func(arg1, arg2):
    arg1 = arg1 + arg2
    print(f'{id(arg1)=}')  # arg1 は新しいリストへの参照を保持する

a = [1]
b = [2]
func(a, b)
assert a == [1] and b == [2]
print(f'   {id(a)=}')

id(arg1)=132854979190016
   id(a)=132854979189824


### 位置引数とキーワード引数

実引数が `kwarg=value` の形を取っているとき、その実引数は**キーワード引数**（keyword argument）という。キーワード引数以外の実引数を**位置引数**（positional argument）と呼ぶ。

関数の呼び出しにおいて、位置引数は常に仮引数の順番に従って渡されるのに対して、キーワード引数にはこのような拘束はない。**キーワード引数は位置引数の後でなければならない**。つまり、ひとたびキーワード引数を渡すと、それより後ろの引数にも全てキーワード引数を渡さなければならなくなる。

位置引数とキーワード引数が実引数の区別であるのに対して、**位置専用引数**と**キーワード専用引数**は仮引数の区別である。関数定義の引数リストに `/` オプションがある場合、それより前の引数は位置専用引数とされ、キーワード引数で引数を渡せない。関数定義の引数リストに `*` オプションがある場合、それより後ろの引数はキーワード専用引数とされキーワード引数で渡す必要がある。位置専用引数でもキーワード専用引数でもない引数は、**位置またはキーワード引数**と呼ばれる。

``` text
def f(pos1, pos2, /, pos_or_kwd, *, kwd1, kwd2):
      -----------    ----------     ----------
       │             │                │
       │     位置またはキーワード引数  │
       │                               └─ キーワード専用引数
       └─ 位置専用引数
```

位置引数は、引数の名前に意味がない場合に推奨される。たとえば、2 つの引数を加算する関数の場合、各引数の名前に意味はない（`add(a, b)` のように適当な名前が使われる）。このような場合、そもそも仮引数を位置専用引数とすれば、関数の利用者が引数の名前を使用することが無いから、将来引数の名前を変更することが容易である。

逆に、引数の名前に意味があるなら、キーワード引数で渡すほうが関数呼び出しの意味がより明確になる。

一般に、引数にブール値を渡す場合は、引数の名前に意味がある。ブール値の位置引数を使用して関数を呼び出すと、ブール値の意味が呼び出し元で明確でないため、可読性が下がる。たとえば、呼び出し元で `foo(a, False, True)` と書くより `foo(a, strict=False, verbose=True)` と書くほうが意味を理解しやすい。

このとき、関数がブール値の位置引数を受け付けるなら、将来的に引数を後ろに追加して関数を拡張することが難しくなる。呼び出し時にブール値のキーワード引数を使用すると、追加された引数にもすべてキーワード引数を使用しなければならなくなるからである。追加された引数の名前に意味がないケースでは、これは不都合である。ブール値の仮引数をキーワード専用引数としておけば、引数の追加に問題がなくなる。

リンター Flake8 のプラグイン [flake8-boolean-trap](https://pypi.org/project/flake8-boolean-trap/) は、関数の定義や呼び出しにおけるブール値の位置引数をチェックする。Ruff は flake8-boolean-trap の解析ルールも実装している。エラーコードは「FBT〇〇〇」の形式である。次のようにルールを追加すればよい。

``` ini
[tool.ruff.lint]
extend-select = ["FBT"]
```

### 引数のデフォルト値

仮引数が `parameter=expression` の形を取っているとき、その仮引数は「デフォルト値を持つ」という。ここで、`expression` は式でありデフォルト値と呼ばれる。PEP8 は、この `=` の両側にスペースを入れることを禁止している。

位置引数は、関数定義時の仮引数の数と、関数呼び出し時の実引数の数を一致させることが原則であるが、仮引数がデフォルト値を持つならば、実引数の数を少なくすることができ、その場合は後ろの足りない分は（キーワード引数を使用しているのではない限り）仮引数のデフォルト値が使われる。**ある仮引数がデフォルト値を持つ場合、それ以降キーワード専用引数が出てくるまでの引数は全てデフォルト値を持たなければならない**。省略された引数の後ろに位置引数を仮引数の順番に従って渡すことができないからである。

キーワード専用引数もデフォルト値を持つことができ、キーワード引数を省略した場合にデフォルト値が使われる。

ただし、仮引数のデフォルト値は関数定義を実行する時の 1 度だけしか評価されないことに注意する。このため、**デフォルト値として関数に渡されるのは、常に同じオブジェクトへの参照である**。デフォルト値として変更可能なオブジェクトを指定した場合、その変更は共有される。

In [None]:
def f(a, L=[]):
    L.append(a)
    return L

print(f(1))
print(f(2))
print(f(3))

[1]
[1, 2]
[1, 2, 3]


後続の関数呼び出しでデフォルト値を共有したくなければ、代わりに以下のように関数を書くことができる:

In [None]:
def f(a, L=None):
    if L is None:
        L = []
    L.append(a)
    return L

print(f(1))
print(f(2))
print(f(3))

[1]
[2]
[3]


### 実引数のアンパック

関数を呼び出す際の実引数を、個別な位置引数で渡すのではなく、代入文における右辺のアンパックと同じ要領でリストやタプルをアンパックする形で渡すことができる。ただし、代入文の場合と異なり、実引数のアンパックは自動的には行われないので、リストやタプルの頭に `*` を付けてアンパックすることを明示する必要がある。このような違いがあるのは、実引数がリストやタプルそのものである場合（つまり関数にイテラブルそのものを渡す場合）があるからである。

実引数では、辞書のアンパックも可能である。辞書の頭に `**` を付けてキーワード引数を渡すことができる。

In [None]:
def f(a, b, c, name, user_id):
    print(f"{a=}, {b=}, {c=}, {name=}, {user_id=}")

li = [1, 2, 3]
d = {'name': '山田太郎', 'user_id': 1}
f(*li, **d)

a=1, b=2, c=3, name='山田太郎', user_id=1


### 可変長引数

実引数のアンパックとは逆に、関数に渡された引数がタプルや辞書に変換されるための仕組みが**可変長引数**である。可変長引数は、仮引数の個数を指定せずに関数を定義する方法となる。

`*args` のように仮引数に `*` を付けると、可変長位置引数が渡されることを指定することになる。関数は、呼び出し時に渡された可変長位置引数を 1 つの<font color="red">タプル</font>として受け取る。可変長位置引数は、関数に渡される入力引数の残りを全て取り尽くしてしまうため、位置引数として渡される全ての引数よりも後ろに定義しなければならない。また、可変長位置引数は、デフォルト値付き引数より前に定義しなければならない（もしデフォルト値付き引数より後ろにあると、呼び出しのとき、それを省略することも、キーワードを指定して渡すこともできない）。

In [None]:
def f(*args):
    return args

assert f(1) == (1,)
assert f(1, 2, 3) == (1, 2, 3)

可変長位置引数の後ろにある仮引数は、キーワード引数として関数を呼び出す必要がある（つまりキーワード専用引数として扱われる）。

In [None]:
def f(*args, x):
    print(f"{args=}, {x=}")

f(1, 2, 3, x=0)
# f(1, 2, 3, 0)  # 引数はすべて args に渡され、x に渡す実引数がないため、エラーが発生する

args=(1, 2, 3), x=0


`**kwargs` のように仮引数に `**` を付けると、可変長キーワード引数が渡されることを指定することになる。関数は、呼び出し時に渡された可変長キーワード引数を 1 つの辞書として受け取る。可変長キーワード引数は、キーワード専用引数より後ろに定義する（つまり、引数リストの一番最後に指定する）。

In [None]:
def f(**kwargs):
    return kwargs

assert f(name='山田太郎', user_id=1) == {'name': '山田太郎', 'user_id': 1}

可変長引数は複数定義することができない。どこが区切りなのかわからないからである。一方、可変長位置引数と可変長キーワード引数を組み合わせて使うことはできる。このときは、次のような順番で引数を定義する：

  1. 位置専用引数
  2. 可変長位置引数
  3. デフォルト値付き引数
  4. キーワード専用引数
  5. 可変長キーワード引数

インポートと名前空間
--------------------

### インポート形式による名前空間の登録

Python はモジュールを初めてインポートするとき、インポートの形式に関わらず、必ずそのモジュールオブジェクトと専用のグローバル名前空間を生成する。モジュール内で定義されたグローバル名は、この名前空間に登録される。

インポート後の挙動は、その形式によって以下のように異なる。

  * `import module (または as m)`:  
  モジュールオブジェクトへの参照を、現在の名前空間に `module`（または指定した名前 `m`）という名前で登録する。属性アクセス `module.foo` や `m.foo` は、常にそのモジュールの名前空間を直接参照して解決される。
  * `from module import foo (または as f)`:  
  モジュール側の名前空間にある特定のオブジェクトへの参照を、現在の名前空間に `foo`（または指定した名前 `f`）としてコピーして展開する。`foo` や `f` は、LEGB ルールに従って名前解決される。
  * ワイルドカードインポート `(from module import *)`:  
  モジュール側の名前空間にある全ての「公開名」への参照を、現在の名前空間にまとめてコピーして展開する。各名前は、LEGB ルールに従って名前解決される。

いずれの場合も、現在のスコープで `module = 1` や `foo = 1` のように再代入を行っても、それはそのスコープの名前空間において名前の再束縛を行うだけであり、元のモジュール側の名前空間には影響を与えない。

ワイルドカードインポートにおいて「公開名」とみなされる名前は、モジュール側で `__all__ = ['foo', 'bar']` のようなリストが定義されている場合、その内容によって決定される。`__all__` が定義されていない場合は、アンダースコア `_` で始まらない全ての名前（`_hidden` のようなものを除く）が公開名として扱われる。

`__all__` とアンダースコア `_` はあくまでワイルドカードインポートの挙動を制限するものであり、`from module import _private_func` のように直接指定してインポートすることを防ぐものではないことに注意する。

### サブモジュールの名前空間

パッケージ（ディレクトリ構造）におけるサブモジュールのインポートは、階層的な属性として管理される。

`import package.sub` とした場合、`package` モジュールオブジェクトが現在の名前空間に登録される。このとき、Python は `package` の名前空間に `sub` という属性を追加し、`package.sub.func()` のようにアクセスできる。

このように、階層を含む形式（`import package.sub`）でサブモジュールをインポートした場合に限り、親パッケージの名前空間にもそのサブモジュールが属性として自動的に登録される。これにより、一度インポートされたサブモジュールは親パッケージ経由で参照可能となる。

一方、`import package` とインポートしただけでは、`__init__.py` の中で `from . import sub` のようにサブモジュールを明示的に読み込んでいない限り、`package` の名前空間にサブモジュールが属性として登録されない。

`from package import *` のようなワイルドカードインポートを行った場合、サブモジュールは自動的にはインポートされない。ワイルドカードインポートが展開するのは、パッケージが公開している名前（`__all__` に列挙された名前、またはアンダースコア `_` で始まらない名前）だけであり、サブモジュールはその対象に含まれない。サブモジュールをワイルドカードインポートで利用可能にしたい場合は、`__init__.py` 内で `from . import sub` のように明示的に読み込んだうえで、`__all__` にその名前を列挙しておく必要がある。

浅いコピーと深いコピー
----------------------

### 浅いコピー

代入の参照セマンティクスにより、変数を別の変数に代入する場合は 2 つの変数が 1 つのオブジェクトを共有することになる。ミュータブルなオブジェクトを共有したくない場合は、オブジェクトをコピーする必要がある。

リスト、集合、辞書などの組み込みコレクションが `copy()` メソッドを持つ場合、そのメソッドを呼び出すと、新しいコレクションを作成し、各要素への参照を挿入する。このコピーを**浅いコピー**（shallow copy）という。浅いコピーは、コレクション自体ではなく各要素を共有することになる。

In [None]:
vals = ["a", "b", "c", "d"]
v_ref = vals.copy()
# 2 つの変数はリストオブジェクトを共有しない
print(f" {id(vals) = }")
print(f"{id(v_ref) = }")
assert v_ref == vals # 要素レベルでは共有しているので等価
v_ref[1] = "e"
assert vals != v_ref == ["a", "e", "c", "d"]  # 変更が vals に及ばない

 id(vals) = 132874159795968
id(v_ref) = 132874169476480


また、組み込み関数を以下のように呼び出す方法でも浅いコピーが得られる。

  * `list(リストオブジェクト)`
  * `set(集合オブジェクト)`
  * `dict(辞書オブジェクト)`

リストオブジェクトについてはスライスを使用しても浅いコピーが得られる（位置を省略して `x[:]` とすれば全体のコピーが得られる）。

標準ライブラリの `copy` モジュールが提供する `copy()` 関数は、任意の型のインスタンスにも適用できる、浅いコピーを返す関数である。ただし、変数 `x` が数値や文字列、タプルを参照している場合の `y = copy.copy(x)` は、単なる変数のコピー `y = x` である。

### 深いコピー

コレクションの浅いコピーは各要素を共有するから、要素がミュータブルなオブジェクトの場合、その変更が、オブジェクトを参照する全ての変数に影響する。

In [None]:
import copy
vals = ["a", "b", ["c", "d"]]
v_ref = copy.copy(vals)  # オブジェクトの浅いコピーが代入される
v_ref[2][0] = "f"
print(f"{vals=},  {v_ref=}")  # 入れ子のリストの変更は vals にも及ぶ

vals=['a', 'b', ['f', 'd']],  v_ref=['a', 'b', ['f', 'd']]


`copy.deepcopy()` 関数は、新しいコレクションを作成し、その中の要素である子オブジェクトを再帰的にコピーする。このようなコピーを**深いコピー**（deep copy）と呼ぶ。深いコピーでは、元のオブジェクトの変更による影響を受けない。

In [None]:
import copy
vals = ["a", "b", ["c", "d"]]
v_ref = copy.deepcopy(vals)  # オブジェクトの深いコピーが代入される
assert v_ref == vals
v_ref[2][0] = "f"
print(f"{vals=},  {v_ref=}")  # 入れ子のリストの変更も vals に及ばない

vals=['a', 'b', ['c', 'd']],  v_ref=['a', 'b', ['f', 'd']]


深いコピーのデメリットは、オブジェクトの階層が深くなるほど再帰的なコピーに時間がかかることである。また、ミュータブルな子オブジェクトについて、すべて新たなオブジェクトが作成されるため、メモリ消費量が大きくなる。浅いコピーを選ぶか深いコピーを選ぶかは、用途を考慮して決める必要がある。

`copy.copy()` と `copy.deepcopy()` 関数は、モジュール、メソッド、スタックトレース、スタックフレーム、ファイル、ソケット、ウィンドウ、その他これらに類似の型をコピーしない。また、コピーに失敗した場合は、`copy.Error` 例外が送出される。
