# この文書について

ここには、Python 入門編に対応して、その本文中に含めるほどではない余談や、本文中に含めるには煩雑になりすぎる説明、各種用語の簡易な説明などを含めてある。

無駄な豆知識だったり、後日もう少し高度な内容を学習することになった際の基礎的な知識として役立ててもらいたい。

<a id="helloworld"></a>
#### Hello, World! について

"Hello, World!" と出力するのがプログラミングの第一歩とか、誰が決めたの？とか思ってしまうが、おそらく Brian Kernigham （ブライアン・カーニハン）だと言われている。彼が書いた1972年の "A Tutorial Introduction to the Language B" の中にその原型があるらしい。

もっとも、世界中に広まったきっかけは、そのもう少し後の、1978年に出版された "The C Programming Language"（邦題「プログラミング言語C」）だろう。

C言語の開発者 Dennis MacAlistair Ritchie （デニス・リッチー）と Brian Kernigham の共著によるこの超有名な本は、2人の頭文字をとって "K&R" とも呼称される。

厳密には、Hello World はプログラミング学習の第一歩というわけではなく、「あるプログラミング言語がシステム上で正しく動作するかどうかを確認する」第一歩といえる。

書かれた内容の解析をし、それを標準出力へと出力する背後には、見た目の内容よりも遥かに多くの内部処理が関わっている。それらが正常に動作しているかどうかを確認する作業というわけだ。

<a id="stdinout"></a>
#### 標準入出力とは

標準入力はキーボードからの入力で、標準出力はモニターへの表示……みたいに説明されることが多い。が、現在言うところの標準入出力は、もう少し抽象的な概念となっている。

プログラミングが実行される時、システムにあらかじめ用意された、一般的に使用される入出力は "3つ" ある。それらが標準入力、標準出力、標準エラー出力だ。これらをまとめて標準入出力とよび、そして、なにも指定が無い場合、標準入力はキーボードからの入力を受け付け、標準出力と標準エラー出力はモニターへの出力を行う……という仕組みになっている。

我々が普段実行エラーなどで怒られている時、画面上にいろいろと内容が出るわけだが、あれは標準出力ではなく、実は標準エラー出力が表示されているのである。

さて、ではキーボードや画面の他に、どうやって標準入出力を利用するねん、という話になるわけだが、簡単なところでは、パイプやリダイレクトと呼ばれる機能を用いて行うことが出来る。

例えば Windows であれば、

```type ./input.txt | python ./main.py > ./output.txt 2> error.log```

といった形で利用できる。このコマンドが実行される流れは、以下のようになる。

1. まず ```type ./input.txt``` により、現在いるところ（```./``` で表され、カレントディレクトリと呼ばれる）にある input.txt の内容が、標準出力へと出力される。
2. その標準出力（```input.txt``` の内容）は、次にある ```|``` によって、```python ./main.py``` へと引き渡される。これをパイプと呼ぶ。
3. ```python ./main.py``` によって ```main.py``` が Python として実行される。その際には前述の ```input.txt``` の内容が標準入力に入る。
4. ```main.py``` の実行による標準出力は、次にある ```>``` によって、モニターへは表示されず、ファイル ```output.txt``` へ書き込まれる。これをリダイレクトと呼ぶ。
5. ```2>``` の指定は、標準エラー出力のリダイレクトを表す。つまり、標準エラー出力があれば、```error.log``` への書き込みを行う。

以上のように、標準入出力を利用して、入出力を次々につなげた処理を行うことが出来るというわけだ。

ちなみに、Python においては、

```print("foobar", file=sys.stderr)```

と書くことで標準エラー出力へ出力することが出来る。

<a id="sideeffect"></a>
#### 関数の副作用とは

関数を単純にいうならば、引数を入力として受け取り、戻り値を出力として返すブラックボックスのようなものだと言える。

しかし、関数の中には、戻り値を返す以外にほかの影響を及ぼすものがある。そうした他の影響のことを、関数の副作用、と呼ぶ。例えば、print() は標準出力へと出力を行うが、これは副作用である。

副作用という用語は、Python にとどまらない、プログラミング全般における広い概念の言葉であり、しばしばその是非そのものが議論されたりもする。副作用を可能な限り廃したプログラミングの手法として、関数的プログラミングがある。

<a id="keywordargumentsofprint"></a>
#### print() の取れるキーワード引数

print() は、公式ドキュメントにおいては以下のように紹介されている。

```
print(*objects, sep=' ', end='\n', file=sys.stdout, flush=False)
```

通常は、「標準出力」に対し、渡された複数の値を「半角スペース」区切りで出力した後、「改行」を行うわけであるが、実はこの3つの要素を別のものへと変更することが出来る。それが、名前付き引数で指定できる ```file``` ```sep``` ```end``` である。例えば、次のように書ける。

In [4]:
for vals in [[1, 2, 3], [4, 5, 6], [7, 8, 9]]:
    print(*vals, sep=', ', end = '| ')
print()

1, 2, 3| 4, 5, 6| 7, 8, 9| 


また、出力先はデフォルトでは標準出力 ```sys.stdout``` だが、あらゆるファイルオブジェクトを引数に取れるようになっている。

<a id="assignmentexpression"></a>
#### 代入は式じゃない？

```var = 0``` のような代入は ```文``` であって ```式``` ではない、つまり値を返さないと書いた。これを確認するもっとも簡単な方法は、```print()``` の引数に入れてやることだ。

In [4]:
print(var = 0)

TypeError: 'var' is an invalid keyword argument for print()

このように、```var=0``` は値を返さないため、エラーになってしまう。

一方、例えば比較演算子や、関数は値を返す ```式``` なので、ちゃんと実行される。

In [1]:
print(print('Hello'))

Hello
None


上記の例は少し面白く、最初の ```print()``` の引数に ```print('Hello')``` があるため、まずこちらから評価されることになる。結果の一行目に出力されているのは、その副作用である。一方で、```print('Hello')``` の返り値は ```None``` である。よって、最初の ```print()``` により、```None``` が出力されている。

さて、実は C/C++ など他の言語では、代入が式として取り扱われるものがある。すなわち、代入演算子の右辺が戻り値として返ってくる仕組みになっているものがある。

実はそれと同じことを ```:=``` 通称セイウチ代入子を用いることで、Python 3.8 以降ならできるようになっている。 

In [1]:
print(var := 7)
print(var)

7
7


新し目の機能のため、まだそこまで利用が広まっていない＆参考書などにも書かれていないが、ここに参考のために書いておくことにする。

<a id="whydatatypesneeded"></a>
#### 型とか考える必要あるの？

答えとしては、型を考える必要は、ある。それは、ある値に演算を行う際に、型を分かっていないと、意図した演算にならないことがあるためだ。極端な例を出そう。次の足し算 3種類を見てほしい。

In [1]:
print(1 + 2)

3


In [2]:
print("1" + "2")

12


In [3]:
print(1 + "2")

TypeError: unsupported operand type(s) for +: 'int' and 'str'

1.は数値同士の足し算なので、```3``` になる。2.は文字列同士の足し算なので、```"12"``` になる。3.は足し算のできない型の組み合わせなので、エラーが出ている。

このような挙動を理解するためには、やはり必要最低限の理解は必要なのではないだろうか。

もっとも、他にも型を理解しておいたほうがいい理由はいくらでもあるのだが、ここでは述べない。

<a id="variablenamecases"></a>
#### キャメルケースとスネークケース

競技プログラミングではそうでもないのだが、一般的には、変数や関数などに名前をつけるときには、わかりやすくするためそれなりに長めの名前をつけることが多い。

長い名前を使うときには、大きく分けて二つの流儀があり、それがキャメルケース (camel case) とスネークケース (snake case) と呼ばれるものだ。例を見てもらうほうが早いだろう。

キャメルケースの例：
- firstVariable
- secondVariable
- yetAnotherVariable

スネークケースの例：
- first_variable
- second_variable
- yet_another_variable

つまり、複数の単語を名前に使用する際、二個目以降の単語の最初を大文字にして続けて書くのがキャメルケース、単語と単語の間に ```_``` を挟んで並べるのがスネークケース、というわけだ。なるほど、それぞれラクダと蛇に似てなくもない。

世間的にはややキャメルケースのほうが優勢のように思うが、この文書では、見やすさを重視してスネークケースを使用することにしている。

<a id="whatareoperators"></a>
#### そもそも演算子って何？

演算子 (operator) とは、値や変数など被演算子 (operand) の前、後ろ、間に配置することで、決められた計算・処理を行う記号・文字列のこと。  
例えば ```+``` は、その前後の値を加算したものを返す二項演算子である。

……などと書くとひどくややこしく聞こえるが、なんのことはない、```a + b``` と書けば、演算子 ```+``` によって ```a``` と ```b``` を足した値になるという意味である。

一般的に演算子と聞いて最初に思い浮かべるのは、二項演算子だろう。数値計算に使用する ```+ - * / // %``` は、全て二項演算子、つまり二つの値を元にして、計算した値を返す演算子である。

一方、単項演算子と呼ばれるものもある。例えば ```-123``` などと書いたときの、```-``` がそれに当たる。これは、後に続く数値を負にするという意味になる。演算子が前に来るので、前置演算子とも呼ばれる。

じゃあ、単項の後置演算子ってあるの？となるが、Python には存在しない（？）。が、他の多くの言語では、ある変数に 1 加える操作を ```var++``` などと書いたりする。```var``` は変数名、```++```は後置演算子である。

三項演算子というものあり、Python では ```値1 if 条件式 else 値2``` といった形で使用される。これは、条件式を満たせば ```値1``` を返し、そうでなければ ```値2``` を返す。つまり、```値1 条件式 値2``` の三項に働く演算子が ```if else``` ということになる。 

<a id="bignumbers"></a>
#### 巨大な整数の扱い

In [2]:
print(42 ** 42)

150130937545296572356771972164254457814047970568738777235893533016064


上記のコードは 42 の 42 乗を計算したものだが、実は、このように巨大な整数を何も考えず簡単に扱えるプログラミング言語は、あまり無い。現在のプログラミング言語では、一般的にはただ int としたときには 32bit もしくは 64bit で表せる範囲の整数のことを指すからだ。具体的には、

- 32bit（符号付き） −2,147,483,648 ～ 2,147,483,647
- 64bit（符号付き） -9,223,372,036,854,775,808 〜 9,223,372,036,854,775,807

である。そこで、他の言語では長整数型と呼ばれる、特殊な型を用意している場合がほとんどである。

逆にいうと、Python でも巨大な整数を扱う時には、内部的には相応の処理を行っている。調子に乗っていると、とんでもない計算時間を使ってしまうことがあるので、注意したい。

<a id="numbersappendix"></a>
#### 他の数字の表し方、無限大

数値を、2進数、8進数、16進数で表すことも出来る。それぞれ数字の前に ```0b```, ```0o```, ```0x``` と付けるだけでいい。

In [10]:
num1 = 0b10110101
num2 = 0o1624
num3 = 0xCD1B
print(num1, num2, num3)

181 916 52507


指数表記にも対応している。

In [11]:
num = 1024e-3
print(num)

1.024


少し変わった数値としては、無限大を値として持つことも出来る。これはしばしばDPの初期値として使われる便利な値なので、覚えておいてもいいかもしれない。

In [3]:
num1 = float('inf')
num2 = -float('inf')
print(num1, num2)

inf -inf


<a id="aboutquotations"></a>
#### シングル or ダブルクォーテーション？

文字通り、どっちでもいい。他の多くの言語では、ダブルクォーテーションを使用することが多いことを踏まえると、ダブルクォーテーションで慣れておくのがいいかもしれない。

……のだが、Python をインストールするときについてくる、標準の対話型インタプリタ IDLE で文字列を評価すると、シングルクォーテーションで値が返ってくる。なので、個人的にはシングルクォーテーションを使用することが多い。もっとも、この文書中ではいい加減な具合に混在しているので、ご了承いただきたい。

<a id="howtomakesureitsnone"></a>
#### 厳密な None 判定は is で行う

```is``` 演算子は少し特殊な演算子で、あるオブジェクト二つを比較する際に、内容が同じかどうかではなく、全く同一の識別値をもつオブジェクトなのかどうかを判定する。

といっても、```None``` オブジェクトそのものは一つしか無いんだから、変わらないのでは？と思うかも知れない。しかし、実はそこに加えて ```==``` 演算子はクラスを作成する際にカスタマイズ可能（```__eq__()``` で定義可能）だということを加味すると、やや風向きが変わってくる。

また、実は ```is``` の方がごく僅かに動作が早いという利点も無くはない。

とはいえ、この違いが重要になるような内容は、この文書中には含まれることはないかと思われるので、どちらでもいい。

<a id="returnvalueofandor"></a>
#### and や or が実際に返す値

```and``` や ```or``` でも、論理値以外を使用することが出来る……のはいいとして、

In [2]:
print("" or 0.0 or 42)

42


と、実際に試してみると少し変な値が返ってきていることに気づく。

実は、```and``` や ```or``` が返すのは純粋な論理演算の結果ではない。左から順番に評価していき、結果が確定したところの値そのものを返している。

したがって、```and``` の場合は最初の ```Falsy``` な値、もしくは最後の ```Truthy``` な値が返され、```or``` の場合は最初の ```Truthy``` な値、もしくは最後の ```Falsy``` な値が返ってくることになる。

<a id="0indexedand1indexed"></a>
#### 0-indexedと1-indexed

実は世界初の高級言語と言われている Fortran では、添字が 1 から始まる。つまり、1-indexedとなっている。そして、1-indexedを採用している言語は区間指定の終端が含まれる、つまり閉区間となっているものが多い。

つまり、C / LISP / Python など 0-indexed と 半開放区間（終端が含まれない指定）の組み合わせの言語と、Fortran / Julia などの 1-indexed と 閉区間の組み合わせの言語の二種類に大きく分けられることになる。

人間にとって自然なのは、明らかに 1-indexed ＋ 閉区間 であるだろう。しかし、メモリ上の配列の開始位置を x としたとき、x+0 が最初の値の保存場所、x+1 が次の値の保存場所……となる C 言語系を見ると、なるほどコンピュータにとっては 0-indexed の方が自然に思える。

ということは、もともと人の営みから派生してきた数学を取り扱うことが多い言語では、それが採用されやすい一方、コンピュータ科学から生まれてきた言語では、0-indexed ＋ 半開放区間 が採用されやすいのではないか……と個人的に思っている。

半開放区間については、おそらく次の開始位置を保持するほうが、前の終了位置を保持するよりも無駄がないという点がひとつ。もうひとつは、区間分割をアルゴリズムとして構築しやすいというのが原因かと思われる。つまり、```[p, q]``` の区間を分割するときに、```[p, x)``` ```[x, q)``` と書けるということで、これはコンピュータ科学の観点からは優しい書き方なのだろう。

もちろん、これは全て僕の憶測である。

<a id="unpackingandchainedassignment"></a>
#### アンパック代入？

これって便利ではあるけど、アンパック代入になるの？ただの多重代入の一種じゃないの？とふと疑問に思われた方もいるだろう。

In [12]:
a, b = 1, 2
print(a, b)

1 2


これは、右辺の扱いがタプルになっていたりする。試しにカッコなしのカンマ区切りを評価してみると、

In [1]:
1, 2, 3

(1, 2, 3)

タプルが返ってきているのが分かると思う。つまり、この代入はアンパック代入の一種である。

In [14]:
import dis
def func1():
    a, b, c = 1, 2, 3
    return (a, b, c)
dis.dis(func1)

  3           0 LOAD_CONST               1 ((1, 2, 3))
              2 UNPACK_SEQUENCE          3
              4 STORE_FAST               0 (a)
              6 STORE_FAST               1 (b)
              8 STORE_FAST               2 (c)

  4          10 LOAD_FAST                0 (a)
             12 LOAD_FAST                1 (b)
             14 LOAD_FAST                2 (c)
             16 BUILD_TUPLE              3
             18 RETURN_VALUE


実際に内部コードを見てみると、最初に値がタプルとして一度に読み込まれ、アンパックされているのが分かる。

余談として、アンパック代入は基本的には数を合わせてやる必要があるが、次のような書き方もある。

In [15]:
a, b, *c = 1, 2, 3, 4, 5
print(a, b, c)

1 2 [3, 4, 5]


```*``` を変数名の前につけることで、残り全部をその変数へリストとして引き渡してやる処理になるわけだ。

In [4]:
a, b, *c = 1, 2
print(a, b, c)

1 2 []


ちなみに、この記法を使用した場合は、中身が存在しない場合は上記のように空リストとして処理されることになる。

<a id="datacalledlist"></a>
#### リストと呼ばれるもの

実は、Python でリストと呼ぶものは、一般的なプログラミング概念におけるリストとは、少し違った概念となっている。Python でのリストは、どちらかというとただの ```配列``` である。ただし、Python には配列、つまり ```array``` の型も用意されていたりするあたりが、少しややこしい。ちなみにPython における ```array``` は、中に保存できる値の型が一種類に制限されたリスト、という言い方ができる。

では、一般的な概念のリストとはどのようなものかというと、それは連結リストと呼ばれる概念である。連結リストの一つ一つのノードには、

- ノードが持つ値
- 次のノードの場所

が保存される。つまり、チェーンのようにつながったデータのまとまり、というイメージだ。

配列は、メモリ上に（基本的には）連続的に保管されるので、添字によって n 番目のデータを容易に取り出すことが出来る。その代わりに、間にデータを挿入したり、データを削除して間を詰めたりするのが苦手な構造でもある。

一方、リストはデータ間の繋がりを持つのみなので、n 番目の要素を素早く取り出すことはできない。しかし、あるデータを削除したり、隣へ他のデータを挿入したりするのは簡単に出来る。また、再帰構造をもつので、再帰でなにかをするのに相性がいい。

実は Python にも、この一般的な概念としてのリストが実装されている。それは、```collections.deque``` だ。deque の正体は、双方向連結リストである。双方向連結リストでは、次のノードだけでなく、前のノードの情報も保存されている。これを利用して、両端キューが実装されているというわけだ。

<a id="trapofslicing"></a>
#### スライスの罠

これで引っかかるのは僕くらいかもしれないが、恥を晒しつつ……。

スライス記法では、開始位置と終了位置に負数を使用できる。となると、最後から i 個だけ取りたい場合や、最後の i 個を除きたい場合に ```var[-i:]``` やら ```var[:-i]``` と書きたくなるのが人情であり、一見うまく動作する…… **i == 0 の時以外は**。

In [28]:
var = list(range(10))
for i in range(-3, 1):
    print(f'var[:{i}] - {var[:i]}')

var[:-3] - [0, 1, 2, 3, 4, 5, 6]
var[:-2] - [0, 1, 2, 3, 4, 5, 6, 7]
var[:-1] - [0, 1, 2, 3, 4, 5, 6, 7, 8]
var[:0] - []


In [34]:
var = list(range(10))
for i in range(-3, 1):
    print(f'var[{i}:] - {var[i:]}')

var[-3:] - [7, 8, 9]
var[-2:] - [8, 9]
var[-1:] - [9]
var[0:] - [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


こういう時は、```len()``` を利用して書くべきである。サボろうとかしてはいけない。

In [32]:
var = list(range(10))
for i in range(3, -1, -1):
    print(f'var[:len(var)-{i}] - {var[:len(var)-i]}')

var[:len(var)-3] - [0, 1, 2, 3, 4, 5, 6]
var[:len(var)-2] - [0, 1, 2, 3, 4, 5, 6, 7]
var[:len(var)-1] - [0, 1, 2, 3, 4, 5, 6, 7, 8]
var[:len(var)-0] - [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


In [33]:
var = list(range(10))
for i in range(3, -1, -1):
    print(f'var[len(var)-{i}:] - {var[len(var)-i:]}')

var[len(var)-3:] - [7, 8, 9]
var[len(var)-2:] - [8, 9]
var[len(var)-1:] - [9]
var[len(var)-0:] - []


<a id="rangeissequence"></a>
#### range() はシーケンス型

```range()``` （厳密には range() によって作成される range オブジェクト）は、イテレーターでありながら、シーケンス型の扱いとなっている。

……つまり、スライスを適用できる。試しにやってみると、

In [5]:
print(range(10, 100)[2:15:3])
print(range(3, 25)[18:3:-1])

range(12, 25, 3)
range(21, 6, -1)


なる……ほど……？確かに合ってる。というわけで、```range()``` はシーケンス型である。それだけ。

<a id="multipleloopbreakbyforelse"></a>
#### for ～ else による多重ループ脱出

慣れていない人が見ると、一見何が起こってるかわからないのが、for ～ else による多重ループ脱出だろう。

数値の二次元リスト ```matrix``` 中に、特定の数値 ```target``` があるかどうかを探している……という設定で、次のコードを眺めてほしい。

In [None]:
for row in matrix:
    for element in row:
        if element == target:
            print('found')
            break  # 内側の for を break する
    else:          # 内側の for が break されなければ、
        continue  # 外側の for を continue する
    break  # 内側の for が break されたときだけ実行され、外側を break する

このように多重ループ脱出を書くことができる。

もちろん、普通にフラグを用いて同じことができるので、好みの問題ではある。ただ、こういう書き方もあるんだなと知っておくと、他の人のコードを見る時に悩まずに済むかもしれない。

<a id="typesofmethods"></a>
#### メソッドの種類

メソッドは、まずクラスのオブジェクトを作成し、そのオブジェクトから呼び出す……といったことを書いたが、実はオブジェクトを作成せず、クラスから直接呼び出すことのできるメソッドというのも存在する。

定義上は、オブジェクトから呼び出す形のものを ```インスタンスメソッド``` と呼ぶ。

一方、クラスから直接呼び出すものは、その内部動作の定義上 ```クラスメソッド``` と ```スタティックメソッド``` に分かれる。クラスメソッドが、クラスの構造を利用するのに対して、スタティックメソッドはほぼ通常の関数に近い扱いのものとなっている。

<a id="listofmethods"></a>
#### メソッド一覧

メソッドの一覧については、```dir()``` を使用することで確認できる。```list``` で試してみよう。

In [1]:
print(dir(list))

['__add__', '__class__', '__class_getitem__', '__contains__', '__delattr__', '__delitem__', '__dir__', '__doc__', '__eq__', '__format__', '__ge__', '__getattribute__', '__getitem__', '__gt__', '__hash__', '__iadd__', '__imul__', '__init__', '__init_subclass__', '__iter__', '__le__', '__len__', '__lt__', '__mul__', '__ne__', '__new__', '__reduce__', '__reduce_ex__', '__repr__', '__reversed__', '__rmul__', '__setattr__', '__setitem__', '__sizeof__', '__str__', '__subclasshook__', 'append', 'clear', 'copy', 'count', 'extend', 'index', 'insert', 'pop', 'remove', 'reverse', 'sort']


ずらずらと出てきたが、これらのうち ```__``` というふうにアンダーバーふたつが頭についているものは、原則として内部的に使用するためのもので、外部からの呼び出しは通常は行わない。つまり、我々が普段使うのは、最後の方に出ている 10個程度ということになる。

<a id="instanceandobject"></a>
#### インスタンスとオブジェクト

Python に限定しないプログラミングの世界においては、クラスから作成された具体的なもののことはオブジェクトではなく ```インスタンス``` と呼ぶ。というのも、本来オブジェクトという用語が指すものは、プログラミングにおいて扱うことのできるもの全てを含む、非常に広範な概念であるためだ。

世界創造の最初に言葉があるように、最初にオブジェクトと呼ばれる概念がある……と考えてみると分かりやすいかも知れない。

もちろん、概念だけあっても仕方がないので、メモリ上にその実体を作成する。プログラミング言語において、一般的に使用される ```オブジェクト``` という用語は、この実体を指す場合が多い。そして、実は言語ごとにどこまでの範囲をオブジェクトと呼ぶかは、結構バラバラである。

オブジェクトには様々なものがあるが、そのうちデータ構造と手続きを一体にしておくと便利ということが分かってくる。これが、```クラス``` の概念である。

クラスの実体も、データ構造と手続きを併せ持った汎用性のある「雛形」の形でメモリ上に作成される。これを元にして、個々の ```インスタンス``` が作成される。

大まかだが、こういった構造になっている。

ところで、Python では、それを前面に押し出してはいないものの、すべての値はクラスのインスタンス扱いとなっている。したがって、インスタンス＝オブジェクトという側面が強く、オブジェクトという名前が採用されているのではないだろうか。

<a id="constructor"></a>
#### 型変換の正体はコンストラクタ

```reverse()``` の例では、```list_reverseiterator オブジェクト``` なるものが現れた。これは、```reverse()``` によって作成されたオブジェクトということになる。このように、オブジェクトを作成する関数を ```コンストラクタ``` と呼ぶ。リストを作成する際に角括弧 ```[]``` で囲うが、内部的な動作としては、実はコンストラクタ ```list()``` が呼ばれている。

つまり、型変換の関数として紹介した ```list()``` ```tuple()```、あるいは ```int()``` などは、全てコンストラクタということになる。

```list()``` や ```tuple()``` はイテラブルを引数によるコンストラクタで、```int()``` は数値や文字列を引数に取るコンストラクタとなっていて、結果的に型を変換できているわけだ。

<a id="dowhile"> </a>
#### do while

Python 以外の他の言語では、```do``` ～ ```while``` というループが用意されているものが多い。通常の ```while``` ループが最初に条件式を判定するのに対して、こちらは最後に条件式を判定する。すなわち、必ず最低 1回は処理が行われる仕組みになっている。

Python にはこの構文は採用されていない。なので、同じことをしたいときには最初に 1回処理を実行しておき、次に ```while``` を書いてやる必要がある。

必ず行われる処理があるのなら、素直にそのまま実行しろよ、という判断らしい。

<a id="parametersandarguments"></a>
#### 仮引数と実引数

実は引数という用語には二種類あり、関数の定義時に設定する引数のことを仮引数と呼び、関数を実行する際に引き渡す引数のことを実引数と呼ぶ。

つまり、

In [2]:
def sum_up(num1, num2):
    return num1 + num2

x, y = 2, 6
print(sum_up(x, y))

8


などとあるとき、```num1``` ```num2``` は仮引数で、```x``` ```y``` は実引数である。

単なる用語ではあるが、よく目にするので知っておくといいかもしれない。

<a id="mutalbeimmutableandid"></a>
#### ミュータブルとイミュータブルと識別値

関数 ```id()``` を用いると、ある変数が格納している識別値と呼ばれる値を確認できる。

In [10]:
var1 = 42
print(id(var1))

1922128899664


Python において変数が実際に保存しているのはこの識別値であって、値そのものを保存しているわけではない。変数 → 識別値 → 実際の値（オブジェクト）という仕組みになっている。

さて、タプルとリストを変数に代入する際、どのようになっているかというと……

In [36]:
immutable1, immutable2 = (1, 2, 3), (1, 2, 3)
print(id(immutable1), id(immutable2))
mutable1, mutable2 = [1, 2, 3], [1, 2, 3]
print(id(mutable1), id(mutable2))

1823880965952 1823880965952
1823881053760 1823881424832


上のように、タプルは同じ中身ならば同じ id に、リストは同じ中身でも別の id になった。つまり、その中身と id とが強く結びついているのがイミュータブルと言い換えることもできる。ゆえに、イミュータブルなオブジェクトは id を変更せずにその中身を書き換えることができない。

ところが、タプルなら絶対中身を書き換えられないかというと、そういうわけでもない。

In [1]:
changable = (1, [2, 3], 4)
changable[1][1] = -1
print(changable)

(1, [2, -1], 4)


このように、中にミュータブルなものを含むタプルは、ミュータブルなものの中身に限定すれば変更できる。これは、厳密にはタプルの中身はそれぞれの要素の識別値を保存しているのであって、リストの中身を書き換えても、その識別値は変更されないためだ。

しかし、中にミュータブルなものを含むタプルは、

In [11]:
var = [2, 3]
im1, im2 = (1, var, 3), (1, var, 3)
print(id(im1), id(im2))

2670136541888 2670136542208


このように、同じ中身であっても別の識別値が割り振られる。つまり、全体としてはミュータブルな扱いになっている。実際、ハッシュ化が利用できず、辞書のキーなどに使用することはできない。

<a id="underscoreinnames"></a>
#### 名前の最初や最後にアンダースコア

Python、あるいは他の言語にもしばしば見られる文化（？）として、アンダースコア ```_``` が名前の最初に使用されている変数・メソッドは、外部からの参照を前提としていない、内部処理用のものであることを示す。

逆に名前の最後にアンダースコアがついているのは、```list_``` や ```dict_``` など、組み込み関数との名前の衝突を避けたい時が多いようだ。害のない適当な文字を足すイメージだろうか。

一方、使い捨ての変数を使う時に、名前を ```_``` だけにすることも多い。 例えば、単に N 回繰り返したいだけのとき、```for _ in range(N)``` と書く人が多い。これは、```_``` をあえて使うことで、この変数は実際には利用しない、意味のない名前だということを明示する働きを持っていると言える。