# Pythonの基礎 3（クラス） 

本章では前章で扱った**関数**と並んで、プログラミング全般で頻繁に使用される**クラス**の概念と使い方を扱います。  

クラスを用いるメリットとして、関数と同様に同じ処理を何度も書く必要がなくなる点が共通しているのですが、クラス特有のメリットとしては**オブジェクト**と呼ばれる概念を用いて、必要な処理（関数）と使用する変数を同時に定義する点にあります。  

そうすることでプログラム全体から完全に隔離された状態で一連の処理を管理できるので、プログラム全体が完成した後でも容易に機能追加・変更を行うことが出来ます。  

機械学習の分野では、ディープラーニングの代表的なフレームワークである　TensorFlow, Chainer, PyTorch で使用されているので必ず理解しておく必要があります。  

## 本章の構成
- クラスとは  
- クラスの定義方法  
- 変数を持ったクラス    
- 関数を持ったクラス   
- プログラムの管理

## クラスとは
クラスの有用性をイメージするために、例えば家を建てるケースを考えてみましょう。  

同じ構造の家を何件も建てる必要がある際、皆さんは同じ設計図を何枚もゼロから書くでしょうか？  
その様な二度手間を避けて 1 枚の設計図をコピーして何回も使いまわすのではないでしょうか。  

他にも、デザインを変えたり、部屋数を増やす際にも設計図をゼロから書き直すのではなく、既存の設計図に手を加えて新しい設計図を用意するはずです。  


この**家の設計図**の役割を果たすのがクラスです。冒頭の説明で、クラスには必要な処理（関数）と使用する変数を同時に定義すると紹介しましたが、設計図に例えるとクラスには以下の様な情報を定義します。    
- 変数：家の材料（木材、ガラス、扉 など）   
- 関数：家を建てる手順（木を切る、組み立てる、色を塗る など）  


また、クラスから作成された実体（ここでは建てられた家）のこと**オブジェクト (またはインスタンス)** と呼び、**クラスから実体を作成する**という操作のことを**インスタンス化** と呼びます。

## クラスの定義方法

それでは、家の設計図を表すクラスを定義してみましょう。定義名は `House` とします。  
また、表札に記載する名前を家ごとに変更する必要があるとして `name_plate` という変数をクラス内部に持たせましょう。  

ここで重要なポイントとして、クラスを定義する段階では内部の変数に具体的な値を持たせる必要はありません。理由としては、初めから具体的な値を持たせず、個別の家を建てる際（すなわちインスタンス化する際）に値を入力することで１つのクラスから作られた設計図で様々な家を建てる事ができ、プログラミング上の利便性が向上する為です。

このような、インスタンスに属している変数を**属性 (attribute)** と呼びます。同様に、インスタンスから呼び出すことができる関数のことを**メソッド (method)** と呼びます。

クラスは、以下のような構文を使って定義します。

![クラス](http://drive.google.com/uc?export=view&id=1l2MHdn2LBylFKMiY8tD2_Dw81ar9nTfp)


## 変数を持ったクラス
上述の通りクラスは内部に変数と関数を持ちます。  
まずシンプルに、変数のみを持ったクラスを定義してみましょう。  


In [1027]:
# クラスの定義
class House:

    # __init__() メソッドの定義
    def __init__(self, name):
        self.name_plate = name

ここで、`__init__()` という名前のメソッドが `House` クラスの中に定義されています。
メソッドの名前は自由に名付けることができますが、いくつか特別な意味を持つメソッド名が予め決められています。
`__init__()` はそういったメソッドの一つで、**インスタンス化する際に自動的に呼ばれるメソッド**です。

`House` クラスの `__init__()` は、`name` という引数をとり、これを `self.name_plate` という変数に代入しています。
この `self` というのは、クラスがインスタンス化されたあと、作成されたインスタンス自身を参照するのに用いられます。
これを使って、`self.name_plate = name` とすることで、作成された個別のインスタンスに属する変数 `self.name_plate` へ、引数に渡された `name` が持つ値を代入することができます。
`self` が指すものは、各インスタンスから見た「自分自身」なので、各インスタンスごとに異なります。
これによって、`self.name_plate` は各インスタンスに紐付いた別々の値を持つものとなります。

メソッドは、インスタンスから呼び出されるとき自動的に第一引数にそのインスタンスへの参照を渡します。
そのため、メソッドの第一引数は `self` とし、渡されてくる自分自身への参照を受け取るようにしています。
ただし、呼び出す際には**そのインスタンスを引数に指定する必要はありません。**
以下に具体例を示し、再度このことを確認します。

それでは、上で定義した `House` クラスのインスタンスを作成してみます。
クラスのインスタンス化には、クラス名のあとに `()` を追加して、クラスを呼び出すような記法を使います。
この際、関数を呼び出すときと同様にして、`()` に引数を渡すことができます。
その引数は、`__init__()` メソッドに渡されます。

In [1028]:
my_house = House('Python')

In [1029]:
my_house.name_plate

'Python'

`House` というクラスの `__init__()` メソッドに、`'Python'` という文字列を渡しています。
`my_house` が、`House` クラスから作成されたインスタンスです。
ここで、クラス定義では `__init__()` メソッドは `self` と `name` という 2 つの引数をとっていましたが、呼び出しの際には `'Python'` という一つの引数しか与えていませんでした。
この `'Python'` という文字列は、1 つ目の引数であるにも関わらず、`__init__()` メソッドの定義では 2 つ目の引数であった `name` に渡されます。
前述のように、**メソッドは、インスタンスから呼び出されるとき自動的に第一引数にそのインスタンスへの参照を渡す**ためです。
この自動的に渡される自身への参照は、呼び出しの際には明示的に指定しません。
また、かならず 1 つ目の引数に自動的に渡されるため、呼び出し時に明示的に与えられた引数は 2 つ目以降の引数に渡されたものとして取り扱われます。

## 関数を持ったクラス
それでは次に、このクラスに `hello()` というメソッドを追加し、呼び出すと誰の家であるかを表示するという機能を実装してみます。

In [1030]:
# クラスの定義
class House:

    # __init__() の定義
    def __init__(self, name):
        self.name_plate = name

    # メソッドの定義
    def hello(self):
        print('{}の家です。'.format(self.name_plate))

それでは、2 つのインスタンスを作成して、それぞれから `hello()` メソッドを呼び出してみます。

In [1031]:
sato = House('佐藤')
suzuki = House('スズキ')

sato.hello()   # 実行の際には hello() の引数にある self は無視
suzuki.hello() # 実行の際には hello() の引数にある self は無視

佐藤の家です。
スズキの家です。


`sato` というインスタンスの `name_plate` 属性には、`'佐藤'` という文字列が格納されています。  
`suzuki` というインスタンスの `name_plate` 属性には、`'スズキ'` という文字列が格納されています。  
それぞれのインスタンスから呼び出された `hello()` メソッドは、`self.name_plate` に格納された別々の値を `print()` を用いて表示しています。

このように、同じ機能を持つが、インスタンスによって保持するデータが異なったり、一部の動作が異なったりするようなケースを扱うのにクラスを利用します。
Python の `int` 型、`float` 型、`str` 型…などは、実際には `int` クラス、`float` クラス、`str` クラスであり、それらの中では個別の変数（インスタンス）がどのような値になるかには関係なく、同じ型であれば共通して持っている機能が定義されています。
`5` や `0.3` や `'Python'` などは、それぞれ `int` クラスのインスタンス、`float` クラスのインスタンス、`str` クラスのインスタンスです。

以上から、クラスを定義するというのは、**新しい型を作る**ということでもあると分かります。

### 継承

あるクラスを定義したら、その一部の機能を変更したり、新しい機能を付け足したりしたくなることがあります。
これを実現する機能が**継承 (inheritance)** です。
例えば、`Link` というクラスを定義し、そのクラスを継承した `Chain` という新しいクラスを作ってみましょう。
まず、`Link` クラスを定義します。

In [1032]:
class Link:

    def __init__(self):
        self.a = 1
        self.b = 2

この `Link` というクラスは、インスタンス化を行う際には 1 つも引数をとりませんが、属性として `a` と `b` の 2 つの変数を保持し、それぞれには `__init__()` メソッドで 1 と 2 という値が代入されます。
このクラスのインスタンスを作成してみます。

In [1033]:
l = Link()

l.a

1

In [1034]:
l.b

2

`l` という `Link` クラスのインスタンスが持つ 2 つの属性を表示しています。
インスタンス化を行った際に `__init__()` メソッドの中で代入していた値が、表示されています。

次に、このクラスを**継承**する、`Chain` というクラスを定義してみます。
継承を行う場合は、クラス定義の際にクラス名に続けて `()` を書き、その中にベースにしたいクラスの名前を書きます。
`()` の中に書かれたクラスのことを、定義されるクラスの**親クラス**といいます。
それに対し、`()` の中に書かれたクラスからみると、定義されるクラスは**子クラス**と呼ばれます。
親から子へ機能が受け継がれるためです。

In [1035]:
class Chain(Link):
    
    def sum(self):
        return self.a + self.b

`Chain` クラスは `__init__()` メソッドの定義を持ちません。
`__init__()` メソッドが定義されていない場合、親クラスの `__init__()`  メソッドが自動的に呼び出されます。
そのため、`Chain` クラスでは一見何も属性を定義していないように見えますが、インスタンス化を行うと親クラスである `Link` の `__init__()`  メソッドが自動的に実行され、`a`、`b` という属性が定義されます。
以下のコードで確認してみましょう。

In [1036]:
# Chain クラスをインスタンス化
c = Chain()

c.a

1

In [1037]:
c.b

2

`Chain` クラスの `sum()` メソッドでは、この親クラスの `__init__()`  メソッドで定義されている 2 つの属性を足し合わせて返しています。
今作成したインスタンスから、この `sum()` メソッドを呼び出してみます。

In [1038]:
# sum メソッドを実行
c.sum()

3

このように、**親クラスを継承し、親クラスに無かった新しい機能が追加された、新しいクラスを定義することができます。**

それでは、この `Chain` というクラスにも `__init__()`  メソッドを定義して、新しい属性 `c` を定義し、`sum()` メソッドでは親クラスの `a`、`b` という属性とこの新たな `c` という属性の 3 つの和を返すように変更してみます。

In [1039]:
class Chain(Link):

    def __init__(self):
        self.c = 5  # self.c を新たに追加
    
    def sum(self):
        return self.a + self.b + self.c

# インスタンス化
C = Chain()

In [1040]:
# error
# C.sum()

エラーが出ました。

**エラーメッセージを読みましょう。**

> AttributeError: 'Chain' object has no attribute 'a'

`'Chain'` というオブジェクトは、`'a'` という名前の属性を持っていない、と言われています。
`a` という属性は、`Chain` の親クラスである `Link` の `__init__()`  メソッドで定義されています。
そのため、`Chain` クラスをインスタンス化する際に、親クラスである `Link` の `__init__()`  メソッドが呼ばれているのであれば、このエラーは起こらないはずです。
なぜエラーとなってしまったのでしょうか。

それは、`Chain` クラスにも `__init__()` メソッドを定義したため、親クラスである `Link` の `__init__()`  メソッドが上書きされてしまい、実行されなかったためです。
しかし、親クラスの `__init__()`  メソッドを明示的に呼ぶことで、これは解決できます。

それには、`super()` という組み込み関数を用います。
これを用いると、子クラスから親クラスを参照することができます。

In [1041]:
class Chain(Link):

    def __init__(self):
        # 親クラスの `__init__()` メソッドを呼び出す
        super().__init__()
        
        # self.c を新たに追加
        self.c = 5
    
    def sum(self):
        return self.a + self.b + self.c

# インスタンス化
c = Chain()

In [1042]:
c.sum()

8

今回はエラーが起きませんでした。
`Link` クラスの `__init__()`  メソッドの冒頭で、まず親クラスの `__init__()`  メソッドを実行し、`a`、`b` という属性を定義しているためです。

あるクラスを継承して作られたクラスを、さらに継承して別のクラスを定義することもできます。

In [1043]:
class MyNetwork(Chain):
    
    def mul(self):
        return self.a * self.b * self.c

`MyNetwork` クラスは、`Link` クラスを継承した `Chain` クラスをさらに継承したクラスで、`a`、`b`、`c` という 3 つの属性を掛け合わせた結果を返す `mul()` というメソッドを持ちます。

このクラスのインスタンスを作成し、`mul()` を実行してみましょう。

In [1044]:
net = MyNetwork()

net.mul()

10

$1 \times 2 \times 5 = 10$ が返ってきました。

## プログラムの管理

Python の文法としてはクラスまで理解できていれば問題有りませんが、活用の話を進めていくとモジュールやパッケージという概念が頻出します。簡単なモジュールやパッケージを作成して、それぞれの概念を理解しましょう。ここでの目標はそれぞれを自作できる力を身につけることではなく、どのようなもので、どのような構造になっているかなど、その大枠を理解するところでとどめておきましょう。  

### モジュール

モジュールとは関数やクラスをひとまとめにした Python ファイルです。Colab 上に modules.py という名前のファイルを作成しましょう。ファイル作成の手順は下記の画像に従って行ってください。作成を行う際には、まず Colab と仮想マシンが接続されていることを確認してください。    

![Colab 上にファイルの作成 1](http://drive.google.com/uc?export=view&id=1JtlmI-iagQya27eadl-G3fuDTxsEr2VX)

「ファイル」をクリックして、ファイル画面を開き、空白で右クリックします。  
メニューが表示されたら、「新しいファイル」をクリックするとファイルを作成することができます。名前は modules.py という名前で作成します。  

![Colab 上にファイルの作成 2](http://drive.google.com/uc?export=view&id=1L6quOgxnAc2BNGWHoQZZb4omd6knYXA8)

ファイルの作成が完了したら、ファイル名をクリックして編集画面を開きましょう。  
編集画面で下記のコードをコピー＆ペイストし、`Ctr + S` でファイルを保存しましょう。  

```python

# coding: utf-8

# 返り値が複数個ある関数
def hello(name1='kikagaku', name2='Python'):
  result1 = 'Hello' + name1
  result2 = 'Hello' + name2
  return result1, result2

# 模擬的な機械学習のクラス
class Model:

  def __init__(self, x, t):
    self.x = x
    self.t = t
    self.w = None # 初期状態は値なし

  # モデルの学習を行うメソッド（模擬）
  def fit(self):
    self.w = self.x + self.t

  # モデルの検証を行うメソッド（模擬）
  def score(self):
    print(self.w)

```

modules.py で定義されている hello 関数と Model クラスはこれまでに取り扱った関数とクラスになりますが、今回はモジュールとして外部ファイルに保存しました。  
この作成したモジュールの読み込みは以下のように行います。

In [1045]:
import modules

拡張子を無視して、`import ` ＋ ファイル名と宣言することで modules.py が読み込まれます。  
これで、modules.py で定義されている関数やクラスを実行することができるようになります。modules.py で定義されいている Hello 関数を実行してみましょう。   

In [1046]:
modules.hello()

('Hellokikagaku', 'HelloPython')

続いて、Model クラスを使用してみましょう。クラスを使用するためにはまずインスタンス化が必要でした。  

In [1047]:
# 疑似の入力値と目標値の定義
x, t = 1, 2

In [1048]:
# modules.py の Model クラスのインスタンス化
model = modules.Model(x, t)

クラス内で定義されいている属性を確認しましょう。  

In [1049]:
# Model クラスに初期化されている w 属性の確認
model.w

続いて `.fit()` メソッドを用いて、模擬の学習を行います。 クラス内では `x` と `t` の値が加算されるようになっています。  

In [1050]:
# インスタンス化したモデルの学習（模擬）
model.fit()

学習後の `w` の値を確認しましょう。  
`x` と `t` の値が加算されていれば、正常に動作しています。  

In [1051]:
# 学習完了後のモデルの重みの確認
model.w

3

また、`import modules` のように実行すると、modules.py に記述されている全ての関数やクラスを読み込んでしまいます。必要な関数やクラスだけを読み込みたい場合は次のように実行します。  

In [1052]:
from modules import hello

### パッケージ

本格的にプログラムを作り込んでいくと、1 つのファイルに関数やクラスをまとめて記述することに限界が来るため、プロジェクト単位などモジュールを切り分け、全体をパッケージとする場合が多いです。今回は、kikagaku というパッケージを作成し、modules1 と modules2 というモジュールを格納してみましょう。  
まず、kikagaku というフォルダを作成し、そこに modules1.py と modules2.py を作成してください。  

フォルダの作成方法も先程のファイルの作成と同じ手順で、「新しいフォルダ」を選択します。  
フォルダ内にファイルを作成する際にはフォルダ上で右クリックし、「新しいファイル」を選択します。  

フォルダとファイルの構成は下記のようになっています。
```

kikagaku
├── modules1.py
└── modules2.py

```

それぞれのファイルに次の内容を記述してください。  

`modules1.py`  

```python

# coding: utf-8

def add(a, b):
  return a + b

def sub(a, b):
  return a - b

```


`modules2.py`  

```python

# coding: utf-8

def mul(a, b):
  return a * b

def div(a, b):
  return a / b

```

実際に kikagaku というパッケージから modules1.py のモジュールを読み込み、関数を実行しましょう。

In [1053]:
from kikagaku import modules1

In [1054]:
modules1.add(1, 3)

4

In [1055]:
modules1.sub(1, 3)

-2

パッケージもモジュールと同様に関数を指定して読み込むことも可能です。modules2.py の関数 `mul` 、`div` を指定すると次ぐのようになります。

In [1056]:
from kikagaku.modules2 import mul, div

In [1057]:
mul(1, 3)

3

In [1058]:
div(1, 3)

0.3333333333333333

このように、パッケージ内のモジュールから関数を読み込んで来ることができることがわかりました。  
今回は関数のみを扱っていますが、モジュール内のクラスも当然取り扱うことが可能です。  

ただし、このままだと `import kikagaku` のようにパッケージ名を読み込んだ場合 modules1 と modules2 が紐づきません。パッケージとモジュールの紐づける場合は、kikagaku フォルダ内に `__init__.py` を作成して次のように記述します。   

`__init__.py`  

```
from . import modules1
from . import modules2

```

ファイル構造は下記のようになっている必要があります。  

```

kikagaku
├── __init__.py
├── modules1.py
└── modules2.py

```

こちらのファイルを kikagaku フォルダに追加した状態で再度パッケージを読み込み、モジュールを実行すると次のようになります。

In [1059]:
import kikagaku

In [1060]:
kikagaku.modules1.add(1, 2)

3

In [1061]:
kikagaku.modules2.mul(2, 3)

6

今回はパッケージを簡単に自作しましたが、パッケージを自作することはもう少し先のステップです。次章以降では他の人が作った外部パッケージをインストールしてきて使用するため、読み込み方や階層構造の概念を理解していればひとまず大丈夫です。  

## 練習問題 本章のまとめ

本章で学んだ内容を復習しましょう。下記の内容を次のセルに記述し、実行結果を確認してください。（必要に応じてセルの追加を行ってください。）  

下記の内容のクラス `House` を作成・実行し、実行結果を取得してください。  

- 引数に `name`、`distance`、`crime` とるように、`__init__` 関数を作成
- `get_info` という名前の、下記の実行例が表示されるような関数の作成

*ヒント*  

実行例は下記のようになります。  

```python
house = House('機械学習', 5, 0.3)
house.get_info()
>>>'名前は機械学習、駅からの距離は5km、犯罪発生率は0.3'
```

In [1062]:
# クラスの定義
class House:

    def __init__(self, name, distance, crime):
        self.name = name
        self.distance = distance
        self.crime = crime
    
    def get_info(self):
        print('名前は', self.name, '、駅からの距離は', self.distance, 'km、犯罪発生率は', self.crime, '%', sep='')

In [1063]:
# クラスのインスタンス化
house = House('グンマー帝国', 2000, 30)

In [1064]:
# メソッドの実行
house.get_info()

名前はグンマー帝国、駅からの距離は2000km、犯罪発生率は30%


<img src="http://drive.google.com/uc?export=view&id=1g2xjXbw5qYeqdJqcOf3uASvzBQxhlE8u" width=30%>