<a href="https://colab.research.google.com/github/takahiromiura/class_data_analysis_I/blob/main/notebooks/%E3%82%AF%E3%83%A9%E3%82%B9.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

 # クラス

 ここでは、新しいオブジェクトのクラス (型) を作成する方法について学んでいきます。

 ここは初学者にとって難しいので、完全に理解できなくても大丈夫です。

 ## なぜクラスが必要か

 例えば、データ前処理、分析、可視化用の関数や変数を作成した場合、それらを各用途でまとめた方がスッキリします。

 関数を使ってまとめる方法もありますが、クラスを使った方がより柔軟にふるまいができ、かつバグのリスクを軽減できます。

 クラスを使う動機は他にもありますが、まずは関数や変数の集まりとして、クラスを理解してみると良いでしょう。

 ## `class` 構文

 関数ではなく新しいクラス (型) を定義することで、データ (属性) と必要な操作 (関数) をまとめることができます。

 新しいオブジェクトのクラスを作成するには、`class` 構文を使用します。

 構文は次のような規則です。



 ```py
 class <ClassName>:
     <属性やメソッドの定義>

 ```

 例えば、以下は中身が空っぽのクラスを作成しています。

 何も書かないとエラーになるので、`pass` をインデントブロック内に入れています。

 `pass` 文は、処理をスキップします。

In [1]:
class MyClass:
    pass

MyClass

__main__.MyClass

作成するクラスの名前の規則は、変数や関数定義の時と同様です。

クラスの中身は、インデントブロック内に記述します。

作成したクラスは `<ClassName>` というクラス名として定義されます。

関数名や変数名と区別しやすくするため、クラスの名前は camel case という方式で命名することが推奨されています。

- [Python のコーディングガイド](https://pep8-ja.readthedocs.io/ja/latest/)

camel case とは、ラクダ (camel) のように、単語の頭文字を大文字にして、そのままつなげる方法です。

camel case に適用すると、CamelCase になります。

ただし、全てのクラスがこの形式で命名されているわけではありません (例: `datetime`)。

# インスタンス

`class` 構文によって作成したクラスは、いうなれば設計図のようなものです。

この設計図から作成したオブジェクトを、**インスタンス** (instance) と言います。

設計図自体もオブジェクトです。

カテゴリーとしてのクラスと、オブジェクトとしてのクラスを分けるため、後者はクラス・オブジェクトと呼称します。

家の設計図をクラス、出来上がった家をインスタンスとして見なすことができるでしょう。

今まで扱ってきた `1`、`"japan"`、`3.14`、`[1, 2, 3]`、`date(2024, 1, 1)` などのオブジェクトも、それぞれ整数 (int)、文字列 (str)、小数点 (float)、リスト (list)、日時 (date) クラスのインスタンスとして考えられます。

整数型などの基本的なクラスならば、`1`, `3` などでインスタンスが作成できますが、`int` クラス・オブジェクトを使っても作成できます。

すでに `datetime` や `date` クラス・オブジェクトを使ってインスタンスを作成しました。

いつの日付の `date` インスタンスなのか、何の整数の `int` インスタンスなのか、インスタンスの作成にも引数を指定できます。

`int` クラス・オブジェクトは、`int(3)` とやれば `3` の値を持つ整数型のインスタンスが作成されます。

また、文字列の `"3"` を入れても上手く変換してくれます。

In [2]:
int

int

In [3]:
int(3)

3

In [4]:
int("3")

3

`str`、`float`、`list`、`tuple`、`dict` クラス・オブジェクトも存在します。

なお、これらは予約語ではないですが、別の値で上書きしないようにしてください。

先ほど作った `MyClass` クラス・オブジェクトから、インスタンスを作成します。

とはいえ、このクラスはまっさらな設計図のようなものなので、引数にはまだ何も入れられません。

In [5]:
MyClass()

<__main__.MyClass at 0x7847348e5930>

何か入れようとするとエラーになります。

In [6]:
# MyClass(10) # エラー

### クラス属性

クラスにおける属性は、**クラス属性** (class attribute) と **インスタンス属性** (instance attribute) の 2 つがあります。

まずは、クラス属性の定義の仕方を見ていきます。

インスタンス属性については、後ほど説明します。

クラス属性の定義は、非常にシンプルで、インデントブロック内で変数を定義するだけです。

以下のコードは、`MyCalender` クラスに `year` というクラス属性を付与し、その値として `2024` を割り当てています。

In [7]:
class MyCalender:

    year = 2024 # クラス属性の定義

クラス属性はインスタンス化してもしなくても参照可能です。

In [8]:
MyCalender.year # クラス・オブジェクトからの参照

2024

In [9]:
MyCalender().year # インスタンスからの参照

2024

#### やってみよう

`Today` クラスを作成して、`year`, `month`, `day` というクラス属性を定義してみましょう。

また、各クラス属性を参照してみましょう。

### メソッド

クラスは、単にデータや関数をまとめた箱としての役割だけでなく、関数 (メソッド) の中で、そのオブジェクトが持つ属性などを参照することができます。

例えば、`"japan"` という文字列型のインスタンスには `upper` という、大文字にするメソッドがあります。

In [10]:
"japan".upper()

'JAPAN'

よく見ると、この `upper` メソッドという関数には何も入れていません。

しかし、このオブジェクトが持つ値 `japan` という文字列を参照し、大文字にしています。

これは関数との大きな違いです。

メソッド内でオブジェクトが持つ属性や他のメソッドを呼び出したい場合、まずオブジェクト自身が参照できないといけません。

では、メソッド内でオブジェクト自身にどのような名前が割り当てられているのでしょうか。

Python では伝統的にオブジェクト自身は `self` という変数名を割り当てるようにしています。

JavaScript などでは `this` という名前を使用します。

実際には、この名前は何でもよいですが、他の人も分かりやすいように合わせた方が無難です。

また、メソッドと関数の大きな違いは、メソッドでは最初の引数はオブジェクト自身でなければいけません。

そして、メソッドを呼ぶ際には、第 1 引数は自動的に入れられます。

つまり、`"japan".upper()` というメソッドを呼んだ時、自動的に `"japan"` という文字列型のインスタンスが `upper` メソッドの第 1 引数に入れられています。

以下は、`MyCalender` クラス・オブジェクトのクラス属性 `year` の値を出力するメソッドを追加しています。

`self.year` とすることで、インスタンスの属性を参照できることを確認してください。

In [11]:
class MyCalender:

    year = 2024

    def print_year(self):
        print(self.year) # `year` 属性を呼び出している

MyCalender().print_year()

2024


インスタンス化しないと、メソッドの呼び出し時に第 1 引数にインスタンス自身が入りません。

なので、クラス・オブジェクトからメソッドを呼び出そうとするとエラーになります。

In [12]:
# MyCalender.print_year()

引数によって処理の内容を変えたい場合は、2 番目以降に追加の引数を定義します。

メソッドは関数なので、何か値を返したい場合は `return` を使います。

In [13]:
class MyCalender:

    year = 2024

    def print_year(self):
        print(self.year)

    def print_futuer_year(self, year_length):
        print(self.year + year_length)

    def get_future_year(self, year_length):
        return self.year + year_length

MyCalender().print_futuer_year(10)
MyCalender().get_future_year(20)

2034


2044

メソッドには、クラスメソッドや静的メソッドもありますが、ここでは割愛します。

#### やってみよう

上の `MyCalender` クラスに `get_past_year` メソッドを追加してください。

`get_past_year` メソッドは、`year_length` を引数にとり、`year` クラス属性から `year_length` を引いた値 (`int` 型) を返します。

### インスタンス属性

先ほどの `MyCalender` クラス・オブジェクトは、`year` というクラス属性が定義されています。

インスタンス毎に属性を変えるには、初期化メソッドを使います。

初期化メソッドは、特殊なメソッド名 `__init__` で定義します。

`init` の左右にアンダーバー `_` が 2 つ続いていることに注意してください。

両端の 2 つのアンダーバー `_` (ダブルアンダーバー、略してダンダーと呼ぶ人もいます) に挟まれたメソッドを特殊メソッドと呼びます。

他には、`__add__` や `__del__` など様々なものがあります。

先ほどのカレンダークラス `MyCalender` の `year` 属性を変更可能にします。

`__init__` メソッドも他のメソッドと同様、最初の引数にはオブジェクト自身 (`self`) が入ります。

その後に、追加の引数を加えます。

インスタンスに属性を紐づけるには、`self.<attr_name> = <value>` とします。

In [14]:
class MyCalender:

     def __init__(self, year):
         self.year = year

     def print_current_year(self):
         print(self.year)

In [15]:
MyCalender(2015).print_current_year()
MyCalender(2025).print_current_year()

2015
2025


以下のクラスで `year` 属性を呼ぶと、エラーになります。

初期化メソッド内で `2015` という整数型オブジェクトを `year` という変数名で引き受けたにも関わらず、インスタンス属性に `year` の値を追加していないからです。

In [16]:
class NullCalender:

     def __init__(self, year):
         year = year # これはインスタンス属性に値を割り当てる式ではない

# NullCalender(2015).year # これはエラー

また、インスタンス属性はインスタンス化しないと参照することができません。

In [17]:
class FixedCalender:

    def __init__(self):
        self.year = 2024

FixedCalender().year
# FixedCalender.year # これはエラー

2024

初期化メソッドには `return` は入れません。

`return` を入れるとエラーが返ってきます。

In [18]:
class InvalidCalender:

    def __init__(self, year):
        return year

# ErrorCalender(2020) # インスタンス作成 (エラー)

特定の値の整数型、特定の日付の日付型のインスタンスを作成するときに、`int(8)` や `date(2024, 1, 1)` としたときも、この初期化メソッドが実行されています。

#### やってみよう

以下の機能を持つ、`Name` クラスを作成してください。

- インスタンス化には、`first` と `last` が必要
- `first`, `last`, `full` というインスタンス属性を持つ

これらは次のような値を返す。

`name = Name("太郎", "和歌山")` とした場合。

- `name.first` は `"太郎"` を返す
- `name.last` は `"和歌山"` を返す
- `name.full` は `"和歌山 太郎"` を返す

属性の追加・上書きは、初期化メソッド以外でも可能です。

In [19]:
my_calender = MyCalender(2025)
print(my_calender.year)

my_calender.year = 2020 # インスタンス属性の上書き
print(my_calender.year)

my_calender.month = 10 # インスタンス属性の付与
print(my_calender.month)

2025
2020
10


In [20]:
class FlexibleCalender:

    def __init__(self, year):
         self.year = year

    def change_year(self, year):
         self.yewr = year

    def add_month(self, month):
        self.month = month

flex_calender = FlexibleCalender(2025)
print(flex_calender.year)

flex_calender.change_year(2020) # メソッド内でインスタンス属性を書き換え
print(flex_calender.year)

flex_calender.add_month(10) # インスタンス属性の付与
print(flex_calender.month)

2025
2025
10


例えば、`pandas` というライブラリの `DataFrame` はラベル付きの表データ形式のデータ構造です。

これに対して、新しい列や行を追加、値を書き換えたりして、データの前処理や分析を行います。

## 継承

継承をすることで、継承元の機能を使いまわすことができます。

継承元のクラスを **親クラス** 、継承先のクラスを **子クラス** といいます。

複雑な計算ロジックは親クラスで定義しておき、計算に使うモデルを子クラスで定義するといった使い方などがあります。

例えば、深層学習 (deep learning) 用のライブラリ、[PyTorch](https://pytorch.org/) では、学習に使うニューラルネットワークがどのようなものかをクラスを継承して定義します。

継承も `class` 構文を用います。

継承元の親クラスを <ParentClass>、子クラスを <ChildClass> とします。

次のように書きます。

```py
class <ChildClass>(<ParentClass>):

    <関数や属性の定義>

```

以下のコードは、`MyCalender` が `BaseCalender` を継承しています。

継承すると、親クラスのメソッドが使えます。

子クラスでメソッドや属性を追加することもできます。

子クラスの変更は親クラスには影響しません。

In [21]:
class BaseCalender:

    def __init__(self, year):
        self.year = year

    def get_future_year(self, year_length):
        return self.year + year_length

class MyCalender(BaseCalender):

    def get_next_year(self):
        return self.year + 1

print(BaseCalender(2025).year)
print(BaseCalender(2025).get_future_year(10))

print(MyCalender(1900).year) # 親クラスで定義したインスタンス属性
print(MyCalender(1900).get_future_year(10)) # 親クラスで定義したメソッド

print(MyCalender(2500).get_next_year()) # 子クラスで定義したメソッド
# print(BaseCalender(2025).get_next_year()) # エラーになる

2025
2035
1900
1910
2501


子クラスで親クラスと同じメソッドや属性を定義すると上書きされます。

In [22]:
class MyParent:

    def print_me(self):
        print("私は親です")

class MyChild(MyParent):

    def print_me(self):
        print("私は子です")

MyParent().print_me()
MyChild().print_me()

私は親です
私は子です


クラスを継承した場合、`super` 関数を使うことで、親のメソッドを呼び出すことができます。

以下のように子クラスの初期化メソッド内で、親クラスの初期化メソッドを呼ぶことで親クラスのインスタンス属性を付与し、さらに子クラス独自のインスタンスを属性を追加することができます。

In [23]:
class Book:
    def __init__(self, title, author):
        self.title = title
        self.author = author

    def display_info(self):
        return f"Title: {self.title}, Author: {self.author}"

class EBook(Book):
    def __init__(self, title, author, file_format):
        super().__init__(title, author)  # 親クラスの初期化メソッドの呼び出し
        self.file_format = file_format  # 追加のインスタンス属性の付与

    def display_info(self):
        base_info = super().display_info()  # 親クラスのメソッドの呼び出し
        return f"{base_info}, File Format: {self.file_format}"

book = Book("1984", "George Orwell")
ebook = EBook("1984", "George Orwell", "PDF")

print(book.display_info())  # Title: 1984, Author: George Orwell
print(ebook.display_info())  # Title: 1984, Author: George Orwell, File Format: PDF

Title: 1984, Author: George Orwell
Title: 1984, Author: George Orwell, File Format: PDF


文字列の前に `f` を付けたものを f-string 記法と呼びます。

文字列内に `{<name>}` のように、変数名を波括弧で囲むと、指定した変数名の値が参照されます。

より複雑なフォーマットの書き方は Python ドキュメントの [入力と出力](https://docs.python.org/ja/3.12/tutorial/inputoutput.html) を参照してください。

In [24]:
this_year = 2025
f"this year is {this_year}"

'this year is 2025'