# Week4授業前課題3 オブジェクト指向に慣れよう

1.この課題の目的
クラスを利用したコードを読み書きできるようにする
以下の要件をすべて満たしていた場合、合格とします。

※Jupyter Notebookを使い課題に沿った検証や説明ができている。

2.オブジェクト指向
これまでの課題では触れてきませんでしたが、StandardScalerやLinearRegressionのような クラス と呼ばれるものが
Pythonなどのプログラム言語では利用できます。

クラスの構文は、オブジェクト指向と呼ばれる考え方を利用したプログラミングの基本的な道具になります。

この課題ではこれまでに既に登場していたクラスを例に、クラスを活用することでどのようなことができるのかを見て学んでいきます。
そして課題の後半ではStandardScalerのクラスをスクラッチで自作します。

3.scikit-learnの標準化クラス
課題1で利用したscikit-learnに用意されている標準化を行うためのクラスStandardScalerを例に見ていきます。
サンプルコードを用意しましたので、これを利用しながら理解していきます。

sklearn.preprocessing.StandardScaler — scikit-learn 0.20.0 documentation


In [23]:
# サンプルコード
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris

data = load_iris()
X = data.data[:10]

scaler = StandardScaler()
scaler.fit(X)
print("平均 :", scaler.mean_)
print("分散 :", scaler.var_)
X_std = scaler.transform(X)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]


インスタンス化
クラスを使う際はまず以下のようなコードを書きますが、これを インスタンス化 と呼びます。

In [13]:
scaler = StandardScaler()

StandardScalerというクラスオブジェクトから、scalerと名前をつけたインスタンスオブジェクトが作られました。

クラスの命名法
Pythonではクラス名は頭文字が大文字、他は小文字という命名法がPEP8により定められています。
単語間にアンダースコアは入れません。これを CapWords 方式と呼びます。

はじめに — pep8-ja 1.0 ドキュメント クラスの名前

こういった形式のものはクラスだと判断することができます。

インスタンスは複数作れる
あるクラスオブジェクトからは複数のインスタンスオブジェクトを作成することが可能です。

In [14]:
scaler0 = StandardScaler()
scaler1 = StandardScaler()
scaler2 = StandardScaler()

## 【問題1】これまで利用してきたクラスの列挙

クラスを使う際はインスタンス化を行うことと、クラスの命名法がわかりました。
この情報を元に、これまでの課題で利用してきたコードの中でどのようなクラスがあったかを答えてください。

最低でもPandas、matplotlib、scikit-learnからそれぞれ1つ以上見つけてください。

【回答】
・Pandas　:　.DataFrame()
・matplotlib　：　.boxplot()
・scikit-learn　：　.fit()

## 【問題2】これまで利用してきたメソッドやインスタンス変数の列挙

これまでの課題で利用してきたコードの中でどのようなメソッドやインスタンス変数があったかを答えてください。

【回答】
・メソッド　：　.isnull()、.sum()、.show()、.title()、.matrix()
・インスタンス変数　：　.values、.name、.intimacy、scale_、mean_

## 【問題3】標準化クラスをスクラッチで作成

理解をより深めるため、StandardScalerをスクラッチで作成しましょう。
scikit-learnは使わず、NumPyなどを活用して標準化の計算を記述します。
具体的にはfitメソッドとtransformメソッドを作ります。

今回は雛形を用意しました。クラスの作成方法は関数に近いです。メソッドはクラスの中にさらにインデントを一段下げて記述します。

インスタンス変数を作成する際はself.mean_のようにselfを付けます。
クラスの外からscaler.mean_と書いていたscalerの部分が自分自身を表すselfになっています。

In [51]:
# 雛形

class ScratchStandardScaler():
    
    """
    標準化のためのクラス

    Attributes
    ----------
    mean_ : 次の形のndarray, shape(n_features,)
        平均
    var_ : 次の形のndarray, shape(n_features,)
        分散
    """

    def fit(self, X):
        """
        標準化のために平均と標準偏差を計算する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            学習データ
        """

        self.mean_ = np.sum(X, axis=0)/len(X)
        self.var_ = np.sum(((X - np.sum(X, axis=0)/len(X)) ** 2), axis=0)


    def transform(self, X):
        
        """
        fitで求めた値を使い標準化を行う。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            特徴量

        Returns
        ----------
        X_scaled : 次の形のndarray, shape (n_samples, n_features)
            標準化された量
        """
          
        X_scaled = (X - self.mean_) / np.sqrt(self.var_)
        
        return X_scaled

In [52]:
# 以下のコードが実行できるようにしましょう。

import numpy as np
from sklearn.datasets import load_iris

data = load_iris()
X = data.data[:10]

scratch_scaler = ScratchStandardScaler()
scratch_scaler.fit(X)
print("平均 :", scratch_scaler.mean_)
print("分散 :", scratch_scaler.var_)
X_std = scratch_scaler.transform(X)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.764 0.849 0.105 0.056]


ライブラリのソースコードを確認
scikit-learnの場合は公式ドキュメントの右上にソースコードへのリンクがあります。

[source]

どのようなコードになっていたかを確認してみましょう。
（問題3に取り組んだ後に見ることを推奨します）スクラッチで作成したものよりも全体的にコードが長いのではないかと思います。
inverse_transformメソッドのように作成しなかったものもありますが、それだけではありません。
例えば以下のように、warning文が記述されているなどします。

if not isinstance(y, string_types) or y != 'deprecated':
    warnings.warn("The parameter y on transform() is "
                  "deprecated since 0.19 and will be removed in 0.21",
                  DeprecationWarning)
しかし、特に今注目したいのは次の特殊メソッドについてです。

特殊メソッド
ソースコードの中に含まれる、まだ説明していない重要な部分が以下です。
このような__init__というメソッドは、どのクラスにも共通して置かれる コンストラクタ と呼ばれるメソッドです。

In [53]:
def __init__(self, copy=True, with_mean=True, with_std=True):
    self.with_mean = with_mean
    self.with_std = with_std
    self.copy = copy

今回のスクラッチではcopy、with_mean、with_stdなどのパラメータを省略しましたが、
このようにインスタンス化の際にパラメータを指定して保存しておくということはよくある使い方です。

コンストラクタの動作を確認するためのサンプルコードを用意しました。
コンストラクタは、インスタンス化が行われる時に自動的に実行されるという働きがあります。
こういった特殊な動作をするメソッドを、 特殊メソッド と呼びます。

In [54]:
#サンプルコード

class ExampleClass():
    """
    説明用の簡単なクラス

    Parameters
    ----------
    value : float or int
        初期値

    Attributes
    ----------
    value : float or int
        計算結果
    """
    def __init__(self, value):
        self.value = value
        print("初期値{}が設定されました".format(self.value))
    def add(self, value2):
        """
        受け取った引数をself.valueに加える
        """
        self.value += value2

example = ExampleClass(5)
print("value :", example.value)
example.add(3)
print("value :", example.value)

初期値5が設定されました
value : 5
value : 8


## 【課題4】 四則演算を行うクラスの作成

上記ExampleClassは足し算のメソッドを持っていますが、これに引き算、掛け算、割り算のメソッドを加えてください。
また、コンストラクタに入力されたvalueが文字列や配列など数値以外だった場合には警告文を出し、self.value=0とするコードを追加してください。
クラス名や説明文も適切に書き換えてください。

In [62]:
class FourArithmeticOperations():
    """
    四則演算を行うクラス

    Parameters
    ----------
    value : float or int
        初期値

    Attributes
    ----------
    value : float or int
        計算結果
    """
        
    def __init__(self, value):

        #例外処理
        if not (type(value) == int or type(value) == float):
            print("TypeError: intかfloatで入力してください")
            value = 0
            
        self.value = value
        print("初期値{}が設定されました".format(self.value))        
        
        
    def add(self, value2):
        """
        受け取った引数をself.valueに加える
        """
        self.value += value2

    def sub(self, value2):
        """
        受け取った引数をself.valueから引く
        """
        self.value -= value2
        
    def mul(self, value2):
        """
        受け取った引数をself.valueに掛ける
        """
        self.value *= value2
        
    def div(self, value2):
        """
        受け取った引数でself.valueを割る
        """
        self.value /= value2

In [65]:
example1 = FourArithmeticOperations(5)
print("value :", example1.value)
example1.add(3)
print("value :", example1.value)

初期値5が設定されました
value : 5
value : 8


In [66]:
example2 = FourArithmeticOperations("A")

TypeError: intかfloatで入力してください
初期値0が設定されました
