In [1]:
# 《サンプルコード》
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris
data = load_iris()
X = data.data[:10]
scaler = StandardScaler()
scaler.fit(X)
print("平均 :", scaler.mean_)
print("分散 :", scaler.var_)
X_std = scaler.transform(X)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]


**【問題1】これまで利用してきたクラスの列挙**


クラスを使う際はインスタンス化を行うことと、クラスの命名法がわかりました。

この情報を元に、これまでの課題で利用してきたコードの中でどのようなクラスがあったかを答えてください。

Pandas、matplotlib、scikit-learnからそれぞれ1つ以上見つけてください。

>Pandas
> ⇨DataFrame

>matplotlib
>⇨FuncAnimation

>scikit-learn
>⇨RandomForestRegressor、DecisionTreeRegress[or



**【問題2】これまで利用してきたメソッドやインスタンス変数の列挙**


これまでの課題で利用してきたコードの中でどのようなメソッドやインスタンス変数があったかを答えてください。

最低でもそれぞれ5つ以上答えてください。

>メソッド⇨sum, range, min, max, len

>インスタンス変数⇨shape, scaler.mean_, scaler.var_, T

**【問題3】標準化クラスをスクラッチで作成**

理解をより深めるため、StandardScalerをスクラッチで作成しましょう。

scikit-learnは使わず、NumPyなどを活用して標準化の計算を記述します。

具体的にはfitメソッドとtransformメソッドを作ります。

In [2]:
class ScratchStandardScaler():
    """
    標準化のためのクラス
    Attributes
    ----------
    mean_ : 次の形のndarray, shape(n_features,)
        平均
    var_ : 次の形のndarray, shape(n_features,)
        分散
    """

    def fit(self, X):
        """
        標準化のために平均と標準偏差を計算する。
        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            訓練データ
        """

        self.mean_ = np.mean(X, axis=0)
        self.std_ = np.std(X, axis=0)
        self.var_ = np.var(X, axis=0)

    def transform(self, X):
        """
        fitで求めた値を使い標準化を行う。
        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            特徴量
        Returns
        ----------
        X_scaled : 次の形のndarray, shape (n_samples, n_features)
            標準化された特緒量
        """
        
        X_scaled = self.mean_/self.std_

        return X_scaled

In [3]:
import numpy as np
from sklearn.datasets import load_iris
data = load_iris()
X = data.data[:10]
scratch_scaler = ScratchStandardScaler()
scratch_scaler.fit(X)
print("平均 : {}".format(scratch_scaler.mean_))
print("分散 : {}".format(scratch_scaler.var_))
X_std = scratch_scaler.transform(X)
print(X_std)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]
[17.58286291 11.35989059 14.15055106  2.93987366]


【問題4】 **四則演算を行うクラスの作成**

上記ExampleClassは足し算のメソッドを持っていますが、これに引き算、掛け算、割り算のメソッドを加えてください。

コンストラクタに入力されたvalueが文字列や配列など数値以外だった場合にはエラーを出すようにしてください。

クラス名や説明文も適切に書き換えてください。

In [4]:
class ExampleClass():
    """
    説明用の簡単なクラス
    Parameters
    ----------
    value : float or int
        初期値
    Attributes
    ----------
    value : float or int
        計算結果
    """
    def __init__(self, value):

        if type(value) == type(1):

            self.value = value
            print("初期値{}が設定されました".format(self.value))
        else:
            raise ValueError("error!")

    def add(self, value2):
        """
        受け取った引数をself.valueに加える
        """
        self.value += value2

    def subtract(self, value2):
        """
        受け取った引数をself.valueから引く
        """
        self.value -= value2

    def multiply(self, value2):
        """
        受け取った引数でself.valueを掛ける
        """
        self.value *= value2

    def divide(self, value2):
        """
        受け取った引数でself.valueを割る
        """
        self.value /= value2


In [5]:
example = ExampleClass(5)
print("value : {}".format(example.value))
example.add(3)
print("value : {}".format(example.value))
example.subtract(4)
print("value : {}".format(example.value))
example.multiply(5)
print("value : {}".format(example.value))
example.divide(6)
print("value : {}".format(example.value))

example = ExampleClass("a")

print(type(1))


初期値5が設定されました
value : 5
value : 8
value : 4
value : 20
value : 3.3333333333333335


ValueError: ignored