In [2]:
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris

data = load_iris()
X = data.data[:10]

scaler = StandardScaler()
scaler.fit(X)
print("平均 :", scaler.mean_)
print("分散 :", scaler.var_)
X_std = scaler.transform(X)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]


# 【問題1】これまで利用してきたクラスの列挙
#### MSEクラスを使う際はインスタンス化を行うことと、クラスの命名法がわかりました。
#### この情報を元に、これまでの課題で利用してきたコードの中でどのようなクラスがあったかを答えてください。
#### 最低でもPandas、matplotlib、scikit-learnからそれぞれ1つ以上見つけてください。

Pandas:DataFrame()
<br>matplotlib:figure()
<br>scikit-learn:RandomForestRegressor()

# 【問題2】これまで利用したメソッドやインスタンス変数の列挙
#### これまでの課題で利用してきたコードの中でどのようなメソッドやインスタンス変数があったかを答えてください。

#### 最低でもそれぞれ5つ以上答えてください。

#### ndarrayやstrもインスタンス

#### ドットをつけるというと、NumPyのndarrayに対してndarray.shapeやndarray.sum()のような使い方は何度も利用してきたかと思います。これは、ndarrayもインスタンスオブジェクトであり、shapeはインスタンス変数、sumはメソッドだったということです。

#### Pythonのコードに登場するデータはどれもインスタンスオブジェクトであり、listやstrもメソッドを持ちます。

■インスタンス変数
size
info
dtype
nbytes
ndim

■メソッド
.append(x)
.extend(iterable)
.insert(i, x)
.pop([i])
.clear()


# 【【問題3】標準化クラスをスクラッチで作成
#### 理解をより深めるため、StandardScalerをスクラッチで作成しましょう。
#### scikit-learnは使わず、NumPyなどを活用して標準化の計算を記述します。
#### 具体的にはfitメソッドとtransformメソッドを作ります。

#### 今回は雛形を用意しました。クラスの作成方法は関数に近いです。
#### メソッドはクラスの中にさらにインデントを一段下げて記述します。

#### インスタンス変数を作成する際はself.mean_のようにselfを付けます。
#### クラスの外からscaler.mean_と書いていたscalerの部分が自分自身を表すselfになっています。

In [3]:
from statistics import mean, median,variance,stdev
import numpy as np
X = [1,2,3,4,5]
variance(X)
np.var(X)

2.0

In [4]:
class ScratchStandardScaler():
    """
    標準化のためのクラス

    Attributes
    ----------
    mean_ : 次の形のndarray, shape(n_features,)
        平均
    var_ : 次の形のndarray, shape(n_features,)
        分散
    """

    def fit(self, X):
        """
        標準化のために平均と標準偏差を計算する。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            学習データ
        """

        self.mean_ = np.mean(X,axis=0)
        self.var_ = np.var(X,axis=0)

        pass

    def transform(self, X):
        """
        fitで求めた値を使い標準化を行う。

        Parameters
        ----------
        X : 次の形のndarray, shape (n_samples, n_features)
            特徴量

        Returns
        ----------
        X_scaled : 次の形のndarray, shape (n_samples, n_features)
            標準化された特緒量
        """
        X_scaled = (X - self.mean_) / (self.var_)**1/2
        
        
        pass
        return X_scaled

In [5]:
import numpy as np
from sklearn.datasets import load_iris

data = load_iris()
X = data.data[:10]

scratch_scaler = ScratchStandardScaler()
scratch_scaler.fit(X)
print("平均 :", scratch_scaler.mean_)
print("分散 :", scratch_scaler.var_)
X_std = scratch_scaler.transform(X)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]


# 【課題4】 四則演算を行うクラスの作成
#### 上記ExampleClassは足し算のメソッドを持っていますが、
#### これに引き算、掛け算、割り算のメソッドを加えてください。

#### また、コンストラクタに入力されたvalueが文字列や配列など数値以外だった場合には警告文を出し、
#### self.value=0とするコードを追加してください。

#### クラス名や説明文も適切に書き換えてください。

In [6]:
import warnings
class Calculation():
    """
    説明用の簡単なクラス

    Parameters
    ----------
    value : float or int
        初期値

    Attributes
    ----------
    value : float or int
        計算結果
    """
    def __init__(self, value):
        self.value = value
        if type(value) == int or type(value) == float:
            print("初期値{}が設定されました".format(self.value))
        else:
            warnings.warn("数字を入力してください")
            self.value = 0
    def add(self, value2):
        """
        受け取った引数をself.valueに加える
        """
        self.value += value2
    def minus(self, value3):
        """
        受け取った引数をself.valueから引く
        """
        self.value -= value3

    def multiply(self, value4):
        """
        受け取った引数をself.valueに掛ける
        """
        self.value *= value4
        
    def divide(self, value5):
        """
        受け取った引数でself.valueを割る
        """
        self.value /= value5

In [7]:
example = Calculation('t')
print("value :", example.value)
example.add(6)
print("value :", example.value)

value : 0
value : 6


