# **Week4授業前課題3 オブジェクト指向の活用**

### **scikit-learnの標準化クラス**

In [17]:
import numpy as np
from sklearn.preprocessing import StandardScaler
from sklearn.datasets import load_iris

data = load_iris()
X = data.data[:10]

scaler = StandardScaler()
scaler.fit(X)
print('平均 :', scaler.mean_)
print('分散 :', scaler.var_)
X_std = scaler.transform(X)
X_std

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]


array([[ 0.86828953,  0.65207831, -0.48795004, -0.26726124],
       [ 0.14471492, -1.06391725, -0.48795004, -0.26726124],
       [-0.57885968, -0.37751902, -1.46385011, -0.26726124],
       [-0.94064699, -0.72071813,  0.48795004, -0.26726124],
       [ 0.50650222,  0.99527742, -0.48795004, -0.26726124],
       [ 1.95365143,  2.02487476,  2.43975018,  2.40535118],
       [-0.94064699,  0.3088792 , -0.48795004,  1.06904497],
       [ 0.50650222,  0.3088792 ,  0.48795004, -0.26726124],
       [-1.66422159, -1.40711636, -0.48795004, -0.26726124],
       [ 0.14471492, -0.72071813,  0.48795004, -1.60356745]])

### **【問題1】これまで利用してきたクラスの列挙**

**Pandas**

DataFrameクラス: 2次元のデータ構造を持つクラス

**matplotlib**

patchesクラス: matplotlibの簡易的な図形描写モジュール

colorsクラス: Matplotlibで色をコントロールするモジュール

**scikit-learn**

datasetsクラス: アヤメのデータセットなど様々なデータが収められているモジュール

In [5]:
print('平均 : {}'.format(scaler.mean_))
print('分散 : {}'.format(scaler.var_))

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]


### **【問題2】これまで利用してきたメソッドやインスタンス変数の列挙**

**【メソッド】**

*・数値計算系*

sum(), max(), min(), abs(), round()

*・型関連*

dict(), int(), float(), set(), list(), str(), tuple(), type(), 

*・リスト、イテレーター処理系*

all(), any(), enumerate(), len(), range(), zip()

*・文字列系*

format(), ascii()

**【インスタンス変数】**

shape, dtype, column, index, mean_, var_

### **【問題3】標準化クラスをスクラッチで作成**

In [22]:
class ScratchStandardScaler():
    """
    標準化のためのクラス

    Attributes
    ----------
    mean_ : 次の形のndarray, shape(n_features,)
        平均
    var_ : 次の形のndarray, shape(n_features,)
        分散
    """
    def __init__(self):
        self.X = X

    def fit(self, X):
        self.mean_ = np.sum(self.X, axis=0) / self.X.shape[0]
        self.var_ = np.sum((self.X - self.mean_)**2, axis=0) / self.X.shape[0]
        
        return self.mean_, self.var_
    
    def transform(self, X):
        X_scaled = (self.X - self.mean_) / (self.var_)**0.5
        
        return X_scaled

In [23]:
import numpy as np
from sklearn.datasets import load_iris

data = load_iris()
X = data.data[:10]

scratch_scaler = ScratchStandardScaler()
scratch_scaler.fit(X)
print('平均 : {}'.format(scratch_scaler.mean_))
print('分散 : {}'.format(scratch_scaler.var_))
X_std = scratch_scaler.transform(X)
print(X_std)

平均 : [4.86 3.31 1.45 0.22]
分散 : [0.0764 0.0849 0.0105 0.0056]
[[ 0.86828953  0.65207831 -0.48795004 -0.26726124]
 [ 0.14471492 -1.06391725 -0.48795004 -0.26726124]
 [-0.57885968 -0.37751902 -1.46385011 -0.26726124]
 [-0.94064699 -0.72071813  0.48795004 -0.26726124]
 [ 0.50650222  0.99527742 -0.48795004 -0.26726124]
 [ 1.95365143  2.02487476  2.43975018  2.40535118]
 [-0.94064699  0.3088792  -0.48795004  1.06904497]
 [ 0.50650222  0.3088792   0.48795004 -0.26726124]
 [-1.66422159 -1.40711636 -0.48795004 -0.26726124]
 [ 0.14471492 -0.72071813  0.48795004 -1.60356745]]


In [304]:
# サンプルコードを書いてみる

class ExampleClass():
    """
    説明用の簡単なクラス
    
    Parameters
    ----------
    value : float or int
        計算結果
    """
    def __init__(self, value):
        self.value = value
        print('初期値{}が設定されました'.format(self.value))
    def add(self, value2):
        """
        受け取った引数をself.valueに加える
        """
        self.value += value2
        
example = ExampleClass(5)
print('value : {}'.format(example.value))
example.add(3)
print('value : {}'.format(example.value))

初期値5が設定されました
value : 5
value : 8


### **【問題4】四則演算を行うクラスの作成**

In [313]:
# 四則演算を行うCalculationクラスを実装する
class Calculation():
    def __init__(self, value):
        self.value = value

    def add(self, value1):
        if type(self.value) != int and type(self.value) != float:
            self.value = 'Error'
            return self.value
        self.value += value1
        
    def sub(self, value2):
        if type(self.value) != int and type(self.value) != float:
            self.value = 'Error'
            return self.value
        self.value -= value2
        
    def mul(self, value3):
        if type(self.value) != int and type(self.value) != float:
            self.value = 'Error'
            return self.value
        self.value *= value3
        
    def div(self, value4):
        if type(self.value) != int and type(self.value) != float:
            self.value = 'Error'
            return self.value
        self.value /= value4

In [314]:
cal = Calculation(2.3)
cal.value
cal.add(3)
cal.value

5.3

In [315]:
cal1 = Calculation(np.array([1, 2, 3]))
cal1.value
cal1.mul(4)
cal1.value

'Error'