In [1]:
%run hello.py

In [2]:
%run prog.py -h

In [3]:
%run prog.py 1 2 3 4

4


In [4]:
%run prog.py 1 2 3 4 --sum

10


In [5]:
%run prog.py 1 2 5 --sum

8


In [6]:
%run hello_argparse.py

Hello, World!
RESULT : 102.4


In [7]:
%run hello_argparse.py  --display --alpha 0.3 --text "Hello, argparse!" --num_iters 5

Hello, argparse!
0.6
1.2
2.4
4.8
9.6
RESULT : 9.6


In [8]:
%run hello_argparse.py  --alpha 1.0 --text "引数面白い" --num_iters 3

引数面白い
RESULT : 8.0


In [9]:
# 公式ドキュメントより https://docs.python.jp/3/library/argparse.html
# 'store_true' は 'store_const' の、それぞれ True と False を格納する特別版。デフォルト値を順に False と True にする。
# 引数として指定されていると、store_trueであればtrueに。store_falseであればfalseにする。
# 引数として指定されていないと、デフォルト値はその逆の状態となる。
parser = argparse.ArgumentParser()
parser.add_argument('--foo', action='store_false')
parser.add_argument('--bar', action='store_false')
parser.add_argument('--baz', action='store_true')
parser.parse_args('--foo --bar'.split())

Namespace(bar=False, baz=False, foo=False)

## 【問題1】train_test_splitのスクラッチ
scikit-learnのtrain_test_splitを自作する

In [10]:
import numpy as np
X, y = np.arange(10).reshape((5, 2)), range(5)
print(X)
print(y)
len(y)

[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]
range(0, 5)


5

### スクラッチ実装ファイルを呼び出し実行する


In [11]:
# ndarray の使い方おさらい
np.ndarray(shape=(1,1), dtype=float, order='F')

array([[0.]])

In [12]:
np.ndarray((2,), buffer=np.array([1,2,3]),
           offset=np.int_().itemsize,
           dtype=int) # offset = 1*itemsize, i.e. skip first element

array([2, 3])

In [13]:
data = [1, 2, 3, 10]
array = np.array(data)
array

array([ 1,  2,  3, 10])

In [14]:
data2 = [[1, 2, 3], [4, 5, 6]]
array2 = np.array(data2)
array2

array([[1, 2, 3],
       [4, 5, 6]])

In [15]:
array2.ndim

2

In [16]:
array2.shape

(2, 3)

In [17]:
print(X)
print(y)
np.insert(X, 2, y, axis=1)

[[0 1]
 [2 3]
 [4 5]
 [6 7]
 [8 9]]
range(0, 5)


array([[0, 1, 0],
       [2, 3, 1],
       [4, 5, 2],
       [6, 7, 3],
       [8, 9, 4]])

In [18]:
y = np.reshape(y, [5, 1])
y

array([[0],
       [1],
       [2],
       [3],
       [4]])

In [19]:
Xy = np.hstack((X, y))
Xy

array([[0, 1, 0],
       [2, 3, 1],
       [4, 5, 2],
       [6, 7, 3],
       [8, 9, 4]])

In [20]:
Xy = np.concatenate((X, y), axis=1)
Xy

array([[0, 1, 0],
       [2, 3, 1],
       [4, 5, 2],
       [6, 7, 3],
       [8, 9, 4]])

In [21]:
np.random.shuffle(Xy)
Xy

array([[6, 7, 3],
       [8, 9, 4],
       [0, 1, 0],
       [2, 3, 1],
       [4, 5, 2]])

In [22]:
Xy.shape[1]-1

2

In [23]:
X, y = np.hsplit(Xy, [2])

In [24]:
print(X)
print(y)

[[6 7]
 [8 9]
 [0 1]
 [2 3]
 [4 5]]
[[3]
 [4]
 [0]
 [1]
 [2]]


In [25]:
len(X)

5

In [26]:
X_train, X_test = np.vsplit(X, [int(len(X)*0.8)])
print(X_train)
print(X_test)

[[6 7]
 [8 9]
 [0 1]
 [2 3]]
[[4 5]]


In [27]:
y_train, y_test = np.vsplit(y, [4])
print(y_train)
print(y_test)

[[3]
 [4]
 [0]
 [1]]
[[2]]


In [28]:
from ml_scratch.utils.split import train_test_split

In [29]:
X_train, X_test, y_train, y_test = train_test_split(X, y, train_size=0.8)

In [34]:
X_train, y_train, X_test, y_test

(array([[2, 3],
        [4, 5],
        [8, 9],
        [0, 1]]), array([[1],
        [2],
        [4],
        [0]]), array([[6, 7]]), array([[3]]))

### scikit-learn の当該メソッドを実行する
同一の仕様になるように実装するため、確認用

In [35]:
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(
    X, y, train_size=0.8)
X_train, y_train, X_test, y_test

(array([[6, 7],
        [2, 3],
        [8, 9],
        [0, 1]]), array([[3],
        [1],
        [4],
        [0]]), array([[4, 5]]), array([[2]]))

In [32]:
train_test_split(y, shuffle=False)

[array([[3],
        [4],
        [0]]), array([[1],
        [2]])]