In [1]:
# https://docs.scipy.org/doc/numpy-1.15.1/reference/generated/numpy.linalg.norm.html
# インストールする
import numpy as np
from numpy import linalg as LA

In [2]:
# 等差数列を正負ばらつきが出るように生成する
# https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.arange.html
a = np.arange(9) - 4

In [3]:
# 内容確認
a

array([-4, -3, -2, -1,  0,  1,  2,  3,  4])

In [4]:
# 3次元の行列に変形させる
b = a.reshape((3, 3))

In [5]:
# 内容確認
b

array([[-4, -3, -2],
       [-1,  0,  1],
       [ 2,  3,  4]])

In [6]:
# https://docs.scipy.org/doc/numpy-1.14.0/reference/generated/numpy.linalg.norm.html
# ordパラメータの値に応じて、8つの異なる手法で行列の距離を算出できる関数で距離計算する
LA.norm(a)

7.745966692414834

In [7]:
# 行列にも使える
LA.norm(b)

7.745966692414834

In [8]:
# フロベニウスノルム法の場合
LA.norm(b, 'fro')

7.745966692414834

In [31]:
# 行方向での数の絶対値の合計の最大値
LA.norm(a, np.inf)

4.0

In [10]:
# 行方向での数の絶対値の合計の最大値
LA.norm(b, np.inf)

9.0

In [11]:
# 行方向での数の絶対値の合計の最小値
LA.norm(a, -np.inf)

0.0

In [12]:
# 行方向での数の絶対値の合計の最小値
LA.norm(b, -np.inf)

2.0

In [13]:
# 列方向での数の絶対値の合計の最大値
LA.norm(a, 1)

20.0

In [14]:
# 列方向での数の絶対値の合計の最大値
LA.norm(b, 1)

7.0

In [32]:
# 列方向での数の絶対値の合計の最小値
LA.norm(a, -1)

0.0

In [16]:
# 列方向での数の絶対値の合計の最小値
LA.norm(b, -1)

6.0

In [17]:
LA.norm(a, 2)

7.745966692414834

In [18]:
LA.norm(b, 2)

7.3484692283495345

In [19]:
LA.norm(a, -2)

  absx **= ord


0.0

In [20]:
# 最小特異値
LA.norm(b, -2)

4.351066026358965e-18

In [21]:
# sum(abs(x)**3)**(1./3)
LA.norm(a, 3)

5.848035476425731

In [22]:
# sum(abs(x)**-3)**(1./-3)
LA.norm(a, -3)

0.0

In [23]:
# 行列を定義
c = np.array([[ 1, 2, 3],
                        [-1, 1, 4]])

In [24]:
# 内容確認
c

array([[ 1,  2,  3],
       [-1,  1,  4]])

In [25]:
# 列方向に距離計算
LA.norm(c, axis=0)

array([1.41421356, 2.23606798, 5.        ])

In [26]:
# 行方向に距離計算
LA.norm(c, axis=1)

array([3.74165739, 4.24264069])

In [27]:
# 行方向での絶対値の合計のベクトル
LA.norm(c, ord=1, axis=1)

array([6., 6.])

In [28]:
# 等差配列を生成して3軸の行列へ
m = np.arange(8).reshape(2,2,2)

In [33]:
# 内容確認
m

array([[[0, 1],
        [2, 3]],

       [[4, 5],
        [6, 7]]])

In [29]:
# 行と奥行き方向へ距離計算
LA.norm(m, axis=(1,2))

array([ 3.74165739, 11.22497216])

In [34]:
m[0, :, :]

array([[0, 1],
       [2, 3]])

In [35]:
m[1, :, :]

array([[4, 5],
       [6, 7]])

In [30]:
# 一行目と二行目のそれぞれの距離を算出
LA.norm(m[0, :, :]), LA.norm(m[1, :, :])

(3.7416573867739413, 11.224972160321824)

In [1]:
# クラスタリングサンプルプログラム
from sklearn.cluster import KMeans
import numpy as np

In [2]:
# クラスタリング対象データセットを生成する
X = np.array([[1, 2], [1, 4], [1, 0],
              [4, 2], [4, 4], [4, 0]])

In [3]:
# 6行2列の行列
X

array([[1, 2],
       [1, 4],
       [1, 0],
       [4, 2],
       [4, 4],
       [4, 0]])

In [4]:
# K-meansモデルを生成して、チェインで学習実行
kmeans = KMeans(n_clusters=2, random_state=0).fit(X)

In [5]:
# ラベルの確認
kmeans.labels_

array([0, 0, 0, 1, 1, 1], dtype=int32)

In [6]:
# 学習済みモデルで予測
kmeans.predict([[0, 0], [4, 4]])

array([0, 1], dtype=int32)

In [7]:
# クラスター中心の座標を表示
kmeans.cluster_centers_

array([[1., 2.],
       [4., 2.]])