# 行列演算の基礎

$
\boldsymbol{w} = (\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\boldsymbol{X}^{T}\boldsymbol{y}
$

$$
\boldsymbol{w} = (\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\boldsymbol{X}^{T}\boldsymbol{y}
$$

- 上記の仕組みを知らなくても、プログラムは組めるが、、、、
- 現状では、うまく行かないときに原理を含め、深く知っておかないとうまく対処できないようなプロジェクトがたくさんある
- そのためにも、深く知る必要はないが数学は必要

- 数年経つと、機械学習の仕組みを機械学習で考えるようなことが起きると数学の仕組みは必要なくなるかもしれない。
- ここ数年の間は、データ解析に携わる上で数学は必要（多分これからも必要）

- ベクトルの定義
- 行列の定義
- 転置の計算方法
- 逆行列の計算方法
- 行列積の計算

In [5]:
import numpy as np

In [7]:
# ベクトルの定義 np.array([[],[],[]])の形で書く
x = np.array([[1],[2],[3]])
x

array([[1],
       [2],
       [3]])

In [10]:
# Printするとフォーマット直る
print(x)

[[1]
 [2]
 [3]]


In [15]:
# 行列の定義
X = np.array([[1,2],[3,4]])
print(X)

[[1 2]
 [3 4]]


In [25]:
# 転置の定義 2つやり方がある
Xt = X.T
print(Xt)
Xt = np.transpose(X)
print(Xt)

[[1 3]
 [2 4]]
[[1 3]
 [2 4]]


In [28]:
# 逆行列
# linear algebra:線形代数
X_inv = np.linalg.inv(X)
print(X_inv)

[[-2.   1. ]
 [ 1.5 -0.5]]


In [34]:
# 行列積
# もともとの行列✕逆行列で単位行列

XX_inv = np.dot(X,X_inv)
print(XX_inv)

# 数値誤差はあるけど、[[1,0],[0,1]]

[[1.0000000e+00 0.0000000e+00]
 [8.8817842e-16 1.0000000e+00]]


# よくある間違い（Numpy）

In [39]:
# ベクトル表記の間違い
# 二重括弧ではなく、一重括弧でも表記できる
x = np.array([1,2,3])
x

array([1, 2, 3])

In [43]:
# 一重括弧で表記すると、、、、
# 転置をしても、縦と横が入れ替わらない。。
x.T

array([1, 2, 3])

In [47]:
# 二重で囲ってあげる！そしたら、転置できる！
x = np.array([[1,2,3]])
x

array([[1, 2, 3]])

In [49]:
x.T

array([[1],
       [2],
       [3]])

In [51]:
# なので、二重括弧で囲ってあげる

In [53]:
x.T.T

array([[1, 2, 3]])

In [56]:
x = np.array([[1],[2],[3]])
x

array([[1],
       [2],
       [3]])

# Numpyでよく使う処理

In [61]:
# 行と列の数が取れる
x.shape

(3, 1)

In [62]:
X.shape

(2, 2)

In [64]:
row, col = X.shape

In [65]:
row

2

In [66]:
col

2

In [67]:
X = np.array([
    [2,3,4],
    [1,2,3]
])

In [69]:
print(X)

[[2 3 4]
 [1 2 3]]


In [70]:
X.shape

(2, 3)

In [74]:
# 複数代入もたまに使う
row, col = X.shape

In [75]:
row

2

In [76]:
col

3

In [79]:
# 行列の行毎にAさんのこと、Bさんのことのように処理をかけていきたい場合
# 各行を小さなxとしておくと出力できる

for x in X:
    print(x)
    print('--')

[2 3 4]
--
[1 2 3]
--


$\boldsymbol{X} = \begin{bmatrix}
      1 & 2 & 3 \\
      1 & 2 & 5 \\
      1 & 3 & 4 \\
      1 & 5 & 9 \\
    \end{bmatrix}
    ,\ \boldsymbol{y} = \begin{bmatrix}
      1\\
      5\\
      6\\
      8\\
    \end{bmatrix}
    $の時

$
\boldsymbol{w} = (\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\boldsymbol{X}^{T}\boldsymbol{y}
$

$
・Step1:\boldsymbol{X}^{T}\boldsymbol{X}\\
・Step2:(\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\\
・Step3:\boldsymbol{X}^{T}\boldsymbol{y}\\
・Step4:\boldsymbol{w} = (\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\boldsymbol{X}^{T}\boldsymbol{y}
$

In [4]:
import numpy as np

In [5]:
X = np.array([
    [1,2,3],
    [1,2,5],
    [1,3,4],
    [1,5,9]
])
y = np.array([
    [1],
    [5],
    [6],
    [8]
])

In [101]:
X_t = X.T
X_tX = np.dot(X_t,X)
X_tX_inv = np.linalg.inv(X_tX)
X_multi = np.dot(X_tX_inv,X_t)
w = np.dot(X_multi,y)

In [106]:
w

array([[-0.14285714],
       [ 0.71428571],
       [ 0.57142857]])

In [46]:
#import
import numpy as np
# 変数の入力
X = np.array([
    [1,2,3],
    [1,2,5],
    [1,3,4],
    [1,5,9]
])
y = np.array([
    [1],
    [5],
    [6],
    [8]
])

$
\boldsymbol{w} = (\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\boldsymbol{X}^{T}\boldsymbol{y}
$

In [17]:
# 関数
def weiht(X,y):
    #import
    import numpy as np
    #detail
    X_t = X.T
    X_tX = np.dot(X_t,X)
    X_tX_inv = np.linalg.inv(X_tX)
    X_multi = np.dot(X_tX_inv,X_t)
    w = np.dot(X_multi,y)
    return w

In [18]:
# 結果の確認
weiht(X,y)

array([[-0.14285714],
       [ 0.71428571],
       [ 0.57142857]])

# 先生の回答

$
・Step1:\boldsymbol{X}^{T}\boldsymbol{X}\\
・Step2:(\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\\
・Step3:\boldsymbol{X}^{T}\boldsymbol{y}\\
・Step4:\boldsymbol{w} = (\boldsymbol{X}^{T}\boldsymbol{X})^{-1}\boldsymbol{X}^{T}\boldsymbol{y}
$

In [32]:
X = np.array([
    [1,2,3],
    [1,2,5],
    [1,3,4],
    [1,5,9]
])
print("X:\r\n",X)
y = np.array([
    [1],
    [5],
    [6],
    [8]
])
print("y:\r\n",y)

X:
 [[1 2 3]
 [1 2 5]
 [1 3 4]
 [1 5 9]]
y:
 [[1]
 [5]
 [6]
 [8]]


In [33]:
# 𝑆𝑡𝑒𝑝1:𝑋𝑇𝑋
XtX = np.dot(X.T,X)
print(XtX)

[[  4  12  21]
 [ 12  42  73]
 [ 21  73 131]]


In [37]:
# 𝑆𝑡𝑒𝑝2:(𝑋𝑇𝑋)−1
XtX_inv = np.linalg.inv(XtX)

In [41]:
# 𝑆𝑡𝑒𝑝3:𝑋𝑇𝑦
Xty = np.dot(X.T,y)

In [45]:
# 𝑆𝑡𝑒𝑝4:𝑤=(𝑋𝑇𝑋)−1𝑋𝑇𝑦
w = np.dot(XtX_inv,Xty)
w

array([[-0.14285714],
       [ 0.71428571],
       [ 0.57142857]])

In [48]:
def teacherS_weight(X,y):
    # import
    import numpy as np
    # detail
    XtX = np.dot(X.T,X)
    XtX_inv = np.linalg.inv(XtX)
    Xty = np.dot(X.T,y)
    w = np.dot(XtX_inv,Xty)
    return w

In [50]:
teacherS_weight(X,y)

array([[-0.14285714],
       [ 0.71428571],
       [ 0.57142857]])

## 実務では、毎回変数を入れてということはない！
# Scikit-learnで簡略化して書く！

# Scikit-learn

- Classification
- Regression
- Clustering
- Dimensionality reduction
- Model Selection
- Preprocessing  
に対応

実務ではこちらを使う。（ただ、少しブラックボックスなので自分で実装したほうがいいかも。。）

https://scikit-learn.org/stable/

In [52]:
import sklearn

In [56]:
# Windows 
# !pip install scikit-learn
# Mac
# !pip3 install scikit-learn
# Anacondaは元々入っている

In [59]:
# 重回帰分析のみの読み込み
from sklearn.linear_model import LinearRegression

In [73]:
# モデルの宣言
# クラスで言う、インスタンス化
# model変数に、LinearRegressionを格納してあげる
model = LinearRegression()

# もし、1を入れた場合はfit_intercept=Falseとする。デフォルトはTrueとなっている。
# model = LinearRegression(fit_intercept=False)

In [74]:
# モデルの学習←パラメータの調整
# データに基づいて、パラメータの調整
model.fit(X,y)
# 重回帰分析のパラメータの調整は完了

LinearRegression(copy_X=True, fit_intercept=True, n_jobs=None, normalize=False)

- 読み込み、宣言、パラメータの調整が三行で書ける

In [75]:
# 調整後のパラメータ
# 係数
model.coef_

array([[0.        , 0.71428571, 0.57142857]])

In [78]:
# 切片
# sklearnはうまく出来ていて、1を入れなくてもうまく切片と係数を分離してくれる。
model.intercept_
# sklearnであれば、非常に簡単に扱うことが出来る。
# 中心化等を考慮しなくても、sklearn内部で処理してくれる。
# メリットとしては、プログラムの打ち間違いが減る。（何をどうしているかがわかる。）

array([-0.14285714])

- sklearnはmodelの学習だけして終わりか？
- 機械学習は使ってなんぼの世界
- 予測値を計算する推論に持っていくのが本来の目的

In [95]:
# 予測精度（どのぐらいいい予測精度が出てるか。）← 決定係数(0~1の範囲で計算される値)
# 学習したのはいいけど、精度が悪いのはよくない
model.score(X,y)
# Scoreの中に、X,yなどの変数を入れてあげるとどのぐらいの予測精度なのかがわかる。
# 最初に0.7位あれば、完璧とは言わないが印象としては悪くない。
# うまくいってるか、いってないかの確認も直ぐにできる。

0.6923076923076923

In [101]:
# 予測値の計算
# X:
# [[1 2 3] ★　こちらの値を使用
# [1 2 5]
# [1 3 4]
# [1 5 9]]
x = np.array([X[0]])
x
# Queryと呼んだりもする。新しい値のこと例えば、「今日までのデータに対する明日からの値」
# 2次元ベクトルとして表記してあげることを忘れずに。理由は、転置ができなくなる。

array([[1, 2, 3]])

In [106]:
# [[1 2 3] ]に対して、予測値いくらかを求めることが出来る。
y_pred = model.predict(x)
# fitで学習させて、predictで予測値を計算する！
y_pred

array([[3.]])

In [104]:
# うまくいってるかどうかについては、過去のデータに対しての予測精度の計算はscoreを使ってあげる

- 勉強して、実装できるようになるのはいいこと！
- 実務では、早く組めるか。
- クライアント先に納品する際に、プログラムのミスなく組めているか？が一番大事
- 手段にこだわらず、sklearn等のライブラリを使って安全にコーディングすることをおすすめ！