# 2.行列積


以下のような行列A、Bを考えます。

A=⎡
  ⎢
  ⎣−1　2　3
    4　−5　6
    7　8　−9⎤
           ⎥
           ⎦,B=⎢⎣0 2 1　
                 0 2− 8
                 2 9 −1⎤⎥⎦ 
 

NumPyで表すと次のようになります。

In [9]:
import numpy as np
a_ndarray = np.array([[-1, 2, 3], [4, -5, 6], [7, 8, -9]])
b_ndarray = np.array([[0, 2, 1], [0, 2, -8], [2, 9, -1]])

## 【問題1】行列積を手計算する
AとBの行列積を手計算で解いてください。

計算過程もマークダウンテキストを用いて説明してください。

AB = A * B = [ -1  2  3]   [0  2  1] 
             [  4 -5  6] * [0  2 -8]
             [  7  8 -9]   [2  9 -1]
   
AB = [-1*0+2*0+3*2  -1*2+2*2+3*9  -1*1+2*-8+3*-1]
     [4*0+(-5*0)+6*2  4*2-5*2+6*9  4*1+(-5*-8)+6*-1]
     [7*0+8*0+(-9*2)  7*2+8*2+(-9*9)  7*1+8*-8+(-9*-1)]
     
   = [6    29  -20]
     [12   52   38]
     [-18 -51  -48]

## 【問題2】NumPyの関数による計算
この行列積はNumPyのnp.matmul()やnp.dot()、または@演算子を使うことで簡単に計算できます。

これらを使い行列積を計算してください。

numpy.matmul — NumPy v1.16 Manual

numpy.dot — NumPy v1.16 Manual

《3種類の違い》

np.matmul()とnp.dot()は3次元以上の配列で挙動が変わります。@演算子はnp.matmul()と同じ働きをします。

今回のような2次元配列の行列積ではnp.matmul()や@演算子が公式に推奨されています。以下はnp.dot()の説明からの引用です。

If both a and b are 2-D arrays, it is matrix multiplication, but using matmul or a @ b is preferred.

In [3]:
np.dot(a_ndarray, b_ndarray)

array([[  6,  29, -20],
       [ 12,  52,  38],
       [-18, -51, -48]])

In [4]:
np.matmul(a_ndarray, b_ndarray)

array([[  6,  29, -20],
       [ 12,  52,  38],
       [-18, -51, -48]])

In [5]:
a_ndarray @ b_ndarray

array([[  6,  29, -20],
       [ 12,  52,  38],
       [-18, -51, -48]])

# 3.行列積のスクラッチ実装


np.matmul()やnp.dot()、または@演算子を使わずに、手計算で行った計算過程をNumPyによるスクラッチ実装で再現していきましょう。これにより、行列積の計算に対する理解を深めます。ここで考えるのは行列AとBのような次元が2の配列に限定します。

【問題3】ある要素の計算を実装
手計算をする際はまず行列Aの0行目と行列Bの0列目に注目し、以下の計算を行ったかと思います。

行列Aの(0,0)の要素 
a0,0
 と行列Bの(0,0)の要素 
b0,0
 を掛け合わせる
行列Aの(0,1)の要素 
a0,1
 と行列Bの(1,0)の要素 
b1,0
 を掛け合わせる
行列Aの(0,2)の要素 
a0,2
 と行列Bの(2,0)の要素 
b2,0 
 を掛け合わせる
それらの値を全て足し合わせる

数式で表すと

2∑k=0 a0,k　bk,0
です。

この計算をnp.matmul()やnp.dot()、または@演算子を使わずに行うコードを書いてください。


In [8]:
for k in range(3):
    AB = a_ndarray[0][k] * b_ndarray[k][0]
print(AB)

6


## 【問題4】行列積を行う関数の作成
問題3のコードを拡張し、行列積のスクラッチ実装を完成させてください。行列AとBを引数に受け取り、行列積を返す関数としてください。

行列積を計算する場合は、問題3の計算を異なる行や列に対して繰り返していくことになります。

計算結果である 
3×3
 の行列Cの各要素 
ci,j
 は数式で表すと次のようになります。

ci,j=2∑k=0 ai,kbk,j

for文を使い、ndarrayのインデックスを動かしていくことで、合計9つの要素が計算できます。インデックス 
i や j
 を1増やすと、次の行や列に移ることができます。

In [10]:
def scratch(A,B):
    
    c = np.zeros((len(A[0]), len(A)))

    for i in range(len(A[0])):
        for j in range(len(A)):
            for k in range(len(A[0])):
                c[i][j] =  c[i][j] + A[i][k] * B[k][j]
    return c
print(scratch(a_ndarray,b_ndarray))

[[  6.  29. -20.]
 [ 12.  52.  38.]
 [-18. -51. -48.]]


In [12]:
import numpy as np
def matrix_product(a,b):
    c = np.empty((a.shape[0], b.shape[1]))

    for i in range(a.shape[0]):
        for j in range(b.shape[1]):
            c[i, j] = (a[i]*b[:, j]).sum()
    return c
print(matrix_product(a_ndarray,b_ndarray))

[[  6.  29. -20.]
 [ 12.  52.  38.]
 [-18. -51. -48.]]


4.行列積が定義されない組み合わせの行列


次に以下のような例を考えます。

D=[−123
   4−56],E−=[−987
             6−54]
 
 


In [None]:
d_ndarray = np.array([[-1, 2, 3], [4, -5, 6]])
e_ndarray = np.array([[-9, 8, 7], [6, -5, 4]])

行列積DEはDの列数とEの行数が等しい場合に定義されていますから、この例では計算ができません。

【問題5】計算が定義されない入力を判定する
問題4で作成した関数は、実装方法によってはこのDとEの配列を入力しても動いてしまう可能性があります。この場合、不適切な計算が行われることになります。また、途中でエラーになる場合でも、なぜエラーになったかが直接的には分かりづらいメッセージが表示されます。

if文などによってこれを防ぎ、入力される形に問題があることをprint()を使い表示するコードを書き加えてください。

In [None]:
print(scratch(d_ndarray,e_ndarray))

In [None]:
def scratch_if(A,B):
    
    c = np.zeros((len(A[0]), len(A)))
    if len(A) == len(A[0]):
        for i in range(len(A[0])):
            for j in range(len(A)):
                for k in range(len(A[0])):
                    c[i][j] =  c[i][j] + A[i][k] * B[k][j]
        return c
    else:
        print("入力される形式に問題があります。")
print(scratch_if(d_ndarray,e_ndarray))
print(scratch_if(a_ndarray,b_ndarray))

## 【問題6】転置
片方の行列を転置することで、行列積が計算できるようになります。

np.transpose()や.Tアトリビュートを用いて転置し、行列積を計算してください。

numpy.transpose — NumPy v1.16 Manual

numpy.ndarray.T — NumPy v1.16 Manual

In [None]:
print(np.transpose(a_ndarray) @ b_ndarray)
print(a_ndarray.T @ b_ndarray)
print(a_ndarray.T.T @ b_ndarray.T.T)