# Chapter 2
## Matrices and Gaussian Elimination
선형 연립방정식을 푼다는 것은 각각의 일차방정식을 동시에 만족하는 변수들의 값을 정하는 것이다. 이 풀이 과정을 체계화 한것이 Gaussian Elimination으로 두번째 일차식에서 변수 한개를 소거하고 세번째 일차식에서는 두번째 식에서 소거된 변수 외에 또 다른 변수까지 두 변수를 소거하는 방식으로 진행하여 마지막 식에서는 변수가 한 개만 남도록 만든다. 그러면 마지막식에서 포함된 변수의 값을 읽어낼 수 있고, 직전 식에 해당 변수값을 대입하면 또 다른 변수의 값이 정해지는 방식으로 모든 변수의 값을 정할 수 있다.

## 2.1 Matrix Operations
행렬과 벡터의 곱에서 행렬간의 곱셈으로 확장한다면, 크기가 $n \times l$ 인 $A = [b_1|b_2|...|b_l] = (b_{jk})$ 가 주어졌다고 하면, 
$k$ 번째 열 $b_k$ 와 $A$의 곱은 $Ab_k = b_{1k}a_1 + b_{2k}a_2 + ... + b_{nk}a_n$ 이다.


두 행별의 $A$와 $B$의 곱 $AB$는 다음과 같이 정의된다:


$$AB = [Ab_1|Ab_2|...|Ab_l]$$


여기서 각 열 $Ab_k$는 다음과 같이 계산된다:


$$Ab_k = A \cdot b_k = b_{1k}a_1 + b_{2k}a_2 + ... + b_{nk}a_n$$


첫번째 행렬과 두번째 행렬의 열이 곱해지므로 첫번째 행렬의 열의 개수와 두번째 행렬의 행의 개수가 일치해야한다

행렬간의 곱은 결합법칙 $(AB)C = A(BC)$가 성립하고, 행렬간의 덧셈과 곱셈은 분배법칙 $A(B+C) = AB+AC$, $(B+C)D = BD+CD$가 성립한다.


In [None]:
import numpy as np

# 행렬 정의
A = np.array([[1, 2],
              [3, 4]])

B = np.array([[5, 6],
              [7, 8]])

C = np.array([[9, 10],
              [11, 12]])

# 결합법칙 (AB)C = A(BC)
print("AB:")
print(np.dot(A, B))
AB = np.dot(A, B)

print("\nABC:")
ABC = np.dot(AB, C)
for i in range(ABC.shape[0]):
    for j in range(ABC.shape[1]):
        print(f"ABC[{i},{j}] =", end=" ")
        for k in range(B.shape[0]):
            print(f"({AB[i,k]}*{C[k,j]})", end=" + " if k < B.shape[0] - 1 else "",)
        print(f"= {ABC[i,j]}")

print("\nA(BC):")
BC = np.dot(B, C)
ABC = np.dot(A, BC)
for i in range(ABC.shape[0]):
    for j in range(ABC.shape[1]):
        print(f"A(BC)[{i},{j}] =", end=" ")
        for k in range(BC.shape[0]):
            print(f"({A[i,k]}*{BC[k,j]})", end=" + " if k < BC.shape[0] - 1 else "",)
        print(f"= {ABC[i,j]}")

# 분배법칙 A(B+C) = AB+AC
print("\n(B+C):")
BC = B + C
print(BC)

print("\nA(B+C):")
ABC = np.dot(A, BC)
for i in range(ABC.shape[0]):
    for j in range(ABC.shape[1]):
        print(f"A(B+C)[{i},{j}] =", end=" ")
        for k in range(BC.shape[0]):
            print(f"({A[i,k]}*{BC[k,j]})", end=" + " if k < BC.shape[0] - 1 else "",)
        print(f"= {ABC[i,j]}")

print("\nAB + AC:")
AB = np.dot(A, B)
AC = np.dot(A, C)
print(AB + AC)


그러나 행렬간의 곱셈은 실수의 곱셈과 다르게 교환법칙이 성립하지 않는다. 

In [None]:
import numpy as np

# 행렬 정의
A = np.array([[1, 2],
              [3, 4]])

B = np.array([[5, 6],
              [7, 8]])

# AB 계산
AB = np.dot(A, B)
print("AB:")
print(AB)

# BA 계산
BA = np.dot(B, A)
print("\nBA:")
print(BA)

# AB와 BA 비교
print("\nAB == BA:", np.array_equal(AB, BA))

# 각 단계에서의 연산 과정 출력
print("\nAB:")
for i in range(AB.shape[0]):
    for j in range(AB.shape[1]):
        print(f"AB[{i},{j}] =", end=" ")
        for k in range(B.shape[0]):
            print(f"({A[i,k]}*{B[k,j]})", end=" + " if k < B.shape[0] - 1 else "",)
        print(f"= {AB[i,j]}")

print("\nBA:")
for i in range(BA.shape[0]):
    for j in range(BA.shape[1]):
        print(f"BA[{i},{j}] =", end=" ")
        for k in range(A.shape[0]):
            print(f"({B[i,k]}*{A[k,j]})", end=" + " if k < A.shape[0] - 1 else "",)
        print(f"= {BA[i,j]}")


행렬 덧셈의 항등원은 모든 원소가 0인 영행렬이고(matrix of zeros) 이며, 0으로 표시합니다. 다양한 크기의 영행렬은 0으로 표시하지만 대부분의 경우에 혼동되지 않습니다. 영행렬의 크기를 특별히 표시할 필요가 있는 경우에는 $m \times n$ 영행렬을 $0_{m,n}$으로 표시하기도 합니다.

행렬 곱셈의 항등원은 행번호와 열번호가 같은 대각원소들이 1이고, 나머지 비대각원소들은 0인 정사각행렬로서 항등행렬(identity matrix)이라고 부릅니다.


$$I = I_n = \begin{bmatrix}
1 & 0 & \cdots & 0 \\
0 & 1 & \cdots & 0 \\
\vdots & \vdots & \ddots & \vdots \\
0 & 0 & \cdots & 1 \\
\end{bmatrix}$$


대각행렬은 비대각원소가 모두 0인 행렬로, 대각원소들이 주 대각선 상에 위치합니다. 대각행렬을 $D$라고 표현하고, 만약 $i$번째 대각원소가 $d_i$이라면, 대각행렬 $D$는 다음과 같이 표현됩니다:

$$D = \begin{bmatrix} d_1 & 0 & \cdots & 0 \\ 0 & d_2 & \cdots & 0 \\ \vdots & \vdots & \ddots & \vdots \\ 0 & 0 & \cdots & d_n \\ \end{bmatrix} = diag(d_i) = diag(d_1,...,d_n)$$

여기서 $ n $은 행렬의 차원을 나타내며, $ d_i $는 $ D $의 $ i $번째 대각원소입니다.


대각행렬은 다른 행렬의 왼쪽 또는 오른쪽에 곱해지면서 scaling이라 부르는 행 또는 열에 대한 상수배 작용을 합니다. 즉, 어떤 행렬 $A$에 대해서 $AD$는 $A$의 $j$번째 열 벡터에 $d_j$를 상수배 한 것이며, $AD$는 $A$의 각 열을 $d_j$로 scaling한 행렬이 됩니다. 마찬가지로 $DA$는 $i$번째 행을 $d_i$값으로 scaling한 행렬이 됩니다.


행렬을 다룰때 행렬의 변형 한가지가 행렬의 전치(transpose)이다.

주어진 예제에서 행렬 $A$는 다음과 같습니다:

$$
A = \begin{bmatrix} 2 & 1 & 4 \\ 0 & 0 & 3 \end{bmatrix}
$$

이 행렬의 전치는 행과 열을 바꾸는 것입니다. 즉, 첫 번째 행은 첫 번째 열로, 두 번째 행은 두 번째 열로 옮기는 것입니다.

전치된 행렬은 다음과 같습니다:

$$
A^T = \begin{bmatrix} 2 & 0 \\ 1 & 0 \\ 4 & 3 \end{bmatrix}
$$

따라서 주어진 예제에서 행렬 $A$의 전치는 주어진 예와 같습니다:

$$
\begin{bmatrix} 2 & 1 & 4 \\ 0 & 0 & 3 \end{bmatrix}^T = \begin{bmatrix} 2 & 0 \\ 1 & 0 \\ 4 & 3 \end{bmatrix}
$$


이때 행렬의 전치를 벡터의 전치로 확장해보면, $a_i$가 $i$번째 원소인 $\mathbb{R}^n$ 벡터 $a$는 $n \times 1$ 행렬로 생각할 수 있으므로 $a^T$는 $[a_1, a_2, ..., a_n]$과 같이 $1 \times n$ 행렬로 정의할 수 있습니다. 이 개념을 $m \times n$ 행렬 $A$와 $\mathbb{R}^n$ 벡터 $v$의 곱에 행렬 $A$가 $1 \times n$ 행렬 $A = a^T$인 경우에 적용해보면. 그러면 $Av = a^Tv$인데 곱은 $1 \times 1$ 행렬, 즉 실수이므로 행렬 표시를 하지 않고 간단히 실수로 나타낼 수 있습니다.


$$a^T v = \sum_{i=1}^{n} a_i v_i$$


이를 $\mathbb{R}^n$ 벡터 $a$와 $v$의 표준 내적(inner product)이라고 부르는데, 나중에 벡터 공간에서 내적을 도입할 때 자세하게 공부하게 됩니다. 벡터 간의 내적을 도입하면 여러 행을 가진 행렬과 벡터가 곱해진 벡터는 각각의 행과 벡터의 곱을 내적으로 생각할 수 있습니다.


행렬의 transpose를 알고 나면 transpose에 의해 변하지 않는 행렬은 어떤 성질을 가지고 있을까 생각이 드는데 이를 대칭행렬이라고한다. 

대칭행렬의 간단한 성질 몇가지는 다음과 같다.

1. 대칭행렬은 정방행렬(square matrix)이다.
2. 대각행렬(diagonal matrix)은 모두 대칭행렬이다.
3. 임의의 행렬 $A$에 대해서, $A^T A$와 $AA^T$는 모두 대칭행렬이다.
4. $D$가 대각행렬이고 $A$가 임의의 행렬일 때, $ADA^T$와 $A^TDA$는 모두 대칭행렬이다.
