# 8. 선형대수 기초

## 주요 내용

- 벡터

- 행렬

## 개요

앞으로 배울 `numpy.array` 자료형이 제공하는 다양한 기능의 이해에 도움을 주는 내용

## 8.1. 벡터

- 벡터와 차원

- 리스트와 벡터

- 벡터 항목별 연산

- 벡터 내적과 크기

### 벡터와 차원

- 벡터: 유한 개의 값으로 구성

- 차원<font size='2'>dimension</font>: 항목의 개수

- 벡터 예제:

    * 2차원 평면 공간에서 방향과 크기를 표현하는 2차원 벡터: 

            [x, y]

    * 사람들의 키, 몸무게, 나이로 이루어진 3차원 벡터: 

            [키, 몸무게, 나이]

    * 네 번의 시험 점수로 이루어진 4차원 벡터: 

            [1차점수, 2차점수, 3차점수, 4차점수]

### 리스트와 벡터

- 벡터를 리스트로 구현 가능
- x축, y축 좌표로 구성된 2차원 벡터

In [6]:
# [x좌표, y좌표]

twoDVector1 = [3, 1]
twoDVector2 = [-2, 5]

- 키, 몸무게, 나이로 구성된 3차원 벡터

In [7]:
# [키, 몸무게, 나이]

height_weight_age1 = [70, 170, 50]
height_weight_age2 = [66, 163, 50]

- 1차부터 4차까지의 시험 점수로 구성된 4차원 벡터

In [8]:
# [1차점수, 2차점수, 3차점수, 4차점수]

grades1 = [95, 80, 75, 62]
grades2 = [85, 82, 79, 82]

### 벡터 항목별 연산

- 벡터 항목별 사칙연산

- 벡터 스칼라 곱셈

- 항목별 평균 벡터

### 벡터 항목별 덧셈

동일 차원의 두 벡터의 항목별 덧셈

$$
[u_1, \cdots, u_n] + [v_1, \cdots, v_n] = [u_1 + v_1, \cdots, u_n + v_n]
$$

In [18]:
def addV(u, v):
    assert len(u) == len(v)   # 두 벡터의 길이가 같은 경우만 취급

    return [u_i + v_i for u_i, v_i in zip(u, v)]

In [19]:
addV([95, 80, 75, 62], [85, 82, 79, 82])

[180, 162, 154, 144]

### 벡터 리스트의 합

동일한 차원의 임의의 개수의 벡터를 항목별로 더하는 함수

In [11]:
def vector_sum(vectors):
    """
    vectors: 동일한 차원의 벡터들의 리스트
    반환값: 각 항목의 합으로 이루어진 동일한 차원의 벡터
    """
    
    # 입력값 확인
    assert len(vectors) > 0          # 1개 이상의 벡터가 주어져야 함
    num_elements = len(vectors[0])   # 벡터 개수
    assert all(len(v) == num_elements for v in vectors)   # 모든 벡터의 크기가 같아야 함

    # 동일한 위치의 항목을 모두 더한 값들로 이루어진 벡터 반환
    return [sum(vector[i] for vector in vectors) for i in range(num_elements)]

In [12]:
vector_sum([[1, 2], [3, 4], [5, 6], [7, 8]])

[16, 20]

### 벡터 항목별 뺄셈

동일 차원의 벡터 두 개의 항목별 뺄셈

$$
[u_1, \cdots, u_n] - [v_1, \cdots, v_n] = [u_1 - v_1, \cdots, u_n - v_n]
$$

In [16]:
def subtractV(v, w):
    assert len(v) == len(w)   # 두 벡터의 길이가 같은 경우만 취급

    return [v_i - w_i for v_i, w_i in zip(v, w)]

In [17]:
subtractV([3, 1], [-2, 5])

[5, -4]

### 벡터 항목별 곱셈

동일 차원의 벡터 두 개의 항목별 곱셈

$$
[u_1, \cdots, u_n] \cdot [v_1, \cdots, v_n] = [u_1 \cdot v_1, \cdots, u_n \cdot v_n]
$$

In [21]:
def multiplyV(v, w):
    assert len(v) == len(w)   # 두 벡터의 길이가 같은 경우만 취급

    return [v_i * w_i for v_i, w_i in zip(v, w)]

In [23]:
multiplyV([3, 1], [-2, 5])

[-6, 5]

### 벡터 항목별 나눗셈

동일 차원의 벡터 두 개의 항목별 나눗셈

$$
[u_1, \cdots, u_n] / [v_1, \cdots, v_n] = [u_1 / v_1, \cdots, u_n / v_n]
$$

In [24]:
def divideV(v, w):
    assert len(v) == len(w)   # 두 벡터의 길이가 같은 경우만 취급

    return [v_i / w_i for v_i, w_i in zip(v, w)]

In [25]:
divideV([95, 80, 75, 62], [85, 82, 79, 82])

[1.1176470588235294, 0.975609756097561, 0.9493670886075949, 0.7560975609756098]

### 벡터 스칼라 곱셈

스칼라 곱셈은 벡터의 각 항목을 지정된 수로 곱하기

$$
c \cdot [u_1, \cdots, u_n] = [c\cdot u_1, \cdots, c\cdot u_n]
$$

In [26]:
def scalar_multiplyV(c, v):
    return [c * v_i for v_i in v]

In [27]:
scalar_multiplyV(2, [1, 2, 3])

[2, 4, 6]

### 항목별 평균 벡터

여러 개의 동일 차원 벡터가 주어졌을 때 항목별 평균 구하기

$$
\frac 1 3 \cdot (\, [1, 2] + [2, 1] + [2, 3]\, ) 
=  \frac 1 3 \cdot [1+2+2, 2+1+3]
= [5/3, 2]
$$

In [28]:
def meanV(vectors):
    n = len(vectors)
    
    return scalar_multiplyV(1/n, vector_sum(vectors))

In [31]:
meanV([[3, 2, 6], [2, 5, 9], [7, 5, 1], [6, 3, 4]])

[4.5, 3.75, 5.0]

### 벡터 내적

동일 차원의 벡터 두 개의 내적: 위치에 있는 항목끼기 곱한 후 모두 더한 값

$$
[u_1, \cdots, u_n] \cdot [v_1, \cdots, v_n]
= \sum_{i=1}^n u_i\cdot v_i 
= u_1\cdot v_1 + \cdots + u_n\cdot v_n
$$

In [32]:
def dotV(v, w):
    assert len(v) == len(w), "벡터들의 길이가 동일해야 함"""

    return sum(v_i * w_i for v_i, w_i in zip(v, w))

In [33]:
dotV([1, 2, 3], [4, 5, 6])

32

### 벡터 크기

벡터 $v = [v_1, \cdots, v_n]$의 크기: $v$ 자신과의 내적의 제곱근

$$\| v\| = \sqrt{v \cdot v} = \sqrt{v_1^2 + \cdots + v_n^2}$$

$$\|\, [3, 4] \, \|  = \sqrt{3^2 + 4^2} = \sqrt{5^2} = 5$$

In [35]:
import math

def norm(v):
    sum_of_squares = dotV(v, v)
    return math.sqrt(sum_of_squares)

In [36]:
norm([3, 4])

5.0

## 8.2. 행렬

- 행렬의 모양

- 행벡터와 열벡터

- 행렬 항목별 연산

- 행렬 곱셈

- 전치 행렬

### 행렬의 정의

- 행렬<font size='2'>matrix</font>: 숫자를 행과 열로 구성된 직사각형 모양으로 나열한 것

- $n \times k$ 행렬: $n$ 개의 행과 $k$ 개의 열로 구성된 행렬

- 리스트의 리스트, 즉 2중 리스트로 구현 가능

In [39]:
# 2x3 행렬

A = [[1, 2, 3],
     [4, 5, 6]]

In [40]:
# 3x2 행렬

B = [[1, 2],
     [3, 4],
     [5, 6]]

### 행렬의 모양

- $n \times k$ 행렬의 모양<font size='2'>shape</font>: $(n,k)$

- 예제: $1, 2, 3, 4, 5, 6$ 여섯 개의 항목을 가진 행렬의 모양은 네 종류

* (1, 6) 모양의 행렬: 한 개의 행과 여섯 개의 열

$$
\begin{bmatrix}
    1 & 2 & 3 & 4 & 5 & 6
\end{bmatrix}
$$

* (2, 3) 모양의 행렬: 두 개의 행과 세 개의 열

$$
\begin{bmatrix}
    1 & 2 & 3\\
    4 & 5 & 6
\end{bmatrix}
$$

* (3, 2) 모양의 행렬: 세 개의 행과 두 개의 열

$$
\begin{bmatrix}
    1 & 2 \\
    3 & 4 \\
    5 & 6
\end{bmatrix}
$$

* (6, 1) 모양의 행렬: 여섯 개의 행과 한 개의 열

$$
\begin{bmatrix}
    1 \\
    2 \\
    3 \\
    4 \\
    5 \\
    6
\end{bmatrix}
$$

### `shape()` 함수

`shape()` 함수: 주어진 행렬의 모양을 튜플로 반환

In [37]:
def shape(M):
    """
    M: 행렬
    M[i]의 길이가 일정하다고 가정
    """

    num_rows = len(M)    # 행의 수
    num_cols = len(M[0]) # 열의 수
    return num_rows, num_cols

In [41]:
shape(A)

(2, 3)

### 행과 열의 인덱스

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/datapy/master/jupyter-book/images/Matrix_row-column.jpg" width="50%"></div>
<br>

### 행벡터와 열벡터

지정된 인덱스의 행과 지정된 인덱스의 열의 항목들로 구성된 행벡터와 열벡터 생성

In [42]:
# i번 행벡터
def get_row(M, i):
    """
    M: 행렬
    i: 행 인덱스
    """

    return M[i]             

In [43]:
# j번 열벡터
def get_column(M, j):
    """
    M: 행렬
    j: 열 인덱스
    """

    return [M_i[j] for M_i in M]

### 예제:

In [44]:
get_row(A, 0)

[1, 2, 3]

In [34]:
get_column(B, 1)

[2, 4, 6]

### $i$ 행, $j$ 열의 항목

$M_{i, j}$: 행렬 $M$의 $i$ 행, $j$ 열의 항목

### 행렬 초기화

`make_matrix(n, m, entry_fn)` 함수: 

* 인자
    * `n`: 행의 수
    * `m`: 열의 수
    * `entry_fn`: i, j가 주어지면 i행, j열에 위치한 항목 계산
* 반환값: 지정된 방식으로 계산된 (i, j) 모양의 행렬

In [50]:
def make_matrix(n, m, entry_fn):
    """
    n: 행의 수
    m: 열의 수
    entry_fn: (i, j)에 대해 i행, j열에 위치한 항목 계산
    """
    
    return [ [entry_fn(i, j) for j in range(m)] for i in range(n) ]   

### zeros() 함수

0-행렬 생성

In [51]:
def zeros(x):
    """
    x = (n, m), 단 n, m은 양의 정수
    """

    n = x[0]
    m = x[1]
    zero_function = lambda i, j: 0
    
    return make_matrix(n, m, zero_function)

In [52]:
zeros((5,7))

[[0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0],
 [0, 0, 0, 0, 0, 0, 0]]

### 1-행렬

1-행렬 생성

In [53]:
def ones(x):
    """
    x = (n, m), 단 n, m은 양의 정수
    """

    n = x[0]
    m = x[1]
    one_function = lambda i, j: 1
    
    return make_matrix(n, m, one_function)

In [54]:
ones((5,7))

[[1, 1, 1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1, 1, 1],
 [1, 1, 1, 1, 1, 1, 1]]

### 임의 행렬

In [55]:
import random

def rand(n, m):
    """
    n, m: 양의 정수
    """

    random_function = lambda i, j: random.random()

    return make_matrix(n, m, random_function)

In [56]:
rand(5,3)

[[0.7785124269962806, 0.2502329538122102, 0.517437326651624],
 [0.9274472254460542, 0.3366911055805132, 0.13769945531770866],
 [0.3769147350776969, 0.2678658586201269, 0.31656053785417515],
 [0.4861505569833615, 0.018926237583103855, 0.8171154617648885],
 [0.46108595185326084, 0.22821959852480445, 0.3155761685255021]]

### round() 함수 활용

In [58]:
def rand(n, m, ndigits=2):
    """
    n, m: 양의 정수
    """

    random_function = lambda i, j: round(random.random(), ndigits)  # ndigits: 소수점 이하 자릿수

    return make_matrix(n, m, random_function)

In [59]:
rand(5, 3)

[[0.16, 0.24, 0.39],
 [0.31, 0.73, 0.92],
 [0.42, 0.9, 0.78],
 [0.43, 0.41, 0.99],
 [0.51, 0.91, 0.94]]

In [60]:
rand(5, 3, 5)

[[0.87043, 0.16993, 0.9071],
 [0.79143, 0.10331, 0.83044],
 [0.19171, 0.28929, 0.07156],
 [0.72237, 0.61312, 0.78875],
 [0.98236, 0.21361, 0.38649]]

### 항등행렬

$$
\begin{bmatrix}
    1&0&0&0&0 \\
    0&1&0&0&0 \\
    0&0&1&0&0 \\
    0&0&0&1&0 \\
    0&0&0&0&1
\end{bmatrix}
$$

In [61]:
def identity(n):
    """
    n: 양의 정수
    """
    one_function = lambda i, j: 1 if i == j else 0
    
    return make_matrix(n, n, one_function)

In [62]:
identity(5)

[[1, 0, 0, 0, 0],
 [0, 1, 0, 0, 0],
 [0, 0, 1, 0, 0],
 [0, 0, 0, 1, 0],
 [0, 0, 0, 0, 1]]

### 행렬 항목별 연산

- 행렬 항목별 사칙연산

- 행렬 스칼라 곱셈

### 행렬 항목별 덧셈

$$
\begin{align*}
\begin{bmatrix}1&3&7\\1&0&0\end{bmatrix} 
+ \begin{bmatrix}0&0&5\\7&5&0\end{bmatrix}
&= \begin{bmatrix}1+0&3+0&7+5\\1+7&0+5&0+0\end{bmatrix} \\[.5ex]
&= \begin{bmatrix}1&3&12\\8&5&0\end{bmatrix}
\end{align*}
$$

In [63]:
def addM(A, B):
    assert shape(A) == shape(B)
    
    m, n = shape(A)
    
    return make_matrix(m, n, lambda i, j: A[i][j] + B[i][j])

In [64]:
C = [[1, 3, 7],
     [1, 0, 0]]

D = [[0, 0, 5], 
     [7, 5, 0]]

In [65]:
addM(C, D)

[[1, 3, 12], [8, 5, 0]]

### 행렬 항목별 뺄셈

$$
\begin{align*}
\begin{bmatrix}1&3&7\\1&0&0\end{bmatrix} 
- \begin{bmatrix}0&0&5\\7&5&0\end{bmatrix}
&= \begin{bmatrix}1-0&3-0&7-5\\1-7&0-5&0-0\end{bmatrix} \\[.5ex]
&= \begin{bmatrix}1&3&2\\-6&-5&0\end{bmatrix}
\end{align*}
$$

In [66]:
def subtractM(A, B):
    assert shape(A) == shape(B)
    
    m, n = shape(A)
    
    return make_matrix(m, n, lambda i, j: A[i][j] - B[i][j])

In [67]:
subtractM(C, D)

[[1, 3, 2], [-6, -5, 0]]

### 행렬 스칼라 곱셈

$$
2\cdot 
\begin{bmatrix}1&8&-3\\4&-2&5\end{bmatrix}
= \begin{bmatrix}2\cdot 1&2\cdot 8&2\cdot -3\\2\cdot 4&2\cdot -2&2\cdot 5\end{bmatrix}
= \begin{bmatrix}2&16&-6\\8&-4&10\end{bmatrix}
$$

In [68]:
def scalar_multiplyM(c, M):
    return [[c * row_i for row_i in row] for row in M]

In [69]:
scalar_multiplyM(2, C)

[[2, 6, 14], [2, 0, 0]]

### 행렬 곱셈

($m$, $n$) 모양의 $A$와 ($n$, $p$) 모양의 행렬 $B$의 곱 $A \cdot B$는 ($m$, $p$) 모양의 행렬이며,
$i$ 행, $j$ 열의 항목 $(A \cdot B)_{i,j}$는 다음과 같이 정의된다.

$$
(A \cdot B)_{i, j}
= A_{i,0} \cdot B_{0,j} + A_{i,1} \cdot B_{1,j} + \cdots + A_{i,(n-1)} \cdot B_{(n-1),j}
$$

아래 그림으로 (4, 2) 모양의 행렬 $A$와 (2, 3) 모양의 행렬 $B$의 점곱인 $A\cdot B$의 항목을 계산하는 과정을 보여준다.

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/datapy/master/jupyter-book/images/Matrix_mult_diagram.jpg" width="50%"></div>

출처: [위키백과](https://en.wikipedia.org/wiki/Dot_product)

예를 들어 $2 \times 3$ 행렬과 $3 \times 2$ 행렬의 곱셈은 다음과 같다.

$$
\begin{align*}
\begin{bmatrix}
    1&0&2\\-1&3&1
\end{bmatrix}
\cdot
\begin{bmatrix}
    3&1\\2&1\\1&0
\end{bmatrix}
&=
\begin{bmatrix}
    (1\cdot 3+0\cdot 2+2\cdot 1)&(1\cdot 1+0\cdot 1+2\cdot 0)\\(-1\cdot 3+3\cdot 2+1\cdot 1)&(-1\cdot 1+3\cdot 1+1\cdot 0)
\end{bmatrix} \\[.5ex]
&= 
\begin{bmatrix}
    5&1\\4&2
\end{bmatrix}
\end{align*}
$$

행렬의 곱셈을 계산하는 함수는 다음과 같다.
2중 리스트 조건제시법을 사용하면 간단하게 구현할 수 있다.

- `A`: (m, n) 모양의 행렬(2중 리스트)
- `B` 가 (n, p) 모양의 행렬(2중 리스트)
    - `*B`: 리스트 풀어헤치기의 결과. 차원이 p인 리스트 n개.
    - `zip(*B)`: 차원이 n인 열벡터 p개.

In [60]:
def matmul(A, B):
    """
    A: (m, n) 모양의 행렬(2중 리스트)
    B: (n, p) 모양의 행렬(2중 리스트)
    """

    mat_mul = [[sum(a*b for a,b in zip(A_row, B_col)) for B_col in zip(*B)] for A_row in A]
    return mat_mul


In [61]:
# 3x2 행렬
A = [[2, 7],
     [4, 5],
     [7, 8]]

# 2x4 행렬
B = [[5, 8, 1, 2],
     [4, 5, 9, 1]]

In [62]:
matmul(A, B)

[[38, 51, 65, 11], [40, 57, 49, 13], [67, 96, 79, 22]]

행렬 곱셈의 항등원

임의의 행렬 $M$과 항등행렬과의 곱은 $M$ 자신이다. 
즉 항등행렬은 행렬 곱셈의 항등원이다.

$$
\begin{bmatrix}
    3&1 \\
    2&1 \\
    1&0
\end{bmatrix}
\cdot
\begin{bmatrix}
    1&0 \\ 
    0&1
\end{bmatrix}
=
\begin{bmatrix}
    (3\cdot 1+1\cdot 0)&(3\cdot 0+1\cdot 1) \\
    (2\cdot 1+1\cdot 0)&(2\cdot 0+1\cdot 1) \\
    (1\cdot 1+0\cdot 0)&(1\cdot 0+0\cdot 1) \\
\end{bmatrix}
= 
\begin{bmatrix}
    3&1\\
    2&1\\
    1&0
\end{bmatrix}
$$

In [63]:
# 3x2 행렬
M = [[3, 1],
     [2, 1],
     [1, 0]]

matmul(M, identity(2)) == M

True

### 전치행렬

행렬의 전치란 행과 열을 바꾸는 것으로, 행렬 $A$의 전치는 $A^T$로 표기한다. 
즉, $A$가 ($m$, $n$) 모양의 행렬이면 $A^T$는 ($n$, $m$) 모양의 행렬이다.
$A^T$의 $i$행의 $j$열번째 값은 $A$의 $j$행의 $i$열번째 값이다. 
즉 다음이 성립한다.

$$
A ^{T}_{i,j} = A_{j,i}
$$

예를 들어, 다음은 (2, 3) 모양의 행렬의 전치가 (3, 2) 모양의 행렬이 됨을 잘 보여준다.

$$
\begin{bmatrix}
    9&8&7\\
    -1&3&4
\end{bmatrix}^{T}
=
\begin{bmatrix}
    9&-1\\
    8&3\\
    7&4
\end{bmatrix}
$$

전치 행렬을 계산하는 함수는 다음과 같다.

In [64]:
def transpose(M):
    """
    M: (m, n) 모양의 행렬
    """

    return [list(col) for col in zip(*M)]

In [65]:
X = [[9, 8, 7],
     [-1, 3, 4]]

In [66]:
transpose(X)

[[9, -1], [8, 3], [7, 4]]

전치행렬의 성질

$a$를 스칼라, $A$와 $B$를 크기가 같은 행렬이라 하자. 이때 다음이 성립한다.

* $(A^T)^T = A$
* $(A + B)^T = A^T + B^T$
* $(A - B)^T = A^T - B^T$
* $(a\cdot A)^T = a\cdot A^T$
* $(A\cdot B)^T = B^T \cdot A^T$

In [67]:
A

[[2, 7], [4, 5], [7, 8]]

In [68]:
B

[[5, 8, 1, 2], [4, 5, 9, 1]]

In [69]:
transpose(transpose(A)) == A

True

In [70]:
C

[[1, 3, 7], [1, 0, 0]]

In [71]:
D

[[0, 0, 5], [7, 5, 0]]

In [72]:
transpose(addM(C, D)) == addM(transpose(C), transpose(D))

True

In [73]:
transpose(subtractM(C, D)) == subtractM(transpose(C), transpose(D))

True

In [74]:
transpose(scalar_multiplyM(2, A)) == scalar_multiplyM(2, transpose(A))

True

In [75]:
transpose(matmul(A, B)) == matmul(transpose(B), transpose(A))

True

## 연습문제

참고: [(실습) 선형대수 기초](https://colab.research.google.com/github/codingalzi/datapy/blob/master/practices/practice-from_scratch_1.ipynb)