# Chapter 9. 내적

## 9.1 내적의 개념

### 9.1.1 내적 공간

### 9.1.2 내적의 정의

내적을 구하려는 각 벡터의 동일한 위치에 있는 원소를 서로 곱한 후 더함  
두 열 벡터 중 하나의 벡터를 전치시켜 행 벡터로 변환 후 나머지 벡터와 벡터 곱을 하면 내적 값  

### 9.1.3 내적의 성질

* 내적 = 0이면, 두 벡터 사이의 각도 = 90
* 벡터의 길이 = **norm**

### 9.1.4 정사영

한 벡터 공간에 속한 벡터를 부분 공간으로 수직으로 투영하는 것  
벡터 u와 벡터 v의 내적이란 벡터 u를 벡터 v에 정사영시킨 벡터의 길이와 같다.  
$$<\mathbf{u}, \mathbf{v}> = ||\mathbf{u}||\,||\mathbf{v}||\cos\theta$$

## 9.2 직교 공간과 정규 직교 공간

### 9.2.1 직교 공간

### 9.2.2 정규 직교 공간

직교 공간에 존재하는 직교 벡터의 길이가 모두 1인 경우, 해당 벡터를 **정규 직교 벡터**  
정규 직교 벡터가 만드는 공간을 **정규 직교 공간**  
정규 직교 벡터로 바꾸는 방법은 해당 벡터의 길이로 나누는 것: **정규화**  

### 9.2.3 정규 직교 벡터를 활용한 좌표 표현

### 9.2.4 직교 벡터를 활용한 좌표 표현

## 9.3 그램 슈미트 과정

### 9.3.3 그램 슈미트 과정

기저 벡터를 직교 기저 벡터로 변환하는 과정: 모든 벡터가 서로 직교하게끔 만들어야 한다.  

1) 새로운 직교 기저 벡터를 정의하는 단계 - 기존 첫번째 기저 벡터로 정의
2) 기존 두 번째 기저 벡터를 기저 벡터가 생성하는 공간에 정사영
3) 앞서 생성한 벡터들과 직교해야 함

## 9.4 QR 분해

### 9.4.1 기본적인 QR 분해 방법

$\mathbf{A}$ 행렬이 $n\times p$ 행렬이고 *full rank*라고 가정 = 모두 **선형 독립**  
해당 행렬이 공간의 기저가 될 수 있음  
이 때 $\mathbf{A}$ 행렬은 $\mathbf{QR}$로 분해 가능  
$\mathbf{Q}$는 $n\times p$행렬이고 **정규 직교** 벡터로 구성  
$\mathbf{R}$은 **가역 상 삼각행렬**로 역행렬이 존재하는 상삼각행렬임  
이를 이용해 큰 행렬의 고유값을 구하는 데 사용  

### 9.4.2 그램 슈미트 과정을 이용한 QR분해

### 9.4.3 하우스홀더 방법을 이용한 QR분해

## 9.5 파이썬 실습

In [1]:
# 9.5.1 기본 내적 실습
a = [1, 2, 3]
b = [4, 5, 6]
n = len(a)
res = 0
for i in range(0, n):
    res += a[i] * b[i]
print(res)

32


In [2]:
# 위의 결과로 함수만들기
def inner_product(a, b):
    """
    벡터의 내적
    입력값: 내적할 벡터 리스트 a, b
    출력값: 벡터 a, b의 내적 결과 res
    """
    n = len(a)
    res = 0
    for i in range(0, n):
        res += a[i] * b[i]
    return res

In [3]:
# 9.5.2 그램 슈미트 과정을 이용한 QR 분해
# 열 벡터로 분리하기
A = [[1, 0, 1], [0, 1, 1], [1, 2, 0]]

n = len(A)
p = len(A[0])
a1 = []
a2 = []
a3 = []

for i in range(0, n):
    a1.append(A[i][0])
    a2.append(A[i][1])
    a3.append(A[i][2])
    
print(a1)

[1, 0, 1]


In [4]:
# 그램 슈미트 첫 번째 과정
u1 = a1

# 벡터 u2 구하기
# 일단, <a2, u1>의 내적값 구하기
dp21 = 0
for i in range(0, len(u1)):
    tmp = a2[i] * u1[i]
    dp21 += tmp
print(dp21)

# 그 다음, u1의 norm 구하기
norm_u1 = 0
for i in range(0, len(u1)):
    norm_u1 += u1[i]**2
norm_u1 = norm_u1**0.5
print(norm_u1)

# u2를 구하면,
u2 = []
for i in range(0, n):
    tmp = a2[i] - (dp21/norm_u1**2) * u1[i]
    u2.append(tmp)
print(u2)

2
1.4142135623730951
[-0.9999999999999998, 1.0, 1.0000000000000002]


In [5]:
# u3 구하기
# 일단, <a3, u1>의 내적값 구하기
dp31 = 0
for i in range(0, n):
    tmp = a3[i] * u1[i]
    dp31 += tmp
print(dp31)

# <a3, u2>의 내적값 구하기
dp32 = 0
for i in range(0, n):
    tmp = a3[i] * u2[i]
    dp32 += tmp
print(dp32)

# 벡터 u2의 norm 구하기
norm_u2 = 0
for i in range(0, n):
    norm_u2 += u2[i]**2
norm_u2 = norm_u2**0.5
print(norm_u2)

# u3 구하기
u3 = []
for i in range(0, n):
    tmp = a3[i] - (dp31/norm_u1**2) * u1[i] - (dp32/norm_u2**2) * u2[i]
    u3.append(tmp)
print(u3)

# 벡터 u3의 norm 구하기
norm_u3 = 0
for i in range(0, n):
    norm_u3 += u3[i]**2
norm_u3 = norm_u3**0.5
print(norm_u3)

1
2.220446049250313e-16
1.7320508075688772
[0.5000000000000002, 0.9999999999999999, -0.49999999999999994]
1.224744871391589


In [6]:
# 정규 직교 벡터 구하기 (v1, v2, v3)
v1 = []
v2 = []
v3 = []

for i in range(0, n):
    tmp1 = u1[i]/norm_u1
    tmp2 = u2[i]/norm_u2
    tmp3 = u3[i]/norm_u3
    v1.append(tmp1)
    v2.append(tmp2)
    v3.append(tmp3)

print(v1)
print(v2)
print(v3)

[0.7071067811865475, 0.0, 0.7071067811865475]
[-0.5773502691896256, 0.5773502691896258, 0.577350269189626]
[0.40824829046386324, 0.816496580927726, -0.408248290463863]


In [7]:
# 행렬 Q 구하기
Q = [[0, 0, 0], [0, 0, 0], [0, 0, 0]]

for i in range(0, n):
    Q[i][0] = v1[i]
    Q[i][1] = v2[i]
    Q[i][2] = v3[i]
Q

[[0.7071067811865475, -0.5773502691896256, 0.40824829046386324],
 [0.0, 0.5773502691896258, 0.816496580927726],
 [0.7071067811865475, 0.577350269189626, -0.408248290463863]]

In [8]:
# 행렬 R 구하기
R = [[0, 0, 0], [0, 0, 0], [0, 0, 0]]

for i in range(0, n):
    R[0][0] += a1[i] * v1[i]
    R[0][1] += a2[i] * v1[i]
    R[0][2] += a3[i] * v1[i]
    R[1][1] += a2[i] * v2[i]
    R[1][2] += a3[i] * v2[i]
    R[2][2] += a3[i] * v3[i]
R

[[1.414213562373095, 1.414213562373095, 0.7071067811865475],
 [0, 1.7320508075688776, 2.220446049250313e-16],
 [0, 0, 1.2247448713915894]]

In [9]:
# 앞의 과정을 함수로 만들기
from util import *

def qr_gram(A):
    """
    그램 슈미트 과정을 이용한 QR분해
    입력값: 행렬 A
    출력값: 행렬 A를 그램 슈미트 과정을 이용해 QR분해한 결과행렬 Q, R
    """
    
    n = len(A)
    At = transpose(A)
    
    U = []
    norm_list = []
    
    V = []
    Q = []
    R = []
    
    for i in range(0, n):
        if i == 0:
            u = At[i]
            norm_u = norm(u)
            U.append(u)
            norm_list.append(norm_u)
        else:
            a = At[i]
            dp_list = []
            for j in range(0, i):
                dp = inner_product(a, U[j])
                dp_list.append(dp)
                
            u = []
            for j in range(0, n):
                val = a[j]
                for k in range(0, i):
                    val -= (dp_list[k]/norm_list[k]**2) * U[k][j]
                u.append(val)
            norm_u = norm(u)
            U.append(u)
            norm_list.append(norm_u)
            
        v = normalize(u)
        V.append(v)
        
    Q = transpose(V)
    
    for i in range(0, n):
        r = []
        for j in range(0, n):
            if i>j:
                r.append(0)
            else:
                r_ele = inner_product(At[j], V[i])
                r.append(r_ele)
        R.append(r)
        
    return Q, R

In [10]:
# 9.5.3 하우스홀더 방법을 이용한 QR 분해
A = [[1, -1, 4], [1, 4, -2], [1, 4, 2], [1, -1, 0]]

A1 = deepcopy(A)

# 첫번째 열 추출
a1 = transpose(A)[0]
print(a1)

[1, 1, 1, 1]


In [11]:
# a1의 norm 구하기
nm1 = norm(a1)
print(nm1)

2.0


In [12]:
# e1 생성
from util import v_add, sign, householder
e1 = [1]
for i in range(0, len(a1)-1):
    e1.append(0)
    
# v1 벡터 구하기
tmp_e1 = []
for i in range(0, len(e1)):
    val = sign(a1[0]) * nm1 * e1[i]
    tmp_e1.append(val)
    
v1 = v_add(a1, tmp_e1)
print(v1)

[3.0, 1.0, 1.0, 1.0]


In [13]:
# H1 생성
H1 = householder(v1)
print(H1)

[[-0.5, -0.5, -0.5, -0.5], [-0.5, 0.8333333333333334, -0.16666666666666666, -0.16666666666666666], [-0.5, -0.16666666666666666, 0.8333333333333334, -0.16666666666666666], [-0.5, -0.16666666666666666, -0.16666666666666666, 0.8333333333333334]]


In [14]:
# H1*A1
from util import matmul
tmp_res1 = matmul(H1, A1)
print(tmp_res1)

[[-2.0, -3.0, -2.0], [5.551115123125783e-17, 3.3333333333333335, -4.0], [8.326672684688674e-17, 3.3333333333333335, 0.0], [1.1102230246251565e-16, -1.6666666666666665, -2.0]]


In [15]:
# 행렬 A2 생성
A2 = []
for i in range(1, len(A1)):
    tmp_row = []
    for j in range(1, len(A1[0])):
        tmp_row.append(tmp_res1[i][j])
    A2.append(tmp_row)
print(A2)

[[3.3333333333333335, -4.0], [3.3333333333333335, 0.0], [-1.6666666666666665, -2.0]]


In [16]:
# 벡터 a2 생성
a2 = transpose(A2)[0]
print(a2)

[3.3333333333333335, 3.3333333333333335, -1.6666666666666665]


In [17]:
# a2의 norm 구하기
nm2 = norm(a2)
print(nm2)

5.0


In [18]:
# e2 생성
e2 = [1]
for i in range(0, len(a2)-1):
    e2.append(0)
print(e2)

# v2 생성
tmp_e2 = []
for i in range(0, len(e2)):
    val = sign(a2[0]) * nm2 * e2[i]
    tmp_e2.append(val)
print(tmp_e2)

v2 = v_add(a2, tmp_e2)
print(v2)

[1, 0, 0]
[5.0, 0.0, 0.0]
[8.333333333333334, 3.3333333333333335, -1.6666666666666665]


In [19]:
# H2 생성
H2 = householder(v2)
print(H2)

[[-0.6666666666666667, -0.6666666666666667, 0.3333333333333333], [-0.6666666666666667, 0.7333333333333334, 0.1333333333333333], [0.3333333333333333, 0.1333333333333333, 0.9333333333333333]]


In [20]:
# H2 * A2
tmp_res2 = matmul(H2, A2)
print(tmp_res2)

[[-5.000000000000001, 2.0000000000000004], [-2.7755575615628914e-16, 2.4000000000000004], [2.220446049250313e-16, -3.2]]


In [21]:
# A3 생성
A3 = []
for i in range(1, 3):
    A3.append(tmp_res2[i][1])
print(A3)    

[2.4000000000000004, -3.2]


In [22]:
# a3 생성과 norm 구하기
a3 = A3
nm3 = norm(a3)
print(nm3)

4.0


In [23]:
# e3 생성
e3 = [1]
for i in range(0, len(a3)-1):
    e3.append(0)

# v3 생성
tmp_e3 = []
for i in range(0, len(e3)):
    val = sign(a3[0]) * nm3 * e3[i]
    tmp_e3.append(val)
print(tmp_e3)

v3 = v_add(a3, tmp_e3)
print(v3)

[4.0, 0.0]
[6.4, -3.2]


In [24]:
# H3 생성
H3 = householder(v3)
print(H3)

[[-0.6000000000000001, 0.8], [0.8, 0.6]]


In [25]:
# H3 * A3
tmp_res3 = []
for i in range(0, len(H3)):
    val = 0
    for j in range(0, len(H3[0])):
        val += H3[i][j] * A3[j]
    tmp_res3.append(val)
print(tmp_res3)

[-4.000000000000001, 4.440892098500626e-16]


In [26]:
tmp_H2 = identity(len(A))
for i in range(1, len(A)):
    for j in range(1, len(A)):
        tmp_H2[i][j] = H2[i-1][j-1]
H2 = tmp_H2
print(H2)

[[1, 0, 0, 0], [0, -0.6666666666666667, -0.6666666666666667, 0.3333333333333333], [0, -0.6666666666666667, 0.7333333333333334, 0.1333333333333333], [0, 0.3333333333333333, 0.1333333333333333, 0.9333333333333333]]


In [27]:
tmp_H3 = identity(len(A))
for i in range(2, len(A)):
    for j in range(2, len(A)):
        tmp_H3[i][j] = H3[i-2][j-2]
H3 = tmp_H3
print(H3)

[[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, -0.6000000000000001, 0.8], [0, 0, 0.8, 0.6]]


In [28]:
# Q = H1 * H2 * H3
Q = matmul(matmul(H1, H2), H3)
print(Q)

[[-0.5, 0.5000000000000001, -0.49999999999999994, -0.5], [-0.5, -0.5000000000000001, 0.5000000000000002, -0.5000000000000001], [-0.5, -0.5000000000000001, -0.5000000000000001, 0.5], [-0.5, 0.5, 0.5, 0.5]]


In [29]:
# R = H3 * H2 * H1 * A
R = matmul(matmul(matmul(H3, H2), H1), A)
print(R)

[[-2.0, -3.0, -2.0], [-1.1102230246251565e-16, -5.000000000000001, 2.000000000000001], [1.1102230246251565e-16, -1.1102230246251565e-16, -4.0], [2.220446049250313e-16, 4.440892098500626e-16, 8.881784197001252e-16]]


In [30]:
# A = QR인지 확인
matmul(Q, R)

[[0.9999999999999998, -1.000000000000001, 4.0],
 [0.9999999999999999, 4.000000000000001, -2.000000000000002],
 [1.0, 4.000000000000001, 2.0],
 [1.0, -1.0000000000000002, 8.881784197001252e-16]]

In [5]:
from util import *


def qr_householder(A):

    import copy

    # n = len(A)
    p = len(A[0])

    H_list = []

    for i in range(0, p):
        if i == 0:
            A1 = copy.deepcopy(A)
            exA = A1
        elif i < p-1:
            Ai = []
            for j in range(1, len(exA)):
                tmp_row = []
                for k in range(1, len(exA[0])):
                    tmp_row.append(tmp_res[j][k])
                Ai.append(tmp_row)
            exA = Ai
        elif i == p-1:
            Ap = []
            for j in range(1, len(tmp_res)):
                Ap.append(tmp_res[j][1])
            exA = Ap

        # 첫번째 열 추출
        if i < p-1:
            a = transpose(exA)[0]
        else:
            a = exA
        nm = norm(a)

        # e1 생성
        e = [1]
        for j in range(0, len(a)-1):
            e.append(0)

        # v 생성
        tmp_e = []
        for j in range(0, len(e)):
            val = sign(a[0])*nm*e[j]
            tmp_e.append(val)
        v = v_add(a, tmp_e)

        # H 생성
        H = householder(v)

        # H*A
        if i == p-1:
            tmp_res = []
            for j in range(0, len(H)):
                val = 0
                for k in range(0, len(H[0])):
                    val += H[j][k] * exA[k]
                tmp_res.append(val)
        else:
            tmp_res = matmul(H, exA)

        H_list.append(H)

        if i > 0:
            tmp_H = identity(len(A))
            for j in range(i, len(A)):
                for k in range(i, len(A)):
                    tmp_H[j][k] = H_list[-1][j-i][k-i]
            H_list[-1] = tmp_H

    Q = copy.deepcopy(H_list[0])
    for j in range(0, len(H_list)-1):
        Q = matmul(Q, H_list[j+1])

    R = copy.deepcopy(H_list[-1])
    for j in range(1, len(H_list)):
        R = matmul(R, H_list[-(j+1)])
    R = matmul(R, A)

    return Q, R

In [6]:
A = [[1, -1, 4], [1, 4, -2], [1, 4, 2], [1, -1, 0]]
Q, R = qr_householder(A)
Q

[[-0.5, 0.5000000000000001, -0.49999999999999994, -0.5],
 [-0.5, -0.5000000000000001, 0.5000000000000002, -0.5000000000000001],
 [-0.5, -0.5000000000000001, -0.5000000000000001, 0.5],
 [-0.5, 0.5, 0.5, 0.5]]

In [7]:
B = [[3, 2, -3], [5, 0, 4], [0, -1, 3]]
Q, R = qr_householder(B)
Q

[[-0.5144957554275265, 0.7407610636824495, -0.4319342127906801],
 [-0.8574929257125441, -0.44445663820946985, 0.2591605276744081],
 [0.0, -0.5037175233040659, -0.86386842558136]]

In [9]:
C = [[2, -2, 18], [2, 1, 0], [1, 2, 0]]
Q, R = qr_householder(C)
Q

[[-0.6666666666666667, 0.6666666666666667, -0.33333333333333337],
 [-0.6666666666666666, -0.3333333333333334, 0.6666666666666667],
 [-0.3333333333333333, -0.6666666666666667, -0.6666666666666666]]