# 행렬의 성질

- 행렬은 여러 개의 숫자와 부호들의 묶음이다.
- 따라서 모든 행렬의 부호나 크기를 정하기 어렵고, 일정 조건에 대해 행렬의 부호와 크기를 정할 수 있다.

## 1.행렬의 부호
모든 행렬의 부호에 대해 세 가지 중 하나로 정의할 수 있다.
1. (양의) 정부호이다.
2. (양의) 준정부호이다.
3. 정부호도 준정부호도 아니다.

- 보통 대칭행렬에 대해서만 부호를 정의하는 편이다.
    - 대칭행렬 : 행렬의 전치연산의 결과가 원래 행렬과 같은 행렬($A^T=A$)
    - 대칭행렬이 아닌 경우 부호를 정의할 필요성이 떨어지기 때문
 
- 행렬의 부호를 정의하는 방법
    - 벡터 $x$와 행렬 $A$에 대한 수식 $x^TAx$의 값이 0 이상 혹은 초과인지 확인
- 조건 : **벡터 $x$가 0벡터가 아닐 때($x \neq 0$)**
    - 벡터 $x$가 0벡터이면 모든 행렬에 대해 수식 $x^TAx$의 결과가 $0$이 나와 양의 준정부호가 되기 때문

### 정부호
- 벡터 $x$에 대해 다음 부등식이 성립하면 행렬 $A$가 양의 정부호(positive definite)라고 한다.

$$
x^TAx > 0
$$

### 준정부호
- 벡터 $x$에 대해 다음 부등식이 성립하면 행렬 $A$가 양의 준정부호(positive semi-definite)라고 한다.

$$
x^TAx \geq = 0
$$

### 항등행렬 $I$는 양의 정부호
- $x^T I x$의 값이 벡터 $x$의 모든 값이 제곱이 되는 형태이기 때문에 항등행렬 $I$는 항상 양의 정부호가 된다.

$$
x^T I x = 
\begin{bmatrix}
x_1 & x_2 & \cdots & x_N
\end{bmatrix}
\begin{bmatrix}
1&0&\cdots&0\\
0&1&\cdots&0\\
\vdots&\vdots&\ddots&\vdots\\
0&0&\cdots&1\\
\end{bmatrix}
\begin{bmatrix}
x_1 \\ x_2 \\ \vdots \\ x_N
\end{bmatrix}
= x_1^2 + x_2^2 + \cdots + x_N^2 > 0
$$

## 2. 행렬의 크기

- 특정 조건의 행렬에 대해 세 가지 방법으로 행렬의 크기와 유사한 개념의 숫자를 계산할 수 있다.

### 1. 행렬 놈(Norm)
- 행렬 놈은 행렬 $A$에 대해 다음 식으로 정의된다.
    - 행렬 놈의 여러 정의 중 **요소별 행렬놈의 정의**를 따른 것
    - 결과 : 행렬의 각 원소의 $p$승의 합의 $\frac{1}{p}$승

$$
\| A \|_{p}=\left( \sum_{i=1}^N\sum_{j=1}^M \left|a_{ij} \right| ^p\right)^{\frac{1}{p}}
$$

> - $a_{ij}$는 행렬 $A$의 $i$번째 행, $j$번째 열의 원소
>
> - $p = 1,2,\ldots,\infty$

* 프로베니우스 놈($p = 2$)
    - $p = 2$인 놈
    - $p = 2$인 경우 가장 많이 쓰이기 때문에 따로 정의됨
    - 아래와 같이 $p$에 대해 생략되거나 $F$라고 표기할 수 있다.

$$
\| A \|_{2}=\| A \|=\| A \|_{F}=\sqrt{\sum_{i=1}^N\sum_{j=1}^M a_{ij}^2}
$$
- $a_{ij}^p$를 통해 **놈은 항상 0보다 같거나 크다**는 것을 알 수 있다.
- 즉, **놈은 0 또는 양수**이다.
    - $a_{ij}=0$일 경우 $0^p$는 $p$($p = 1,2,\ldots,\infty$)에 어떤 값이 오든 $a_{ij}^p=0$이 되어 놈의 크기가 $0$이 된다.
    - 크기가 0인, 즉 크기가 없는 행렬이 존재한다는 것을 유념

#### **벡터의 놈**
- 행렬과 마찬가지로 벡터의 놈을 구할 수 있다.

$$
\| x \|_p = \left(\sum_{i=1}^N x_i^p\right)^{\frac{1}{p}}
$$

- **벡터의 놈의 제곱은 벡터의 제곱합과 같다.**
    - 벡터 $x$의 제곱합 : 벡터의 각각의 데이터(요소)를 제곱한 뒤, 그 값을 모두 더한 것으로 데이터 벡터 $x$끼리 내적한 결과($x^Tx$)와 같음

$$
\| x \|^2 = \sum_{i=1}^N x_i^2 = x^Tx
$$

- **벡터의 놈을 최소화하는 것은 벡터의 제곱합을 최소화하는 것**과 같다.
    - 놈은 $0$ 또는 양수이므로, 벡터의 놈의 제곱이 가장 작을 때 놈도 가장 작은 값을 가지기 때문
    - 실제로 놈의 제곱이 가장 작을 때는 $\| x \|_p =0$이고 벡터 $x$가 $0$벡터일 때 이와 같은 값이 나오게 된다.
    - 선형회귀 모델을 만들 때 오차에 대한 벡터 $e$의 제곱합($e^Te$)을 최소화하기 위해 벡터 $e$의 놈($\| e \|^2 $)을 최소화하는 방법을 사용할 수 있다.

- 넘파이에서 `linalg` 서브패키지의 `norm()` 함수를 이용해 행렬의 놈을 계산할 수 있다.

In [6]:
import numpy as np

a = np.array([[-4, -3, -2], [-1,  0,  1], [ 2,  3,  4]])

np.linalg.norm(a)

7.745966692414834

#### 정확한 놈의 정의
- 위의 놈의 공식은 공식적인 정의라고 볼 수는 없다.
- 정확한 놈의 정의는 다음 네 가지 성질이 성립하는 행렬 연산을 의미한다.
    - 이러한 연산이 여러 개 존재하기 때문에 놈의 정의도 다양하다.

1. $\| A \| \geq 0$ : 놈의 값은 0 이상이다. 영행렬일 때만 놈의 값이 0이 된다.
2. $\| \alpha A \| = \left| \alpha \right| \| A \|$ : 행렬에 스칼라($\alpha$)를 곱하면, 놈의 값도 그 스칼라의 절대값을 곱한것과 같다.
3. $\| A + B \leq \| A \| + \| B \|$ : 행렬의 합의 놈은 각 행렬의 놈의 합보다 작거나 같다.
4. $\| AB \leq \| A \| \| B \|$ : 행렬의 곱의 놈은 각 행렬의 놈의 곱보다 작거나 같다.

- $p=2$일 때 위 조건을 모두 만족하며, 계산하기 간편하기 때문에 $p=2$를 가장 많이 사용한다.

### 2. 대각합(Trace)
- 조건 : 대각합은 **정방행렬에 대해서만 정의**할 수 있다.
    - 정방행렬 : 행의 개수와 열의 개수가 같은 행렬
 
- 대각합은 (주)대각원소의 합으로 계산된다.

$$
\text{tr}(A) = a_{11} + a_{22} + \ldots + a_{NN} = \sum_{i=1}^N a_ii
$$

- N차원 항등행렬($I$)의 대각합은 $N$이 된다.
    - 항등행렬의 주대각원소는 모두 $1$이다.
$$
\text{tr}(I) = i_{11} + i_{22} + \ldots + i_{NN} = = 1 + 1 + \ldots + 1 = N \times 1 = N
$$

- 대각합을 구할 때는 행렬의 원소에 절대값이나 제곱을 취하지 않기 때문에 **음수가 될 수도 있다.**
  - 대각합을 크기와 비슷한 개념으로 생각하면 된다. 

#### 대각합의 성질
> - 스칼라 $c$, 행렬 $A$, $B$, $C$

1. $\text{tr}(cA)=c\cdot \text{tr}(A)$ : 스칼라를 곱하면 대각합은 스칼라와 원래 대각합의 곱이다.
2. $\text{tr}(A^T)=\text{tr}(A)$ : 전치연산을 해도 대각합은 달라지지 않는다.
3. $\text{tr}(A+B)=\text{tr}(A)+\text{tr}(B)$ : 두 행렬의 합의 대각합은 두 행렬의 대각합의 합과 같다.
4. $\text{tr}(AB)=\text{tr}(BA)$ : 두 행렬의 곱의 대각합은 대각합의 행렬의 순서를 바꾸어도 달라지지 않는다.
    - 이 때, 대각합을 구할 $AB$가 정방행렬이기만 하면 된다.
5. 세 행렬의 곱의 대각합은 다음과 같이 순서를 순환시켜도 달라지지 않는다.
    - $\text{tr}(ABC)=\text{tr}(BCA)=\text{tr}(CAB)$
    - $\text{tr}((AB)C)=\text{tr}(C(AB))=\text{tr}((CA)B)=\text{tr}(B(CA))$
    - 대각합을 구할 수 있는 것은 정방행렬이고, 정방행렬의 주대각 요소는 항상 같은 자리에 위치하기 때문에 가능
    - 대각합을 구할 $\text{tr}$식에서의 행렬이 정방행렬이기만 하면 된다.
    - 위 식을 **트레이스 트릭(trace trick)** 이라고 한다.
  
* **이차형식의 트레이스 트릭 공식**은 다음과 같다.
    - 이차형식의 결과값은 스칼라값이기 때문에 대각합을 취해도 원래의 값과 같다.
    - 행렬 미적분을 구하는데 사용되는 성질이다.
$$
x^TAx = \text{tr}(x^TAx) = \text{tr}(Axx^T) = \text{tr}(xx^TA) 
$$

$$
\left( x^TAx = \sum_{i=1}^N\sum_{j=1}^Na_{i,j}x_ix_j \right)
$$

#### 넘파이에서 대각합 구하기
- 넘파이에서 `trace()` 함수를 이용해 대각합을 구할 수 있다.

In [7]:
x = np.array([[1], [2], [3]])
a = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])

x.T @ a @ x, np.trace(x.T @ a @ x)

(array([[228]]), 228)

### 3. 행렬식

#### **행렬식의 성질**

## 3. 최적의 가중치를 찾아내는 방법

### 1. 선형 연립방적식

### 2. 역행렬

#### **역행렬의 성질**

#### **역행렬의 계산**

#### **역행렬 정리**