## dependency

In [19]:
import numpy as np
import math
import plotly
import plotly.graph_objs as go

# 선형방정식(Linear Equations)

## 개념
$$a_1x_1 + a_2x_2 + ... + a_nx_n = b$$

다음과 같이 미지수의 차수가 1인($x^1 = x$) 일차식과 상수항($b$)으로 이루어진 방정식을 선형방정식이라고 한다.

## 선형방정식인 것
$$2x_1 - 3x_2 + 1 = x_1$$

위 방정식은 정리하면 $x_1+3x=-1$ 꼴이므로 선형방정식이다.

$$x_2=2(\sqrt{5}-x_1)-x_3$$

위 방정식은 정리하면 $2x_1+x_2+x_3=2\sqrt{5}$ 꼴이므로 선형방정식이다.

### 선형방정식이 아닌 것
$$2x_1-3x_2=x_1x_2$$

$2x_1-3x_2$의 일차결합이 상수항으로 표현되지 않아 선형방정식이 아님

$$x_2 = 3\sqrt{x_1}-1$$

미지수의 차수가 $\frac{1}{2}$이므로 선형방정식이 아님.

$$x_1+\sin x_2 = 0$$

$\sin$배는 linear하지 않기 때문에 선형방정식이 아님.

### Sin 배의 그래프

In [32]:
x = np.arange(0, math.pi*2, 0.05)
x2 = np.arange(0, math.pi*2, 0.05)
y = np.sin(x) + x2
trace0 = go.Scatter(
   x = x, y = y
)

trace0 = go.Scatter(x=x, y=y)
data = [trace0]
plotly.offline.iplot({ "data": data,"layout": go.Layout(title="Sin wave")})

# 선형연립방정식(system of linear equations)

## 개념
$$a_{11}x_1 + a_{12}x_2 + ... + a_{1n}+x_n = b_1\\a_{21}x_1 + a_{22}x_2 + ... + a_{2n}+x_n = b_2\\...\\a_{m1}x_1 + a_{m2}x_2 + ... + a_{mn}+x_n = b_m$$

다음과 같은 미지수 $x_1, x_2, ... , x_n$에 관한 유한개의 선형방정식의 모임을 선형연립방정식이라고 한다.

만약, 위의 식에서 $b_1, b_2, ... b_m$이 모두 1인 경우, 동차선형연립방정식이라고 한다.
## 해
위의 식에서 $s_1, s_2, ... , s_n$을 각각 $x_1, x_2, ..., x_n$에 대입하였을 때 방정식이 모두 성립하면, 이를 선형방정식의 해라고 부르며, 해의 전체 집합을 해집합이라고 한다.
이때, 두 선형연립방정식의 해집합이 같으면 두 선형연립방정식을 동치라고 한다.

해가 존재하면 consistenct, 해가 존재하지 않으면 inconsistent라고 부른다.

선형연립방정식에 대해 보통 세 가지중 하나가 성립한다.

1. 유일한 해를 갖는 경우
2. 해가 없는 경우
3. 무수히 많은 해를 갖는 경우

각 선형방정식으로 나타내어진 평면 $H_1$, $H_2$, $H_3$이 3차원 $R^3$ 공간에 있다고 가정해보자.

그렇다면, 각 경우에 따라 다음과 같은 그림이 만들어진다.

<img src="./static/img/linear/linear1.png">

세 점이 같이 모이는 공간이 하나의 점에만 생성된 경우, 선형연립방정식은 **유일한 해**를 가진다.

<img src="./static/img/linear/linear2.png">

한편, 다음과 같이 세 평면의 점이 모두 만나지 않거나 세 평면중 두 평면만 만나는 점이 있을 경우, 선형연립방정식은 **해가 없다.**
또한, 해당 선형연립방정식에 속한 선형방정식은 **inconsistent하다**.

<img src="./static/img/linear/linear3.png">

마지막으로, 세 평면이 한 선에서 만나거나 서로 겹치는 경우, 해당 선형연립방정식은 **무수한 해**를 갖는다.

## Machine Learning을 위해 선형연립방정식의 해를 배우는 이유

Machine Learning에서 target값 $y$는 가중치 $w_n$와 미지수 $x_n$, 그리고 노이즈 $t$로 구성된 방정식이다.
즉, 머신러닝은 $y=w_1x_1+w_1x_2+ ... +w_nx_n+t$ 같은 구조의 방정식이며, EDA는 $x_n$의 수를 늘려가는 과정이라고 볼 수 있다.

그런데, 여기서 EDA를 통해 미지수를 늘리다보면 어느순간 데이터의 수보다 미지수의 숫자가 더 많아지는 경우가 생긴다.
예를 들어, 다음과 같이 n개의 변수가 있는 회귀모델이 있다고 가정하자.

$$x_1-2x_2+x_3+3x_4-x_5=0\\x_3-5x_4+2x_5=1\\x_4+x_5=2$$

식은 세개인데, 미지수의 개수는 5개이므로 해를 구할 수 없다. 이를 차원의 저주라고 한다.
이 경우, 미지수 2개에 임의의 실수 $t$,$s$등을 부여하여 다음과 같이 풀 수 있다. 이를 차원축소라고 한다.

$$x_1+x_3+3x_4=x_5+2x_2\\x_3-5x_4=1-2x_5\\x_4=2-x_5$$

여기서 $x_2=t, x_5=s$를 대입하면

$$x_1+x_3+3x_4=2t+s\\x_3-5x_4=1-2s\\x_4=2-s$$

로, 미지수의 개수(차원)가 $x_1, x_3, x_4$로 세개가 되어 식의 개수가 같아진다. 따라서 해당 연립방정식을 풀 수 있게 된다.

이렇게 특정 미지수를 임의의 실수로 지정하여 미지수의 숫자를 줄이는 과정이 바로 머신러닝에서 차원축소이다.
