# chapter2 벡터의 확장 개념

   - 벡터 집합
   - 벡터들의 모음을 집합(set)이라 함
   - 벡터 집합은 S 또는 V로 나타낼 수 있음
   - $ V ={v_1, ..., v_n}$
   - 비어있는 벡터집합은 $V={}$


- 선형 가중 결합 (linear weighted combination)
- 여러 변수마다 가중치를 다르게 주어 정보를 혼합하는 방법
- 선형 혼합(linear mixture), 가중 결합(weighted combination)이라고도 함 (선형이라고 가정)
- 가중 대신 계수 (coefficient)라고도 함 (선형이라고 가정)
- 단순히 말하면 스칼라-벡터 곱셈을 한 다음 합하는 것. 벡터집합에서 각 벡터에 스칼라를 곱한 후 이들을 더해 하나의 벡터를 만듦
- $w=\lambda_{1} v_1+\lambda_{2} v_2 + ... + \lambda_n v_n$  (모든 벡터 $v_i$의 차원은 같다고 가정. 그렇지 않다면 애초에 더할 수 없음) ($ \lambda $는 0을 포함한 임의의 실수가 될 수 있음)
- ex: $\lambda_{1}=1, \lambda_{2}=2, \lambda_{3}=-3, v_1 = \begin{bmatrix}4\\5\\1\end{bmatrix}, v_2 = \begin{bmatrix}-4\\0\\-4\end{bmatrix}, v_3 = \begin{bmatrix}1\\3\\2\end{bmatrix}$
- $w=\lambda_{1}v_1+\lambda_{2}v_2+\lambda_{3}v_3=\begin{bmatrix}-7\\-4\\-13\end{bmatrix}$

In [1]:
# 선형 가중 결합은 데이터 타입이 중요. 벡터 타입이 numpy배열이 아닌 벡터 리스트라면 어떻게 되는지 확인
import numpy as np 
l1=1
l2=2
l3=-3
v1=np.array([4,5,1])
v2=np.array([-4,0,-4])
v3=np.array([1,3,2])
l1*v1 + l2*v2 + l3*v3


array([ -7,  -4, -13])

- 각 벡터와 계수를 별도의 변수에 저장하는 방법은 번거롭고 더 어려운 문제를 풀 때 확장성이 떨어짐
- linear weighted combination은 여러 방면에서 응용될 수 있음. 그중 3가지는 다음과 같음
- 통계 모델로부터 예측된 데이터는 최소제곱 알고리즘을 통해 계산되는 회귀변수regressor(독립변수)와 계수(스칼라)의 선형 가중 결합으로 생성됨
- 주성분 분석과 같은 차원 축소 과정에서 각 성분(인자 또는 모드라고도 함)은 성분의 분산을 최대화하는 가중치(계수)와 데이터 채널의 선형 가중 결합으로 도출됨
- 인공 신경망 (딥러닝 기반 아키텍쳐 및 알고리즘)에는 두가지 연산, 즉 입력 데이터의 선형 가중 결합과 비선형 변환이 있음. 가중치는 비용 함수를 최소화하도록 학습. 비용 함수는 일반적으로 모델 예측과 실제 목표 변수 사이의 차이
- linear weighted combination의 개념은 벡터 부분공간과 행렬 공간을 생성하는 메커니즘이며 선형 독립성의 핵심

- 선형 독립성
- 벡터 집합에서 적어도 하나의 벡터를 집합의 다른 벡터들의 선형 가중 결합으로 나타낼 수 있을 때 벡터 결합을 선형 종속적 (linearly dependent)라고 함. 
- 반대로 집합에 있는 벡터들의 선형 가중 결합으로 집합의 아무런 벡터도 나타낼 수 없다면 해당 벡터 집합은 선형 독립적 (linearly independent)임
- ex: $V=\{{\begin{bmatrix}1\\3\end{bmatrix},\begin{bmatrix}2\\7\end{bmatrix}}\}$ $S=\{{\begin{bmatrix}1\\3\end{bmatrix},\begin{bmatrix}2\\6\end{bmatrix}}\}$
- 벡터집합 V는 선형 독립적. 집합의 한 벡터를 집합의 다른 벡터의 선형 배수로 나타낼 수 없음. 다시 말해 집합 내 벡터들을 $v_1, v_2$라 할 때, $v_1 = \lambda v_2$인 스칼라 $ \lambda $ 가 존재하지 않음
- 벡터집합 S는 선형 종속적. 집합의 벡터를 선형 가중 결합해서 집합의 다른 벡터를 만들 수 있기 때문. $s_1 = .5*s_2 와 s_2 = 2*s_1$
- 데이터 과학 분야에서 선형 독립성을 결정하는 방법은 벡터 집합으로 행렬을 만들고 행렬의 계수를 계산한 다음 행의 수와 열의 수 중에서 더 작은 값과 비교하는 것.
- 
- 
- 독립적 집합: 독립성은 벡터 집합의 속성. 즉 벡터 집합은 선형 독립적이거나 선형 종속적일 수 있음. 집합 내의 개별 벡터의 속성이 아님

- 수학에서의 선형 독립성
- $0=\lambda_{1}v_1 + \lambda_{2}v_2 + ... + \lambda_{n}v_n, \lambda \in \R $
- 위 식의 의미는 선형 종속적이라면 집합의 벡터들의 선형 가중 결합으로 영벡터를 만들 수 있다는 것
- 식을 참으로 만드는 $\lambda$ 를 찾을 수 있다면 벡터 집합은 선형 종속적. 반대로 벡터를 선형적으로 결합해서 영벡터를 생성할 수 있는 방법이 없다면 벡터집합은 선형 독립적
- $0=v_1 +... + \dfrac{\lambda_{n}}{\lambda_{1}}{v_n}, \lambda \in \R , \lambda_{1} \neq 0$
- 간단히 생각하면 영벡터가 포함된 모든 벡터 집합은 당연히 선형 종속적인 집합. 영벡터에 스칼라를 곱하면 여전히 영벡터
- $\lambda_{0}0=0v_1+0v_2+0v_n$
- 따라서 $\lambda_{1} \neq 0$ 이며 자명하지 않은 해 (nontrivial solution)가 존재한다면 그 집합은 선형 종속성 정의에 부합

- 부분공간과 생성
- 부분공간 (subspace). 집합 안에서 벡터들을 선형 결합 할 수 있는 무한한 방법 다룸
- 유한한 벡터 집합의 동일한 벡터들을 사용하지만 다른 가중치 숫자를 사용해 무한히 선형결합하는 방식으로 벡터 부분공간을 만듦
- 그 후 가능한 모든 선형 가중 결합을 구성하는 메커니즘을 벡터 집합의 생성(span)이라 함
- 벡터 집합에서 생성되는 부분공간의 차원은 선형 독립 집합을 형성하는 데 필요한 최소한의 벡터 수
- 벡터 집합이 선형 독립적이라면 해당 집합의 벡터들로 생성된 부분공간의 차원은 집합의 벡터 수와 동일함
- 반대로 종속적이라면 해당 벡터들로 생성된 부분공간의 차원은 반드시 해당 집합의 벡터 수보다 작음

- 기저
- 기저는 일종의 공간을 측정하기 위한 자와 같음
- 선대에서 기저(basis)는 행렬의 정보를 설명하는 데 사용되는 자(ruler)의 집합
- ex: $S_2 = \{{\begin{bmatrix}1\\0\end{bmatrix},\begin{bmatrix}0\\1\end{bmatrix}}\}$, $S_3 = \{{\begin{bmatrix}1\\0\\0\end{bmatrix},\begin{bmatrix}0\\1\\0\end{bmatrix}, \begin{bmatrix}0\\0\\1\end{bmatrix}}\}$
- 위는 2차원과 3차원 데카르트 그래프의 기저 집합
- 데카르트 기저 집합은 서로 직교하며 단위 길이인 벡터로 이루어져 있음 (표준 기저 집합. Standard basis set)
- 
- 응용 선형대수학의 많은 문제는 어떤 부분공간에 대한 최적의 기저벡터 집합을 찾는 것으로 개념화 할 수 있음
- 모든 분석은 본질적으로 특정 문제에 대한 최적의 기저벡터를 찾는 것이 목표

- 최적의 기저 집합이 뭔지 찾는 것은 어려움
- 
- 기저 정의
- 기저는 단순히 생성과 독립성을 결합한 것
- 즉 벡터 집합이 (1) 특정 부분공간을 생성. (2) 독립적인 벡터 집합이라면 해당 부분공간의 기저
- 측정할 수 없는 것은 설명할 수가 없기에 기저가 어떤 부분공간의 기저가 되려면 해당 부분공간을 생성할 수 있어야 함
- 자신이 생성하는 부분공간에 대해서는 당연히 유효한 기저벡터지만 생성하지 못하는 부분공간에 대해서는 기저벡터가 아님
- 따라서 기저는 자신만 사용해서 공간을 생성. 또한 기저 집합은 선형 독립적이어야 함
- 그 이유는 부분공간에 있는 모든 벡터는 그 기저를 이용한 고유한 좌표를 가져야 하기 때문
- 고유성을 보장하려면 선형 독립적이어야 함
- 
- 점p를 설명할 때 무한한 수의 기저 집합을 사용해 설명할 수 있기에 측정값은 고유하지 않음.
- 그러나 하나의 기저집합 내에서 하나의 점은 정확히 하나의 선형 가중 결합으로 정의됨 (ex: 3,200킬로미터와 2,000마일은 가능하지만 3,200킬로미터와 2,000킬로미터는 동일하지 않음)

- 요점정리
- 벡터 집합은 벡터들의 모음임. 집합에는 유한하거나 무한한 수의 벡터가 존재
- 선형 가중 결합은 집합의 벡터들에 스칼라를 곱하고 합하는 것. 선형 가중 결합은 선형대수학에서 가장 중요한 개념
- 집합에서 하나의 벡터가 집합의 다른 벡터들의 선형 가중 결합으로 기술될 수 있으면 해당 벡터집합은 선형 종속적임. 만약 이러한 선형 가중 결합이 없다면 집합은 선형 독립적임
- 부분공간은 벡터 집합의 가능한 모든 선형 가중 결합으로 만들어진 무한 집합임
- 기저는 공간을 측정하기 위한 일종의 자. 벡터 집합이 (1) 어떤 부분공간을 생성하고 (2) 선형 독립적이라면 해당 부분공간에 대한 기저가 됨. 데이터 과학의 주요 목표는 데이터 집합을 설명하거나 문제를 해결하기 위한 최상의 기저 집합을 찾는 것.