### **가중평균**

**가중평균(weighted average)**은 대표적으로 대학교의 평균성적으로 많이 표현
* 교양 1학점 A(90) , 전공 3학점 B(70) 받았을 경우<br>
<br>
학과점수의 가중합(Department weighted), 학과점수 총합(Total score of department)
<br>
<br>
$$
\dfrac{\text{Department weighted}}{\text{Total score of department}} = \dfrac {1}{1+3} \times 90 + \dfrac {3}{1+3} \times 70 = 75
$$

벡터로 표현된 $N$개의 데이터를 단순 평균은 다음처럼 생각할 수 있다.<br>
<br>
$$
\bar{x} = \dfrac{1}{N} \sum_{i=1}^N x_i = \dfrac{1}{N} \mathbf{1}_N^T x
$$

$\bar{x}$ 는 $x$의 평균이며 보통 x bar로 읽는다 

numpy에서 사용방법 <span style="color:red">mean</span> 이라는 메더스를 사용할 수도 있다.

In [19]:
import numpy as np

# 1 
x = np.arange(10)
x

array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [20]:
x.mean()

4.5

In [21]:
# 2
N = len(x)
N

10

In [22]:
np.dot(np.ones(N), x)

45.0

In [23]:
sum(np.ones(N) * x)

45.0

In [24]:
np.dot(np.ones(N), x) / N

4.5

### **유사도**

유사도를 측정하는 방법은 여러가지이나 벡터의 곱셈(내적)은 두 벡터간의 유사도(similarity)를 계산하는 것에도 이용.<br>
Ex) 0 ~ 1 의 값을 가지는 두 벡터
$$
a
=
\begin{bmatrix}
1\\
0\\
1\\
1\\
\end{bmatrix}
$$
<br>
$$
b=
\begin{bmatrix}
0\\
1\\
1\\
1\\
\end{bmatrix}
$$
<br>
두 벡터에서 같은 위치의 원소(수치)를 서로 곱할 때 두 원소의 값 중 어느 하나라도 0에 가까우면 곱은 0에 가까운 작은값이 된다. 따라서 같은 위치의 값 크기가 같은 경우가 많을 수록 전체 곱의 합 즉, 내적값이 커지는 경향을 띤다.

$$
a_{1,1} \times b_{1,1} = 1 \times 0  = 0
$$
$$+$$
$$
a_{2,1} \times b_{2,1} = 0 \times 1  = 0
$$
$$+$$
$$
a_{3,1} \times b_{3,1} = 1 \times 1  = 1
$$
$$+$$
$$
a_{4,1} \times b_{4,1} = 1 \times 1  = 1
$$
$$+$$
$$
similarity = 2
$$



### 선형 회귀 모형


선형(linear) 회귀분석을 해보면 결과 값들이 직선의 관계가 있음을 볼 수 있다.<br>
<img src = "https://seaborn.pydata.org/_images/regression_9_0.png">
<br>
<br>
회귀(regress) "go back to an earlier and worse condition"(옛날 상태로 돌아감) 결국 값이 무한적으로 커지거나 작아지는 것이 아닌 평균으로 돌아가는 경향을 말한다.<br>
<br>
선형 회귀 모형(linear regression model)이란 독립 변수 x에서 종속 변수 y를 예측 하기 위한 방법의 하나.<br>
<br>

$y$값과 가장 비슷한 $\hat{y}$를 찾는(계산)하는 수식을 말한다.<br>
<br>
$$
y \fallingdotseq \hat{y}
\\
\\
w^Tx=\hat{y} 
$$
<br>
여기서 가장 비슷한 $\hat{y}$라고 하는 이유는 정확히 $y$를 만들어주는 $w$를 찾기 힘들기 때문이다.<br>
<br>
ex)<br>
어떤 아파트 잔지의 가격을 조사하였더니 개별 아파트의 가격은 <span style="color:red">면적</span>, <span style="color:blue">층수</span>, <span style="color:green">한강</span>이 보이는지의 여부에 의해 달라진다는 사실을 알게 되었다.
* 평균 면적은 $\color{red}{80m^2}$ 이며 해당 아파트 면적과 평균면적의 차이를 $\color{red}{x_1}$ 이라고 한다.<br>
    - 면적인 $100m^2$인 아파트의 경우 $x_1 = 20$
    - 면적이 $70m^2$ 인 아파트인 경우 $x_1 = -10$
* 층수는 1층 부터 20층 까지이며 <span style="color:blue">"층수 -1"</span>의 수를 입력 데이터 $\color{blue}{x_2}$라고 한다. 
    - 10층이면 $x_2 = 10-1 = 9$이다.
* 한강이 보이는지의 <span style="color:green">여부</span>를 입력데이터 $\color{green}{x_3}$라고 한다.
    - 한강이 보이면 $x_3 = 1$ 
    - 보이지 않으면 $x_3 = 0$
* 출력 데이터 $\hat{y}$는 $\color{red}{x_1} = \color{blue}{x_2} = \color{green}{x_3} = 0$ 일 때의 기본 가격 (base price)과 해당 아파트의 예측 가격과의 차이이다.

위와 같이 입력 데이터와 출력 데이터를 정의 하고 회귀 분석 한 결과 다음과 같은 모형을 만들수 있다고 가정.<br>
<br>
$$
\hat y = \color{red}{500x_1} + \color{blue}{200x_2} + \color{green}{1000x_3}
$$
<br> 
이 결과는 다음과 같이 해석
* 면적이 $1m^2$ 증가할수록 가격은 <span style="color:red">500만 원</span>이 증가한다.
* 층수가 1층 높아 질수록 가격은 <span style="color:blue">200만 원</span>이 증가한다.
* 한강이 보이는 집은 <span style="color:green">1000만 원</span>의 웃돈(프리미엄)이 존재한다.

다음과 같이 표현 가능
$$
\hat y
=
\begin{bmatrix}
500 & 200 & 1000 
\end{bmatrix}
\begin{bmatrix}
{x_1}\\
{x_2}\\
{x_3}\\
\end{bmatrix}
=
w^{T}x
$$

즉 선형 예측 모형은 다음과 같은 가중치 벡터로 표현 가능

$$
w^T =
\begin{bmatrix}
500 & 200 & 1000
\end{bmatrix}
$$

인공 신경망(artificial neural network)에서는 선형회귀 모형을 다음과 같은 그림으로 표현한다.<br>
데이터는 노드(node)혹은 뉴런(neuron)이라는 동그라미로 표시하고 곱셈은 선분(line)위에 곱할 숫자를 써서 나타다낸다.<br> 덧셈은 여러개의 선분이 만나는 것으로 표시.

<img src = "https://csdl-images.computer.org/trans/tc/1996/10/figures/t11711.gif">