# 신경망 데이터 표현

In [1]:
import numpy as np
import matplotlib.pyplot as plt
plt.style.use(['seaborn-whitegrid'])

## 텐서(Tensor)
- 일반적으로 텐서는 3차원 이상을 다룰 때 표현하는 방식이지만, 여기서는 어떠한 데이터를 표현할 때, 그 값 모두를 텐서라고 부르기로 함

        a = np.array([1, 2])
        b = np.array([[1, 2], [3, 4]])
        c = np.array([10])
        d = np.array(3)

        # a, b, c, d 모두 텐서라고 지칭할 수 있음

- 랭크(rank): 텐서의 축을 나타내고, 넘파이(numpy)의 `ndim`으로 구할 수 있음

        a = np.array([1, 2])
            >> ndim = 1
        b = np.array([[1, 2],  [3, 4]])
            >> ndim = 2
        d = np.array(3)
            >> ndim = 0

        # 위의 예시에서 알 수 있듯이 대괄호( [ ] )의 개수가 곧 랭크(축)의 값

- 크기(shape): 텐서의 각 축을 따라 얼마나 많은 차원이 있는지를 나타내며, 파이썬의 튜플(tuple) 형태

## 그림으로 이해하기
![array](https://www.oreilly.com/library/view/elegant-scipy/9781491922927/assets/elsp_0105.png)
<br /><sub>출처: https://www.oreilly.com/library/view/elegant-scipy/9781491922927/ch01.html

In [2]:
# 0차원 텐서

x = np.array(3)
print(x)
print(x.shape)    # 0차원은 모양이 없기 때문에 빈 값으로 나옴
print(np.ndim(x)) # 0차원이므로 값은 0

3
()
0


In [3]:
a = np.array([1,2,3,4])  # 1차원 텐서
b = np.array([5,6,7,8])  # 1차원 텐서
c = a + b

print(c)          # 같은 요소들끼리 더해짐
print(c.shape)    # 1차원 텐서이기 때문에 앞에 값만 있는 것
print(np.ndim(c)) # 1차원이므로 값은 1

[ 6  8 10 12]
(4,)
1


### 벡터의 곱
- $A = (x_1, \ x_2, \ x3, \ ..., \ x_n)$
   $B = (y_1, \ y_2, \ y3, \ ..., \ y_n)$ 일 때,
- 원소곱
    - 같은 형상(shape)일 때, 각 원소별로 계산
    
        $A \times B = (x_1, \ x_2, \ x_3, \ ..., \ x_n) \times (y_1, \ y_2, \ y_3, \ ..., \ y_n) \\
                    \qquad = (x_1y_1, \ x_2y_2, \ x_3y_3, \ ... \ , \ x_ny_n) $

- 벡터곱(product, dot)
    - 두 1차원 벡터가 있을 때 **각각의 성분끼리의 곱을 모두 더하는 계산**
    
        $A \bullet B \Rightarrow A \times B^T = (x_1, \ x_2, \ x_3, \ ..., \ x_n) \begin{pmatrix} y_1 \\ y_2 \\ y_3 \\ ... \\ y_n \end{pmatrix} \\
\qquad = (x_1y_1 + \ x_2y_2 + \ x_3y_3 + \ ... + \ x_ny_n) $

In [4]:
a = np.array([1,2,3,4])
b = np.array([5,6,7,8])
c = a * b

print(c)
print(c.shape)
print(np.ndim(c))
print('------------------------')

x = np.array([1,2,0])
y = np.array([0,2,1])
z = np.dot(x,y)  # 'dot' 연산은 같은 요소끼리 곱한 후 합한 값을 도출

print(z)
print(z.shape)
print(np.ndim(z))

[ 5 12 21 32]
(4,)
1
------------------------
4
()
0


In [5]:
a = np.array(10)
b = np.array([1, 2, 3])

print(a*b)  # a의 요소가 하나더라도 b의 각 요소에 곱해짐

[10 20 30]


In [6]:
# 2차원 텐서의 모양
matrix = np.array([[1,2,3],
                  [4,5,6]])

print(matrix) # 2차원 배열이 나옴
print(matrix.shape)
print(np.ndim(matrix))
print('-----------------')

matrix2 = np.array([[1,2,3,4]]) # '[]'(꺽쇠)가 하나 더 있어 차원 안에 차원이 하나 더 있다는 의미
print(matrix2)
print(matrix2.shape)
print(np.ndim(matrix2))         # 1차원으로 착각할 수 있으니 주의

[[1 2 3]
 [4 5 6]]
(2, 3)
2
-----------------
[[1 2 3 4]]
(1, 4)
2


## 3차원 텐서
- 보통 이미지를 나타낼 때 사용되는 텐서
    - (width, height, channels)
    - 일반적으로 Numpy array로 표현
    ![3d tensor](https://image.slidesharecdn.com/tensordecomposition-170301235239/95/a-brief-survey-of-tensors-5-638.jpg)
    <br /><sub>출처: https://www.slideshare.net/BertonEarnshaw/a-brief-survey-of-tensors
- 시계열 데이터 또는 시퀀스(sequence) 데이터를 표현할 때도 사용
    - (samples, timesteps, features)
    - (예시) 주식 가격 데이터셋, 시간에 따른 질병 발병 건수
![](https://kr.mathworks.com/help/deeplearning/examples/timeseriesforecastingusingdeeplearningexample_01_ko_KR.png)
<br /><sub>출처: https://kr.mathworks.com/help/deeplearning/examples/time-series-forecasting-using-deep-learning.html