# 부록: 텐서 소개

## 텐서

- 넘파이 어레이 `numpy.ndarray`
    - 대표적인 **텐서**<font size='2'>tensor</font> 자료형
    - 머신러닝에 사용되는 데이터셋은 일반적으로 텐서로 저장됨

- 텐서플로우
    - `Tensor` 자료형인 `tensorflow.Tensor`
    - 넘파이 어레이와 유사하며 GPU를 활용한 연산 지원

- 케라스 신경망 모델의 입력, 출력값
    - 넘파이 어레이를 기본으로 사용
    - 내부적으로는 `tf.Tensor`로 변환해서 사용

### 텐서의 차원

- 텐서의 표현에 사용된 **축**<font size='2'>axis</font>의 개수

- **랭크**<font size='2'>rank</font>로도 불림

### 0차원(0D) 텐서 (랭크-0 텐서)

- 정수 한 개, 부동소수점 한 개 등 하나의 수를 표현하는 텐서. 

- **스칼라**<font size='2'>scalar</font>라고도 불림.
    ```
    np.array(12)
    np.array(1.34)
    ```

### 1차원(1D) 텐서 (랭크-1 텐서)

- 수로 이루어진 리스트 형식의 텐서. 

- **벡터**<font size='2'>vector</font>로 불리며 한 개의 축을 가짐.
    ```
    np.array([12, 3, 6, 14, 7])
    ```

### 2차원(2D) 텐서 (랭크-2 텐서)

- 행과 열 두 개의 축을 가짐. 

- **행렬**<font size='2'>matrix</font>로도 불림.

```
np.array([[5, 78, 2, 34, 0],
          [6, 79, 3, 35, 1],
          [7, 80, 4, 36, 2]])
```

### 2D 텐서 예제: 흑백 사진 데이터

<div align="center"><img src="https://github.com/codingalzi/dlp2/blob/master/jupyter-book/imgs/ch02-mnist05.png?raw=true" style="width:600px;"></div>

### 3차원(3D) 텐서 (랭크-3 텐서)

- 행, 열, 깊이 세 개의 축 사용.

- 동일 모양의 2D 텐서로 구성된 벡터로 이해 가능. 

```
np.array([[[5, 78, 2, 34, 0],
           [6, 79, 3, 35, 1],
           [7, 80, 4, 36, 2]],

          [[5, 78, 2, 34, 0],
           [6, 79, 3, 35, 1],
           [7, 80, 4, 36, 2]],

          [[5, 78, 2, 34, 0],
           [6, 79, 3, 35, 1],
           [7, 80, 4, 36, 2]]])
```

### 3D 텐서 예제: 컬러 사진 데이터

<div align="center"><img src="https://github.com/codingalzi/dlp2/blob/master/jupyter-book/imgs/ch02-rgb-3d-1.png?raw=true" style="width:400px;"></div>
<div align="center"><img src="https://github.com/codingalzi/dlp2/blob/master/jupyter-book/imgs/ch02-rgb-3d-2.png?raw=true" style="width:400px;"></div>

### 4D 텐서 (랭크-4 텐서)

- 3D 텐서로 이루어진 벡터

- 예제
    - 컬러 사진 데이터로 구성된 훈련셋
    - 동영상: 연속된 컬러 사진의 데이터셋으로 간주 가능

### 주의사항: 벡터의 차원

- **벡터의 길이**를 **차원**이라 부르기도 함

- 예제: `np.array([12, 3, 6, 14, 7])`는 5차원 벡터

### 텐서 주요 속성

- 예제: `train_images`가 MNIST의 훈련셋을 가리킴

- `ndim` 속성: 텐서의 차원 저장. 

    ```python
    >>> train_images.ndim 
    3
    ```

- `shape` 속성: 텐서의 모양을 튜플로 저장. 

    ```python
    >>> train_images.shape
    (60000, 28, 28)
    ```

- `dtype` 속성: 텐서에 포함된 항목의 통일된 자료형.

    ```python
    >>> train_images.dtype
    uint8
    ```

### 인덱싱

```python
>>> import matplotlib.pyplot as plt
>>> digit = train_images[4]
>>> plt.imshow(digit, cmap=plt.cm.binary)
>>> plt.show()
```

<img src="https://github.com/codingalzi/dlp2/blob/master/jupyter-book/imgs/ch02-mnist4.png?raw=true" style="width:250px;">
<br>

### 슬라이싱

- 첫째 배치
    ```python
    >>> batch = train_images[:128]
    ```

- 둘째 배치

    ```python
    >>> batch = train_images[128: 256]
    ```

- `n`번째 배치

    ```python
    >>> batch = train_images[128 * n:128 * (n + 1)]
    ```

## 텐서 실전 예제

### 2D 텐서 예제: 캘리포니아 구역별 인구조사 데이터셋

- 20,640개의 구역별 데이터 포함. 따라서 `(20640, 10)` 모양의 2D 텐서로 표현 가능.

<img src="https://raw.githubusercontent.com/codingalzi/handson-ml3/master/jupyter-book/imgs/ch02/housing-data.png" style="width:600px;">

### 3D 텐서 예제

- 시계열 데이터
- 샘플: 1분마다 하루 총 390번 (현재 증시가, 지난 1분 동안 최고가, 지난 1분 동안 최저가)를 
    측정한 데이터. `(390, 3)` 모양의 2D 텐서로 표현.        
- 데이터셋: 250일 동안 측정한 데이터셋은 `(250, 390, 3)` 모양의 3D 텐서로 표현.

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/ch02-timeseries_data.png" style="width:350px;"></div>

### 4D 텐서 예제

- 컬러 사진으로 구성된 데이터셋: `(샘플 수, 높이, 너비, 채널 수)` 또는 `(샘플 수, 채널 수, 높이, 너비)`
    모양의 4D 텐서로 표현

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/ch02-image_data.png" style="width:350px;"></div>

## 텐서 연산

```python
keras.layers.Dense(512, activation="relu")
keras.layers.Dense(10, activation="softmax")
```

- 첫째 층

    - `W1`: 첫째 층에서 학습되는 가중치 행렬
    - `b1`: 첫째 층에서 학습되는 편향 벡터

    `output = relu(np.dot(input, W1) + b1)`

- 둘째 층

    - `W2`: 둘째 층에서 학습되는 가중치 행렬
    - `b2`: 둘째 층에서 학습되는 편향 벡터

    `output = softmax(np.dot(input, W2) + b2)`

### 항목별 연산

<div align="center"><img src="https://scipy-lectures.org/_images/numpy_broadcasting.png" style="width:750px;"></div>

### 유니버설 함수

<div align="center"><img src="https://raw.githubusercontent.com/codingalzi/dlp2/master/jupyter-book/imgs/ch01-universal_functions01.jpg" style="width:500px;"></div>

## 텐서 연산의 기하학적 의미

### 이동: 벡터 합

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/translation.png" style="width:600px;"></div>

### 회전: 점 곱

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/rotation.png" style="width:600px;"></div>

### 스케일링: 점 곱

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/scaling.png" style="width:600px;"></div>

### 아핀 변환

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/affine_transform.png" style="width:600px;"></div>

### 아핀 변환과 relu 활성화 함수

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/dense_transform.png" style="width:600px;"></div>

### 신경망의 텐서 연산

<div align="center"><img src="https://drek4537l1klr.cloudfront.net/chollet2/v-7/Figures/ch02-geometric_interpretation_4.png" style="width:600px;"></div>