## 1.2 텐서 소개

In [34]:
import tensorflow as tf
import numpy as np

In [35]:
import logging    # 경고 출력 금지
logging.getLogger('tensorflow').disabled = True

텐서는 일관된 유형(`dtype`이라고 불림)을 가진 다차원 배열입니다. 지원되는 모든 `dtypes`은 `tf.dtypes.DType`에서 볼 수 있습니다.

[NumPy](https://numpy.org/devdocs/user/quickstart.html)에 익숙하다면, 텐서는 일종의 `np.arrays`와 같습니다.

모든 텐서는 Python 숫자 및 문자열과 같이 변경할 수 없습니다. 텐서의 내용을 업데이트할 수 없으며 새로운 텐서를 만들 수만 있습니다.


### 기초

기본 텐서를 만들어 봅시다.

다음은 "스칼라" 또는 "순위-0" 텐서입니다. 스칼라는 단일 값을 포함하며 "축"은 없습니다.

In [None]:
rank_0_tensor = tf.constant(4)
print(rank_0_tensor)

"벡터" 또는 "순위-1" 텐서는 값의 목록과 같습니다. 벡터는 1축입니다.

In [None]:
rank_1_tensor = tf.constant([2.0, 3.0, 4.0])
print(rank_1_tensor)

"행렬" 또는 "rank-2" 텐서에는 2축이 있습니다.

In [None]:
rank_2_tensor = tf.constant([[1, 2],
                             [3, 4],
                             [5, 6]], dtype=tf.float16)
print(rank_2_tensor)

<table>
<tr>
  <th>스칼라, 형상: <code>[]</code>
</th>
  <th>벡터, 형상: <code>[3]</code>
</th>
  <th>행렬, 형상: <code>[3, 2]</code>
</th>
</tr>
<tr>
  <td><img alt="A scalar, the number 4" src="https://www.tensorflow.org/guide/images/tensor/scalar.png?hl=ko"></td>
  <td><img alt="The line with 3 sections, each one containing a number." src="https://www.tensorflow.org/guide/images/tensor/vector.png"></td>
  <td><img alt="A 3x2 grid, with each cell containing a number." src="https://www.tensorflow.org/guide/images/tensor/matrix.png"></td>
</tr>
</table>


텐서에는 더 많은 축이 있을 수 있습니다. 여기에는 3축 텐서가 사용됩니다.

In [None]:
rank_3_tensor = tf.constant([
  [[0, 1, 2, 3, 4],
   [5, 6, 7, 8, 9]],
  [[10, 11, 12, 13, 14],
   [15, 16, 17, 18, 19]],
  [[20, 21, 22, 23, 24],
   [25, 26, 27, 28, 29]],])
                    
print(rank_3_tensor)

2축 이상의 텐서를 시각화하는 방법에는 여러 가지가 있습니다.

<table>
<tr>
  <th colspan="3">3축 텐서, 형상: <code>[3, 2, 5]</code>
</th>
</tr>
<tr>
</tr>
<tr>
  <td><img src="https://www.tensorflow.org/guide/images/tensor/3-axis_numpy.png"></td>
  <td><img src="https://www.tensorflow.org/guide/images/tensor/3-axis_front.png"></td>
  <td><img src="https://www.tensorflow.org/guide/images/tensor/3-axis_block.png"></td>
</tr>
</table>

`np.array` 또는 `tensor.numpy` 메서드를 사용하여 텐서를 NumPy 배열로 변환할 수 있습니다.

In [None]:
np.array(rank_2_tensor)

In [None]:
rank_2_tensor.numpy()

텐서에는 종종 float와 int가 포함되지만, 다음과 같은 다른 유형도 있습니다.

- 복소수
- 문자열

기본 `tf.Tensor` 클래스에서는 텐서가 "직사각형"이어야 합니다. 즉, 각 축을 따라 모든 요소의 크기가 같습니다. 

덧셈, 요소별 곱셈 및 행렬 곱셈을 포함하여 텐서에 대한 기본 수학을 수행 할 수 있습니다.

In [None]:
a = tf.constant([[1, 2],
                 [3, 4]])
b = tf.constant([[1, 1],
                 [1, 1]]) 

print(tf.add(a, b), "\n")
print(tf.multiply(a, b), "\n")
print(tf.matmul(a, b), "\n")

In [None]:
print(a + b, "\n") 
print(a * b, "\n") 
print(a @ b, "\n") 

텐서는 모든 종류의 연산(ops)에 사용됩니다.

In [None]:
c = tf.constant([[4.0, 5.0], [10.0, 1.0]])

print(tf.reduce_max(c))
print(tf.argmax(c))
print(tf.nn.softmax(c))

### 형상 정보

텐서는 형상이 있습니다. 사용되는 일부 용어는 다음과 같습니다.

- **형상**: 텐서의 각 차원의 길이(요소의 수)
- **순위**: 텐서 차원의 수입니다. 스칼라는 순위가 0이고 벡터의 순위는 1이며 행렬의 순위는 2입니다.
- **축** 또는 **차원**: 텐서의 특정 차원
- **크기**: 텐서의 총 항목 수, 곱 형상 벡터


참고: "2차원 텐서"에 대한 참조가 있을 수 있지만, 순위-2 텐서는 일반적으로 2D 공간을 설명하지 않습니다.

텐서 및 `tf.TensorShape` 객체에는 다음에 액세스하기 위한 편리한 속성이 있습니다.

In [None]:
rank_4_tensor = tf.zeros([3, 2, 4, 5])

<table>
<tr>
  <th colspan="2">순위-4 텐서, 형상: <code>[3, 2, 4, 5]</code>
</th>
</tr>
<tr>
  <td> <img style="max-width: 60%; height: auto;" alt="A tensor shape is like a vector." src="https://www.tensorflow.org/guide/images/tensor/shape.png">
</td>
<td> <img style="max-width: 60%; height: auto;" alt="A 4-axis tensor" src="https://www.tensorflow.org/guide/images/tensor/4-axis_block.png">
</td>
  </tr>
</table>


In [None]:
print("Type of every element:", rank_4_tensor.dtype)
print("Number of dimensions:", rank_4_tensor.ndim)
print("Shape of tensor:", rank_4_tensor.shape)
print("Elements along axis 0 of tensor:", rank_4_tensor.shape[0])
print("Elements along the last axis of tensor:", rank_4_tensor.shape[-1])
print("Total number of elements (3*2*4*5): ", tf.size(rank_4_tensor).numpy())

축은 종종 인덱스로 참조하지만, 항상 각 축의 의미를 추적해야 합니다. 축이 전역에서 로컬로 정렬되는 경우가 종종 있습니다. 배치 축이 먼저 오고 그 다음에 공간 차원과 각 위치의 특성이 마지막에 옵니다. 이러한 방식으로 특성 벡터는 연속적인 메모리 영역입니다.

<table>
<tr>
<th>일반적인 축 순서</th>
</tr>
<tr>
    <td> <img style="max-width: 80%; height: auto;" alt="Keep track of what each axis is. A 4-axis tensor might be: Batch, Width, Height, Freatures" src="https://www.tensorflow.org/guide/images/tensor/shape2.png">
</td>
</tr>
</table>

### 인덱싱

#### 단일 축 인덱싱

TensorFlow는 [파이썬의 목록 또는 문자열 인덱싱](https://docs.python.org/3/tutorial/introduction.html#strings)과 마찬가지로 표준 파이썬 인덱싱 규칙과 numpy 인덱싱의 기본 규칙을 따릅니다.

- 인덱스는 `0`에서 시작합니다.
- 음수 인덱스는 끝에서부터 거꾸로 계산합니다.
- 콜론, `:`은 슬라이스 `start:stop:step`에 사용됩니다.


In [None]:
rank_1_tensor = tf.constant([0, 1, 1, 2, 3, 5, 8, 13, 21, 34])
print(rank_1_tensor.numpy())

스칼라를 사용하여 인덱싱하면 차원이 제거됩니다.

In [None]:
print("First:", rank_1_tensor[0].numpy())
print("Second:", rank_1_tensor[1].numpy())
print("Last:", rank_1_tensor[-1].numpy())

`:` 조각으로 인덱싱하면 차원이 유지됩니다.

In [None]:
print("Everything:", rank_1_tensor[:].numpy())
print("Before 4:", rank_1_tensor[:4].numpy())
print("From 4 to the end:", rank_1_tensor[4:].numpy())
print("From 2, before 7:", rank_1_tensor[2:7].numpy())
print("Every other item:", rank_1_tensor[::2].numpy())
print("Reversed:", rank_1_tensor[::-1].numpy())

#### 다축 인덱싱

더 높은 순위의 텐서는 여러 인덱스를 전달하여 인덱싱됩니다.

단일 축의 경우에서와 정확히 같은 단일 축 규칙이 각 축에 독립적으로 적용됩니다.

In [None]:
print(rank_2_tensor.numpy())

각 인덱스에 정수를 전달하면 결과는 스칼라입니다.

In [None]:
print(rank_2_tensor[1, 1].numpy())

정수와 슬라이스를 조합하여 인덱싱할 수 있습니다.

In [None]:
print("Second row:", rank_2_tensor[1, :].numpy())
print("Second column:", rank_2_tensor[:, 1].numpy())
print("Last row:", rank_2_tensor[-1, :].numpy())
print("First item in last column:", rank_2_tensor[0, -1].numpy())
print("Skip the first row:")
print(rank_2_tensor[1:, :].numpy(), "\n")

다음은 3축 텐서의 예입니다.

In [None]:
print(rank_3_tensor[:, :, 4])

<table>
<tr>
<th colspan="2">배치에서 각 예의 모든 위치에서 마지막 특성 선택하기</th>
</tr>
<tr>
    <td><img style="max-width: 80%; height: auto;" alt="A 3x2x5 tensor with all the values at the index-4 of the last axis selected." src="https://www.tensorflow.org/guide/images/tensor/index1.png"></td>
      <td><img style="max-width: 80%; height: auto;" alt="The selected values packed into a 2-axis tensor." src="https://www.tensorflow.org/guide/images/tensor/index2.png"></td>
</tr>
</table>

### 형상 조작하기

텐서의 형상을 바꾸는 것은 매우 유용합니다.


In [None]:
var_x = tf.Variable(tf.constant([[1], [2], [3]]))
print(var_x.shape)

In [None]:
print(var_x.shape.as_list())

텐서를 새로운 형상으로 바꿀 수 있습니다. 기본 데이터를 복제할 필요가 없으므로 재구성이 빠르고 저렴합니다.

In [None]:
reshaped = tf.reshape(var_x, [1, 3])

In [None]:
print(var_x.shape)
print(reshaped.shape)

데이터의 레이아웃은 메모리에서 유지되고 요청된 형상이 같은 데이터를 가리키는 새 텐서가 작성됩니다. TensorFlow는 C 스타일 "행 중심" 메모리 순서를 사용합니다. 여기에서 가장 오른쪽에 있는 인덱스를 증가시키면 메모리의 단일 단계에 해당합니다.

In [None]:
print(rank_3_tensor)

텐서를 평평하게 하면 어떤 순서로 메모리에 배치되어 있는지 확인할 수 있습니다.

In [None]:
print(tf.reshape(rank_3_tensor, [-1]))

일반적으로, `tf.reshape`의 합리적인 용도는 인접한 축을 결합하거나 분할하는 것(또는 `1`을 추가/제거)입니다.

이 3x2x5 텐서의 경우, 슬라이스가 혼합되지 않으므로 (3x2)x5 또는 3x (2x5)로 재구성하는 것이 합리적입니다.

In [None]:
print(tf.reshape(rank_3_tensor, [3*2, 5]), "\n")
print(tf.reshape(rank_3_tensor, [3, -1]))

<table>
<th colspan="3">몇 가지 좋은 재구성</th>
<tr>
  <td><img alt="A 3x2x5 tensor" src="https://www.tensorflow.org/guide/images/tensor/reshape-before.png"></td>
  <td><img alt="The same data reshaped to (3x2)x5" src="https://www.tensorflow.org/guide/images/tensor/reshape-good1.png"></td>
  <td><img alt="The same data reshaped to 3x(2x5)" src="https://www.tensorflow.org/guide/images/tensor/reshape-good2.png"></td>
</tr>
</table>


형상을 변경하면 같은 총 요소 수를 가진 새로운 형상에 대해 "작동"하지만, 축의 순서를 고려하지 않으면 별로 쓸모가 없습니다.

`tf.reshape`에서 축 교환이 작동하지 않으면, `tf.transpose`를 수행해야 합니다.


In [None]:
print(tf.reshape(rank_3_tensor, [2, 3, 5]), "\n") 

print(tf.reshape(rank_3_tensor, [5, 6]), "\n")

try:
  tf.reshape(rank_3_tensor, [7, -1])
except Exception as e:
  print(f"{type(e).__name__}: {e}")

<table>
<th colspan="3">몇 가지 잘못된 재구성</th>
<tr>
  <td><img alt="You can't reorder axes, use tf.transpose for that" src="https://www.tensorflow.org/guide/images/tensor/reshape-bad.png"></td>
  <td><img alt="Anything that mixes the slices of data together is probably wrong." src="https://www.tensorflow.org/guide/images/tensor/reshape-bad4.png"></td>
  <td><img alt="The new shape must fit exactly." src="https://www.tensorflow.org/guide/images/tensor/reshape-bad2.png"></td>
</tr>
</table>

완전히 지정되지 않은 형상에서 실행할 수 있습니다. 형상에 `None`(차원의 길이를 알 수 없음)이 포함되거나 형상이`None`(텐서의 순위를 알 수 없음)입니다.

### `DTypes`에 대한 추가 정보

`tf.Tensor`의 데이터 유형을 검사하려면, `Tensor.dtype` 속성을 사용합니다.

Python 객체에서 `tf.Tensor`를 만들 때 선택적으로 데이터 유형을 지정할 수 있습니다.

그렇지 않으면, TensorFlow는 데이터를 나타낼 수 있는 데이터 유형을 선택합니다. TensorFlow는 Python 정수를 `tf.int32`로, Python 부동 소수점 숫자를 `tf.float32`로 변환합니다. 그렇지 않으면, TensorFlow는 NumPy가 배열로 변환할 때 사용하는 것과 같은 규칙을 사용합니다.

유형별로 캐스팅할 수 있습니다.

In [None]:
the_f64_tensor = tf.constant([2.2, 3.3, 4.4], dtype=tf.float64)
the_f16_tensor = tf.cast(the_f64_tensor, dtype=tf.float16)

the_u8_tensor = tf.cast(the_f16_tensor, dtype=tf.uint8)
print(the_u8_tensor)

### 브로드캐스팅

브로드캐스팅은 [NumPy의 해당 특성](https://numpy.org/doc/stable/user/basics.html)에서 빌린 개념입니다. 요컨대, 특정 조건에서 작은 텐서는 결합된 연산을 실행할 때 더 큰 텐서에 맞게 자동으로 "확장(streched)"됩니다.

가장 간단하고 가장 일반적인 경우는 스칼라에 텐서를 곱하거나 추가하려고 할 때입니다. 이 경우, 스칼라는 다른 인수와 같은 형상으로 브로드캐스트됩니다. 

In [None]:
x = tf.constant([1, 2, 3])

y = tf.constant(2)
z = tf.constant([2, 2, 2])

print(tf.multiply(x, 2))
print(x * y)
print(x * z)

마찬가지로, 크기가 1인 차원은 다른 인수와 일치하도록 확장될 수 있습니다. 두 인수 모두 같은 계산으로 확장될 수 있습니다.

이 경우, 3x1 행렬에 요소별로 1x4 행렬을 곱하여 3x4 행렬을 만듭니다. 선행 1이 선택 사항인 점에 유의하세요. y의 형상은 `[4]`입니다.

In [None]:
x = tf.reshape(x,[3,1])
y = tf.range(1, 5)
print(x, "\n")
print(y, "\n")
print(tf.multiply(x, y))

<table>
<tr>
  <th>추가 시 브로드캐스팅: <code>[1, 4]</code>와 <code>[3, 1]</code>의 곱하기는 <code>[3,4]</code>입니다.</th>
</tr>
<tr>
  <td><img style="max-width: 80%; height: auto;" alt="Adding a 3x1 matrix to a 4x1 matrix results in a 3x4 matrix" src="https://www.tensorflow.org/guide/images/tensor/broadcasting.png"></td>
</tr>
</table>


브로드캐스팅이 없는 같은 연산이 여기 있습니다.

In [None]:
x_stretch = tf.constant([[1, 1, 1, 1],
                         [2, 2, 2, 2],
                         [3, 3, 3, 3]])

y_stretch = tf.constant([[1, 2, 3, 4],
                         [1, 2, 3, 4],
                         [1, 2, 3, 4]])

print(x_stretch * y_stretch)  

대부분의 경우 브로드캐스팅은 브로드캐스트 연산으로 메모리에서 확장된 텐서를 구체화하지 않으므로 시간과 공간 효율적입니다.

`tf.broadcast_to`를 사용하여 브로드캐스팅이 어떤 모습인지 알 수 있습니다.

In [None]:
print(tf.broadcast_to(tf.constant([1, 2, 3]), [3, 3]))

예를 들어, `broadcast_to`는 수학적인 op와 달리 메모리를 절약하기 위해 특별한 연산을 수행하지 않습니다. 여기에서 텐서를 구체화합니다.