In [1]:
import tensorflow as tf

# 텐서와 연산
tf.constant()로 텐서를 만들 수 있습니다.

아래와 같이 행렬을 만들 수 있습니다.

In [2]:
tf.constant([
    [1., 2., 3.],
    [4., 5., 6.]
])

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

스칼라도 다음과 같이 만들 수 있습니다.

In [3]:
tf.constant(42)

<tf.Tensor: shape=(), dtype=int32, numpy=42>

ndarray처럼 tf.Tensor는 shape와 dtype을 가집니다.

In [4]:
t = tf.constant([
    [1., 2., 3.],
    [4., 5., 6.]
])
t.shape

TensorShape([2, 3])

In [5]:
t.dtype

tf.float32

인덱스 참조도 넘파이와 매우 비슷하게 작동합니다.

In [6]:
t[:, 1:]

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[2., 3.],
       [5., 6.]], dtype=float32)>

In [7]:
t[..., 1, tf.newaxis]

<tf.Tensor: shape=(2, 1), dtype=float32, numpy=
array([[2.],
       [5.]], dtype=float32)>

가장 중요한 것은 모든 종류의 텐서 연산이 가능하다는 것입니다.

In [8]:
t + 10  # 이는 tf.add(t, 10)과 같습니다.

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[11., 12., 13.],
       [14., 15., 16.]], dtype=float32)>

In [9]:
tf.square(t)

<tf.Tensor: shape=(2, 3), dtype=float32, numpy=
array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)>

In [10]:
t @ tf.transpose(t)

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[14., 32.],
       [32., 77.]], dtype=float32)>

필요한 모든 기본 수학 연산(tf.add(), tf.multiply(), tf.square(), tf.exp(), tf.sqrt() 등)과 넘파이에서 볼 수 있는 대부분의 연산(예를 들어 tf.reshape(), tf.squeeze(), tf.tile())을 제공합니다. 일부 함수들은 넘파이와 이름이 다릅니다. 예를 들어 tf.reduce_mean(), tf.reduce_sum(), tf.reduce_max(), tf.math.log()는 np.mean(), np.sum(), np.max(), np.log()와 동일합니다.

케라스 API는 keras.backend에 자체적인 저수준 API를 가지고 있습니다. square(), exp(), sqrt() 같은 함수들이 포함됩니다. 아래는 이를 사용하는 간단한 예제입니다.

In [11]:
from tensorflow import keras

K = keras.backend
K.square(K.transpose(t)) + 10

<tf.Tensor: shape=(3, 2), dtype=float32, numpy=
array([[11., 26.],
       [14., 35.],
       [19., 46.]], dtype=float32)>

# 텐서와 넘파이
텐서는 넘파이와 함께 사용하기 편리합니다.<br>
넘파이 배열로 텐서를 만들 수 있고 그 반대도 가능합니다.<br>
넘파이 배열에 텐서플로 연산을 적용할 수 있고 텐서에 넘파이 연산을 적용할 수도 있습니다.

In [12]:
import numpy as np

In [13]:
a = np.array([2., 4., 5.])
tf.constant(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([2., 4., 5.])>

In [14]:
t.numpy()  # 또는 np.array(t)

array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)

In [15]:
tf.square(a)

<tf.Tensor: shape=(3,), dtype=float64, numpy=array([ 4., 16., 25.])>

In [16]:
np.square(t)

array([[ 1.,  4.,  9.],
       [16., 25., 36.]], dtype=float32)

넘파이는 기본으로 64비트 정밀도를 사용하지만<br>
텐서플로는 기본으로 32비트 정밀도를 사용합니다.

일반적으로 신경망은 32비트 정밀도로 충분하고 더 빠르고 메모리도 적게 사용하기 때문입니다.<br>
넘파이 배열로 텐서를 만들 때 dtype=tf.float32 로 지정해야 합니다.

# 타입 변환
타입 변환은 성능을 크게 감소시킬 수 있습니다.<br>
타입이 자동으로 변환되면 사용자가 눈치채지 못할 수 있습니다.<br>
이를 위해 텐서플로는 어떤 타입 변환도 자동으로 수행하지 않습니다.

호환되지 않는 타입의 텐서로 연산을 수행하면 예외가 발생합니다.<br>
예를 들어 실수 텐서와 정수 텐서를 더할 수 없습니다.<br>
32비트 실수와 64비트 실수도 더할 수 없습니다.

In [17]:
tf.constant(2.) + tf.constant(40)

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a int32 tensor [Op:AddV2]

In [18]:
tf.constant(2.) + tf.constant(40., dtype=tf.float64)

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a float tensor but is a double tensor [Op:AddV2]

타입 변환을 꼭 해야한다면 tf.cast() 함수를 사용하면 됩니다.

In [19]:
t2 = tf.constant(40., dtype=tf.float64)
tf.constant(2.0) + tf.cast(t2, tf.float32)

<tf.Tensor: shape=(), dtype=float32, numpy=42.0>

# 변수
여태 본 tf.Tensor는 변경이 불가능한 객체입니다.<br>
따라서 일반적인 텐서로는 역전파로 변경되어야 하는 신경망의 가중치를 구현할 수 없습니다.<br>
또한 시간에 따라 변경되어야 할 다른 파라미터도 있습니다.

이것이 tf.Variable이 필요한 이유입니다.

In [20]:
v = tf.Variable([
    [1., 2., 3.,],
    [4., 5., 6.]
])
v

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)>

tf.Variable은 tf.Tensor와 비슷하게 동작합니다.<br>
동일한 연산을 수행할 수 있고 넘파이와도 잘 호환됩니다.<br>
까다로운 데이터타입도 마찬가지입니다.

하지만 assign() 메소드를 사용하여 변숫값을 바꿀 수 있습니다.<br>
(assign\_add()나 assign\_sub() 메소드를 사용해 증가, 감소 연산도 가능합니다.)

또한 원소의 assign()이나 scatter\_update(), scatter\_nd\_update()를 사용해 개별 원소를 수정할 수도 있습니다.

In [21]:
v.assign(2 * v)
v

<tf.Variable 'Variable:0' shape=(2, 3) dtype=float32, numpy=
array([[ 2.,  4.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [22]:
v[0, 1].assign(42)

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  6.],
       [ 8., 10., 12.]], dtype=float32)>

In [23]:
v[:, 2].assign([0., 1.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[ 2., 42.,  0.],
       [ 8., 10.,  1.]], dtype=float32)>

In [24]:
v.scatter_nd_update(indices=[[0, 0], [1, 2]], updates=[100., 200.])

<tf.Variable 'UnreadVariable' shape=(2, 3) dtype=float32, numpy=
array([[100.,  42.,   0.],
       [  8.,  10., 200.]], dtype=float32)>

# 다른 데이터 구조
- **희소 텐서(tf.SparseTensor)**<br>
대부분 0으로 채워진 텐서를 효율적으로 나타냅니다. tf.sparse 패키지는 희소 텐서를 위한 연산을 제공합니다.
- **텐서 배열(tf.TensorArray)**<br>
텐서의 리스트입니다. 기본적으로 고정된 길이를 가지지만 동적으로 바꿀 수 있습니다. 리스트에 포함된 모든 텐서는 크기와 데이터 타입이 동일해야 합니다.
- **레그드 텐서(tf.RaggedTensor)**<br>
래그드 텐서는 리스트의 리스트를 나타냅니다. 텐서에 포함된 값은 동일한 데이터 타입을 가져야 하지만 리스트의 길이는 다를 수 있습니다. tf.ragged 패키지는 래그드 텐서를 위한 연산을 제공합니다.
- **문자열 텐서**<br>
tf.string 타입의 텐서입니다. 유니코드가 아니라 바이트 문자열을 나타냅니다. 유니코드 문자열을 사용해 문자열 텐서를 만들면 자동으로 UTF-8로 인코딩됩니다.
- **집합**<br>
집합은 일반적인 텐서 또는 희소 텐서로 나타냅니다.
- **큐**<br>
큐는 단계별로 텐서를 저장합니다. 텐서플로는 여러 종류의 큐를 제공합니다. FIFOQueue, PriorityQueue, RandomShuffleQueue, PaddingFIFOQueue 등이 있습니다. tf.queue에 포함되어 있습니다.