# 학습목표
- 텐서 개념을 이해한다.
- 텐서 데이터 타입을 이해한다.
- 텐서 연산을 수행한다.

# 01_텐서 (Tensor)

텐서(Tensor)는 데이터를 담기위한 컨테이너(container)로서 다차원 배열 또는 리스트 형태와 유사합니다.     
일반적으로 수치형 데이터를 저장하고, 동적 크기를 가집니다.     
텐서플로우(TensorFlow)는 데이터 표현과 다양한 수학식을 계산하기 위한 기본 구조로 텐서를 사용해서 표현합니다.    
**딥러닝에서 가장 기초적인 표현 방법이 텐서이다.**    

텐서는 형상이 존재하며 데이터의 표현에 따라서 사용합니다. 사용되는 용어는 다음과 같습니다.    
- Rank: 축(차원)의 개수
- Shape: 형상(각 축의 요소의 개수)
- Type: 데이터 타입
 ![image.png](attachment:7b512392-d88a-4404-a6ea-61176d862da2.png)

In [1]:
# 텐서플로우 라이브러리 불러오기
import tensorflow as tf

## 0D Tensor(Scalar)
0차원 텐서는 하나의 숫자를 담고있는 텐서이며 스칼라(scalar)라고도 부르며 축과 형상이 없다.    
tf.constant()를 사용하면 상수(constant) 텐서를 만들 수 있고 만든 텐서에 tf.rank()를 정용하면 축의 개수를 알 수 있다.

In [5]:
t0 = tf.constant(1)
print(t0)          # 0차원 스칼라 텐서를 출력한다.
print(tf.rank(t0)) # 축의 개수를 반환한다.

tf.Tensor(1, shape=(), dtype=int32)
tf.Tensor(0, shape=(), dtype=int32)


## 1D Tensor(Vector)
1차원 텐서는 값들을 저장한 리스트와 유사한 텐서입니다. 벡터(vector)라고도 부르며, 하나의 축이 존재합니다.    
일반적인 수치, 통계 데이터셋이 여기에 해당되며 주로 샘플과 특성을 가진 구조로 사용됩니다.

In [4]:
t1 = tf.constant([1, 2, 3]) 
print(t1)
print(tf.rank(t1))

tf.Tensor([1 2 3], shape=(3,), dtype=int32)
tf.Tensor(1, shape=(), dtype=int32)


## 2D Tensor(Matrix)
2차원 텐서는 행렬과 같은 모양으로 두개의 축이 존재합니다.     
일반적인 수치, 통계 데이터셋이 여기에 해당됩니다.    
주로 샘플(samples)과 특성(features)을 가진 구조로 사용됩니다.
![image.png](attachment:af03cf1b-c632-497c-b7f4-943447810113.png)

In [7]:
t2 = tf.constant([[1, 2, 3],
                  [4, 5, 6],
                  [7, 8, 9]])
print(t2)
print('='*10)
print(tf.rank(t2))

tf.Tensor(
[[1 2 3]
 [4 5 6]
 [7 8 9]], shape=(3, 3), dtype=int32)
tf.Tensor(2, shape=(), dtype=int32)


## 3D Tensor
3차원 텐서는 큐브(cube)와 같은 모양으로 세개의 축이 존재합니다.    
일반적으로 데이터가 연속된 시퀀스 데이터나 시간 축이 포함된 시계열 데이터에 해당합니다.     
주로 샘플(samples), 타임스텝(timesteps), 특성(features)을 가진 구조로 사용됩니다.     
3차원 텐서를 이용하는 데이터로는 주식 가격 데이터셋, 시간에 따른 질병 발병 데이터 등이 존재합니다.
![image.png](attachment:32764c04-68d7-41b2-840e-40f67721ef23.png)

In [10]:
t3 = tf.constant([[[1,2,3],
                   [4,5,6],
                   [7,8,9]],
                  [[10,11,12],
                   [13,14,15],
                   [16,17,18]]])
print(t3)
print('='*10)
print(tf.rank(t3))

tf.Tensor(
[[[ 1  2  3]
  [ 4  5  6]
  [ 7  8  9]]

 [[10 11 12]
  [13 14 15]
  [16 17 18]]], shape=(2, 3, 3), dtype=int32)
tf.Tensor(3, shape=(), dtype=int32)


## 4D Tensor
4차원 텐서는 4개의 축이 존재하며, 컬러 이미지 데이터가 대표적인 사례 (흑백 이미지 데이터는 3D Tensor로 가능)입니다.     
주로 샘플(samples), 높이(height), 너비(width), 컬러 채널(channel)을 가진 구조로 사용됩니다.
![image.png](attachment:15bbd3cf-f3a1-4ab6-a5e2-4f06d2675ba8.png)

## 5D Tensor
5차원 텐서는 5개의 축이 존재하며, 비디오 데이터가 대표적인 사례입니다.     
주로 샘플(samples), 프레임(frames), 높이(height), 너비(width), 컬러 채널(channel)을 가진 구조로 사용됩니다.
![image.png](attachment:a8a1c047-5c83-484c-9a55-5e3769942e95.png)

# 02 텐서 타입 및 변환

## 텐서의 타입
텐서의 기본 데이터 타입(dtype)은 정수형(int32), 실수형(float32), 문자열(string) 등이 있고, 그 외에도 여러 데이터 타입 등이 존재합니다.
![image.png](attachment:c43f9cbc-0c03-4c49-a08d-3addcca0e772.png)

## 텐서의 생성
상수 값 2인 텐서를 생성해 보기, 기본적으로 정수형 int32 타입을 가지는 것을 알 수 있다.

In [13]:
i  = tf.constant(2)
print(i)

tf.Tensor(2, shape=(), dtype=int32)


In [14]:
# 상수 값 2.0으로 지정하면, 실수형 float32인 텐서를 생성합니다.
f = tf.constant(2.)
print(f)

tf.Tensor(2.0, shape=(), dtype=float32)


In [15]:
# 문자열을 값으로 가지는 텐서를 생성할 수도 있으며, 타입은 string이 된다.
s = tf.constant('Suan')
print(s)

tf.Tensor(b'Suan', shape=(), dtype=string)


지정한 상수 값의 타입을 보고 자동으로 텐서 타입이 정해지는 것 외에도 필요한 텐서의 타입을 지정하여 생성할 수 있습니다.

In [16]:
# tf.float16으로 16비트 실수형으로 타입을 지정하기
f16 = tf.constant(2., dtype = tf.float16)
print(f16)

tf.Tensor(2.0, shape=(), dtype=float16)


In [20]:
# 그 밖에도 8비트의 정수형인 tf.int8을 지정하여 텐서를 생성할 수 있습니다.
i8 = tf.constant(3, dtype = tf.int8)
print(i8)

tf.Tensor(3, shape=(), dtype=int8)


## 텐서 변환

![image.png](attachment:da30ab0b-112a-4897-a548-b89b3301432e.png)

### 텐서 타입 변환

In [21]:
# 텐서의 타입을 변환하고자 할 때는 tf.cast를 사용합니다.
# 16비트 실수형 tf.float16을 32비트 실수형 tf.float32로 변환하기
f32 = tf.cast(f16, tf.float32)
print(f32)

tf.Tensor(2.0, shape=(), dtype=float32)


In [22]:
#  8비트 정수형 tf.int8을 32비트 정수형인 tf.int32로 변환
i32 = tf.cast(i8, tf.int32)
print(i32)

tf.Tensor(3, shape=(), dtype=int32)


### 텐서 형상 변환
텐서의 형상을 변환하는 것은 tf.reshape 함수를 통해 가능합니다. 이 함수는 텐서의 원소는 그대로 유지하면서 텐서의 구조를 바꿉니다.

In [23]:
x = tf.constant([[1], [2], [3]])
print(x)
print(x.shape)
print('='*10)
y = tf.reshape(x, [1, 3])
print(y)
print(y.shape)

tf.Tensor(
[[1]
 [2]
 [3]], shape=(3, 1), dtype=int32)
(3, 1)
tf.Tensor([[1 2 3]], shape=(1, 3), dtype=int32)
(1, 3)


### 텐서 전치
텐서를 전치하여 형상을 바꾸는 역할로 tf.transpose 함수를 사용할 수 있습니다.

In [25]:
print(y)
print('='*10)
print(tf.transpose(y))
print('='*10)
print(y.shape)

tf.Tensor([[1 2 3]], shape=(1, 3), dtype=int32)
tf.Tensor(
[[1]
 [2]
 [3]], shape=(3, 1), dtype=int32)
(1, 3)


### 차원 압축
텐서에서 크기가 1인 차원을 제거하는 tf.squeeze 함수를 이용해 형상을 변경합니다.

In [27]:
print(x)
print('='*10)
print(tf.squeeze(x)) # 텐서에서 크기가 1인 차원을 삭제

tf.Tensor(
[[1]
 [2]
 [3]], shape=(3, 1), dtype=int32)
tf.Tensor([1 2 3], shape=(3,), dtype=int32)


### 차원 추가
텐서의 차원을 추가하는 tf.expand_dims 함수를 이용해 형상을 변경합니다.     
여기서 axis는 차원을 확장할 텐서의 축을 지정해주는 역할을 합니다.

In [28]:
print(y)
print('='*10)
print(tf.expand_dims(y, axis=0)) # expand_dims 텐서에 차원추가
print('='*10)
print(tf.expand_dims(y, axis=1))
print('='*10)
print(tf.expand_dims(y, axis=2))

tf.Tensor([[1 2 3]], shape=(1, 3), dtype=int32)
tf.Tensor([[[1 2 3]]], shape=(1, 1, 3), dtype=int32)
tf.Tensor([[[1 2 3]]], shape=(1, 1, 3), dtype=int32)
tf.Tensor(
[[[1]
  [2]
  [3]]], shape=(1, 3, 1), dtype=int32)


### 텐서 분리
tf.split 함수를 이용하여 텐서의 지정한 차원을 기준으로 여러 개의 텐서로 구분합니다.     
예제에서는 텐서 x를 3개로 분리한 것을 알 수 있습니다.

In [29]:
print(x)
print('='*10)
print(tf.split(x, 3))

tf.Tensor(
[[1]
 [2]
 [3]], shape=(3, 1), dtype=int32)
[<tf.Tensor: shape=(1, 1), dtype=int32, numpy=array([[1]])>, <tf.Tensor: shape=(1, 1), dtype=int32, numpy=array([[2]])>, <tf.Tensor: shape=(1, 1), dtype=int32, numpy=array([[3]])>]


### 텐서 연결
tf.concat 함수는 지정한 축 axis를 기준으로 텐서들을 이어붙입니다.

In [30]:
print(x)
print('='*10)
print(tf.concat([x, x], axis=0))
print('='*10)
print(tf.concat([x, x], axis=1))

tf.Tensor(
[[1]
 [2]
 [3]], shape=(3, 1), dtype=int32)
tf.Tensor(
[[1]
 [2]
 [3]
 [1]
 [2]
 [3]], shape=(6, 1), dtype=int32)
tf.Tensor(
[[1 1]
 [2 2]
 [3 3]], shape=(3, 2), dtype=int32)


In [31]:
# 텐서 함수 사용해보기
print(x)
print('='*10)
print(tf.slice(x, begin=[1, 0], size=[1, 1]))

tf.Tensor(
[[1]
 [2]
 [3]], shape=(3, 1), dtype=int32)
tf.Tensor([[2]], shape=(1, 1), dtype=int32)


# 03 텐서 연산

## 0차원 텐서의 연산
텐서는 기본 산술과 다양한 연산을 수행 할 수 있습니다.    

In [32]:
# 더하기와 빼기 연산을 수행해보기
#  더하기 연산자인 +와 빼기 연산자인 -를 이용해서 텐서간의 계산이 가능하고, add와 subtract 함수를 이용해서도 계산이 가능

print(tf.constant(2) + tf.constant(2))
print(tf.constant(2) - tf.constant(2))
print(tf.add(tf.constant(2), tf.constant(2)))
print(tf.subtract(tf.constant(2), tf.constant(2)))

tf.Tensor(4, shape=(), dtype=int32)
tf.Tensor(0, shape=(), dtype=int32)
tf.Tensor(4, shape=(), dtype=int32)
tf.Tensor(0, shape=(), dtype=int32)


In [33]:
# 곱하기와 나누기 연산도 *와 / 연산자를 이용하는 방법과 multiply와 divide 함수를 이용하는 방법
print(tf.constant(2) * tf.constant(2))
print(tf.constant(2) / tf.constant(2))
print(tf.multiply(tf.constant(2), tf.constant(2)))
print(tf.divide(tf.constant(2), tf.constant(2)))

tf.Tensor(4, shape=(), dtype=int32)
tf.Tensor(1.0, shape=(), dtype=float64)
tf.Tensor(4, shape=(), dtype=int32)
tf.Tensor(1.0, shape=(), dtype=float64)


In [34]:
# 텐서 연산에서 주의할 점은 서로 다른 타입을 가지는 텐서는 연산이 되지 않고, 에러가 발생한다.
print(tf.constant(2) + tf.constant(2.2))

InvalidArgumentError: cannot compute AddV2 as input #1(zero-based) was expected to be a int32 tensor but is a float tensor [Op:AddV2] name: 

In [35]:
# 다른 타입을 가지는 텐서는 연산을 위해서 타입을 변환해 주어야한다.
# 2-3 스텝에서 언급했던 tf.cast를 사용하여 텐서의 타입을 서로 맞춰준 후에 연산이 가능하다.
print(tf.cast(tf.constant(2), tf.float32) + tf.constant(2.2))

tf.Tensor(4.2, shape=(), dtype=float32)


## 1차원 이상의 텐서 연산
0차원의 상수값만 존재하는 텐서 계산 외에도 1차원 이상의 텐서에 대해서도 연산이 가능하다.    
다만 텐서의 모양이 직사각형이거나 연산이 가능하도록 형상을 맞춰주어야 한다.

### 1차원 텐서의 연산

In [39]:
# 1차원 텐서 2개를 생성해 보기.

a = tf.constant([1,2])
b = tf.constant([1,1])

print(a)
print(b)

tf.Tensor([1 2], shape=(2,), dtype=int32)
tf.Tensor([1 1], shape=(2,), dtype=int32)
tf.Tensor([2], shape=(1,), dtype=int32)


In [41]:
# 생성된 2개의 텐서에 사칙연산을 해보기
print(a + b)
print(a - b)
print(a * b)
print(a / b)

tf.Tensor([2 3], shape=(2,), dtype=int32)
tf.Tensor([0 1], shape=(2,), dtype=int32)
tf.Tensor([1 2], shape=(2,), dtype=int32)
tf.Tensor([1. 2.], shape=(2,), dtype=float64)


### 2차원 텐서의 연산

In [42]:
# 크기 (2,2)인 2차원 텐서 2개를 생성해 보세요.  
a = tf.constant([[1,2],
                 [3,4]])
b = tf.constant([[1,1],
                 [1,1]])

print(a)
print(b)

tf.Tensor(
[[1 2]
 [3 4]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[1 1]
 [1 1]], shape=(2, 2), dtype=int32)


텐서를 계산하기 위한 여러 연산자들을 제공하고 있으며, +, -, *, / 연산자는 요소별(element-wise) 연산을 수행하고,     
@ 연산자의 경우에는 행렬 곱 연산을 수행합니다.

In [43]:
print(a + b) # element-wise addition
print(a - b) # element-wise subtraction
print(a * b) # element-wise multiplication
print(a @ b) # matrix multiplication
print(a / b) # element-wise division

tf.Tensor(
[[2 3]
 [4 5]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[0 1]
 [2 3]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[1 2]
 [3 4]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[3 3]
 [7 7]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[1. 2.]
 [3. 4.]], shape=(2, 2), dtype=float64)


In [45]:
# 텐서 연산은 연산자를 통해서도 가능하지만, 제공되는 함수를 통해서도 연산이 가능하다.
print(tf.add(a, b))
print(tf.subtract(a, b))
print(tf.multiply(a, b))
print(tf.matmul(a, b))
print(tf.divide(a, b))

tf.Tensor(
[[2 3]
 [4 5]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[0 1]
 [2 3]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[1 2]
 [3 4]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[3 3]
 [7 7]], shape=(2, 2), dtype=int32)
tf.Tensor(
[[1. 2.]
 [3. 4.]], shape=(2, 2), dtype=float64)


그 밖에도 유용한 여러 함수들이 존재합니다.    
    
* reduce_max(): 텐서 값 중에서 최대값을 계산합니다.
* argmax(): 최대값의 위치를 반환합니다.
  * 예제에서는 [4.0, 5.0, 6.0] 보다 [10.0, 9.0, 8.0]이 다 크기 때문에 [0 0 0]이 아니라 [1 1 1]의 결과를 보여주고 있습니다.
* nn.softmax(): 텐서의 값을 0과 1 사이의 값으로 보여줍니다.
  * 예제에서는 [4.0, 5.0, 6.0] 값이 [0.09003057 0.24472848 0.66524094]으로 변환되었고, [10.0, 9.0, 8.0]이 [0.66524094 0.24472848 0.09003057]로 변환되었습니다.





In [47]:
# 예제

c = tf.constant([[4.0, 5.0, 6.0], 
                 [10.0, 9.0, 8.0]])

print(tf.reduce_max(c))
print('='*10)
print(tf.argmax(c))
print('='*10)
print(tf.nn.softmax(c))

tf.Tensor(10.0, shape=(), dtype=float32)
tf.Tensor([1 1 1], shape=(3,), dtype=int64)
tf.Tensor(
[[0.09003057 0.24472848 0.6652409 ]
 [0.6652409  0.24472848 0.09003057]], shape=(2, 3), dtype=float32)


## 텐서의 연산 정리
![image.png](attachment:cbb9ddea-45dd-4c9d-94bc-b6f62f345d18.png)

# 종합 문제
지금까지 배운 내용을 바탕으로 아래 종합 문제를 해결해봅시다!    
아래 텐서를 각각 (2,2,2)의 형태를 가진 3차원 텐서로 만들고 행렬곱 연산을 해보세요.

In [48]:
a = tf.constant([1, 2, 3, 4, 5, 6, 7, 8]) 
b = tf.constant([[1., 2., 3., 4., 5., 6., 7., 8.]])

# Q. 위에 있는 2개의 텐서를 행렬곱연산이 가능하도록 3차원 텐서로 변환해주세요.
a = tf.reshape(a, [2,2,2])
b = tf.reshape(b, [2,2,2])

a = tf.cast(a, tf.float32)

print(a@b)

tf.Tensor(
[[[  7.  10.]
  [ 15.  22.]]

 [[ 67.  78.]
  [ 91. 106.]]], shape=(2, 2, 2), dtype=float32)
