# TensorFlow (텐서플로, 텐서플로우)

대규모 숫자 계산을 할 수 있도록 해주는 라이브러리

Tensor(텐서) : 다차원 행렬 (딥러닝에서 데이터를 표현하는 방식)

TensorFlow는 계산식들을 미리 만들어 놓고, 데이터를 하나하나 넣어가며 실행을 하는 구조

파이썬을 최우선으로 지원하며, 대부분의 편한 기능들이 파이썬 라이브러리 구현이 되어 있어서

파이썬에서 개발하는 것이 편하다.

# 텐서의 종류

* 0차원 텐서 : 스칼라 (Scalar)
* 1차원 백터 (Vector)
* 2차원 행렬 (Matrix)
* 3차원 텐서 (Tensor)
* 4차원 텐서 (Tensor)

차수(Rank)가 1씩 증가하면서 데이터 구조가 확장

점 -> 선 -> 면 -> 입체로 가는 느낌

차수(랭크의 수) : 텐서를 구성하는 백터의 개수

벡터(Vector) : 어떤 축을 기준으로 해당하는 방향으로 어떤 양이 존재하는지, 각 차원은 각각의 고유의 정보를 나타내는 축



# 스칼라 (Scalar)

정수 및 실수와 같은 상수(Constant Number)

양을 나타내기는 하지만, 방향성을 갖지는 않음

벡터가 존재하지 않으므로 차수가 0

텐서플로에서 : '랭크-0 텐서'라고 부름

In [None]:
# 텐서플로 불러오기
import tensorflow as tf

# scalar 정의
#     scalar tensor는 constant()함수에 상수값을 입력해서 만들기
a = tf.constant(10) # 변수 a에 스칼라 10 할당
b = tf.constant(20) # 변수 b에 스칼라 20 할당

print(a)
print(b)

# tf.Tensor(10, shape=(), dtype=int32)
# tf.Tensor(20, shape=(), dtype=int32)
#     정수 10, 20은 텐서(tf.Tensor)로 변환
#     배열을 의미하는 shape=()에 나타내는 값이 없음 => 0차원
#     결론 : 정수 10과 20은 0차원 텐서인 스칼라로 저장된 것이 확인됨

tf.Tensor(10, shape=(), dtype=int32)
tf.Tensor(20, shape=(), dtype=int32)


In [None]:
# 랭크 확인
print(tf.rank(a)) # rank가 0인 스칼라텐서

tf.Tensor(0, shape=(), dtype=int32)


In [None]:
# tensor 자료형 변환 : tf.cast(바꿀 변수명, 바꿀 자료형)
# 형변환 : type casting
# a, b : int32 -> float32
a = tf.cast(a, tf.float32)
b = tf.cast(b, tf.float32)
print(a.dtype)
print(b.dtype)
# tensorflow 딥러닝 연산에서는 float32가 숫자형 데이터의 기본 자료형

<dtype: 'float32'>
<dtype: 'float32'>


In [None]:
# math 모듈 : 다양한 수학적인 함수가 정의 되어 있음
# (텐서간의) 덧셈 : add()
c = tf.math.add(a,b)
print(c) # 실수형 값을 저장한 변수 c
print(tf.rank(c)) # 스칼라 텐서끼리 더한 값 역시 스칼라 텐서라서 랭크(차원)는 0

tf.Tensor(30.0, shape=(), dtype=float32)
tf.Tensor(0, shape=(), dtype=int32)


In [None]:
# 뺄셈
print(tf.math.subtract(a,b))
# 곱셈
print(tf.math.multiply(a,b))
# 나눗셈
print(tf.math.divide(a,b))
# 나눗셈 몫 - floor가 있었는데 floordiv 사용하면 됨
print(tf.math.floordiv(a,b))
# 나눗셈 나머지 - mod가 있었는데 동일하게 사용
print(tf.math.mod(a,b))

tf.Tensor(-10.0, shape=(), dtype=float32)
tf.Tensor(200.0, shape=(), dtype=float32)
tf.Tensor(0.5, shape=(), dtype=float32)
tf.Tensor(0.0, shape=(), dtype=float32)
tf.Tensor(10.0, shape=(), dtype=float32)


# 벡터(Vector)

스칼라 값 여러개를 요소로 갖는 1차원 배열

스칼라 여러개가 동일한 축 방향으로 나열되는 개념

요소로 구성되는 다양한 값들이 모여 하나의 대표성을 갖는 값

좌표계 공간 : 어떤 방향으로 크기를 가진다

각 요소값들의 크기, 요소들이 나열되는 순서 두 가지 모두 의미가 있음

벡터는 방향성(하나의 축)만을 가지고 있기 때문에

Rank가 1, 랭크-1 텐서라고 부름

In [None]:
# 필요한 라이브러리 불러오기
import numpy as np
import tensorflow as tf

# 1차원 배열 정의하기
#     constant() 함수로 1차원 배열을 정의하면, 1차원 텐서인 벡터로 변환
#     python의 list와 numpy array 모두 사용 가능
#     vector의 shape=(요소개수,) 형태로 표시됨

l = [10,20,30] # python의 list
a = np.array([100.,200.,200.,]) # numpy array

# 텐서 변환
v1 = tf.constant(l,tf.float32)
v2 = tf.constant(a,dtype=tf.float32)

print(v1)
print(v2)

# shape=(3,) : 1개의 축에 3개의 요소가 있다는 뜻

tf.Tensor([10. 20. 30.], shape=(3,), dtype=float32)
tf.Tensor([100. 200. 200.], shape=(3,), dtype=float32)


In [None]:
# rank 확인
print(tf.rank(v1))
print(tf.rank(v2))

# v1, v2 벡터 모두 랭크가 1인 랭크-1 텐서

tf.Tensor(1, shape=(), dtype=int32)
tf.Tensor(1, shape=(), dtype=int32)


In [None]:
# 뎃셈 함수, 그 결과 랭크 확인
add = tf.math.add(v1,v2)
print(add)
print(tf.rank(add))

# element-by-element 벡터연산
# 벡터 연산 : 같은 위치에 있는 요소들끼리 (elemet-by-element) 짝을 이루어서 계산
# 결과물 : 요소 3개를 갖는 벡터(랭크-1텐서)형태가 그대로 유지..!

tf.Tensor([110. 220. 230.], shape=(3,), dtype=float32)
tf.Tensor(1, shape=(), dtype=int32)


In [None]:
# 파이썬 내장 연산자 사용 가능
add1 = v1 + v2
print(add1)

tf.Tensor([110. 220. 230.], shape=(3,), dtype=float32)


In [None]:
# 사칙연산 (몫, 나머지까지)
# 뺄셈
print(v1-v2)
# 곱셈
print(v1*v2)
# 나눗셈
print(v1/v2)
# 몫
print(v1 // v2)
# 나머지
print(v1 % v2)

tf.Tensor([ -90. -180. -170.], shape=(3,), dtype=float32)
tf.Tensor([1000. 4000. 6000.], shape=(3,), dtype=float32)
tf.Tensor([0.1  0.1  0.15], shape=(3,), dtype=float32)
tf.Tensor([0. 0. 0.], shape=(3,), dtype=float32)
tf.Tensor([10. 20. 30.], shape=(3,), dtype=float32)


In [None]:
# reduce_sum() : vector를 구성하는 요소들의 합계
#     그 합계는 Scalar로 표현
print(tf.reduce_sum(v1))
print(tf.reduce_sum(v2))

tf.Tensor(60.0, shape=(), dtype=float32)
tf.Tensor(500.0, shape=(), dtype=float32)


In [None]:
# square 함수 : 거듭제곱 연산처리
#   각 요소들을 거듭제곱 한 값을 반환
print(tf.math.square(v1))

# 내장 연산자로 거듭제곱
print(v1 ** 2)

tf.Tensor([100. 400. 900.], shape=(3,), dtype=float32)
tf.Tensor([100. 400. 900.], shape=(3,), dtype=float32)


In [None]:
# sqrt 함수 : 제곱근 구하기
#     각 요소들을 제곱근 한 값을 반환
print(tf.math.sqrt(v2))

# 내장 연산자로 제곱근 구하기
print(v2 ** 0.5)

tf.Tensor([10.       14.142136 14.142136], shape=(3,), dtype=float32)
tf.Tensor([10.       14.142136 14.142136], shape=(3,), dtype=float32)


In [None]:
# tensor는 numpy 배열의 브로드캐스팅 연산 지원

# 브로드캐스팅 연산 : 일정 조건을 부합하는 다른 형태의 배열끼리 연산을 수행하는 것
print(v1 + 10)

# vector에 숫자 10을 더하면, 형태는 그대로 유지된 상황에서
# 각각의 요소에 10씩 더한 값을 반환

tf.Tensor([20. 30. 40.], shape=(3,), dtype=float32)


# 행렬(Matrix)

차수(Rank)가 1인 Vector를 같은 축 방향으로 나열하는 개념

여러개의 1차원 vector를 요소로 갖는 2차원 배열

요소의 차수(Rank)가 1이기 때문에 총 차수는 2 (Rank : 2)

tf : 랭크-2 텐서

In [None]:
import tensorflow as tf

# 2차원 배열 정의하기(list)
li_in_li = [[1,2],[3,4]]        # (2,2)
# li_in_li = [[1,2],[3,4],[5,6]]  # (3,2)
# li_in_li = [[1,2,3],[4,5,6]]    # (2,3)

# tensor 변환
matrix1 = tf.constant(li_in_li) # constant함수에 2차원 배열 입력

# 출력
print(matrix1)

# rank확인
print(tf.rank(matrix1))

# [[1,2],[3,4]] : 2개의 list를 요소로 갖는 list

# [[1,2],
#  [3,4]] : (2행,2열) 구조의 2차원 tensor

tf.Tensor(
[[1 2]
 [3 4]], shape=(2, 2), dtype=int32)
tf.Tensor(2, shape=(), dtype=int32)


In [None]:
# stack() : 행렬 만들기
# 1차원 vector를 2개 만들어서 stack()를 이용하여 결합하는 방식

# 차수가 2인 랭크-2 텐서

# 1차원 vector 2개 정의
v1 = tf.constant([10,20])
v2 = tf.constant([-10,30])

# print(tf.rank(v1))

# tensor 변환
matrix2 = tf.stack([v1,v2])
print(matrix2)

print(tf.rank(matrix2))

tf.Tensor(
[[ 10  20]
 [-10  30]], shape=(2, 2), dtype=int32)
tf.Tensor(2, shape=(), dtype=int32)


In [None]:
# element-by-element 벡터 연산
calc = tf.math.multiply(matrix1, matrix2)
print(calc)

tf.Tensor(
[[ 10  40]
 [-30 120]], shape=(2, 2), dtype=int32)


In [None]:
# 브로드캐스팅 연산
calc2 = tf.math.multiply(matrix1,10)
print(calc2)

# 2차원 행렬에 10을 곱하면, 행렬에 있는 모든 요소 * 10
#     => 행렬의 요소가 모두 10으로 구성되어 있는 2차원의 행렬 모양으로 확장 후 연산 진행

tf.Tensor(
[[10 20]
 [30 40]], shape=(2, 2), dtype=int32)


In [None]:
# matmul() : 선형대수에서 다루는 행렬곱 연산
# 행렬곱 : 벡터의 선형 결합
mat_mul = tf.matmul(matrix1, matrix2)
print(mat_mul)

# 행렬곱의 연산 형태 : 축이 2개이므로, 랭크가 2인 랭크-2 텐서가 됨

tf.Tensor(
[[-10  80]
 [-10 180]], shape=(2, 2), dtype=int32)


In [None]:
# math > 덧셈연산
add1 = tf.math.add(matrix1, matrix2)
print(add1)
print(tf.rank(add1))

tf.Tensor(
[[11 22]
 [-7 34]], shape=(2, 2), dtype=int32)
tf.Tensor(2, shape=(), dtype=int32)


In [None]:
# 파이썬 연산자로 덧셈
add2 = matrix1 + matrix2
print(add2)
print(tf.rank(add2))

tf.Tensor(
[[11 22]
 [-7 34]], shape=(2, 2), dtype=int32)
tf.Tensor(2, shape=(), dtype=int32)


# 고차원 텐서(Tensor)

고차원 텐서 : 축이 6개 이상

3차원 구조를 가지는 랭크-3 텐서

랭크-1 텐서를 같은 축 방향으로 결합시키면 : 랭크-2텐서

랭크-2 텐서를 같은 축 방향으로 켤합시키면 : 랭크-3텐서

=> 1차원 벡터를 나열하면 2차월 행렬이 되고, 2차원 행렬을 나열하면 3차원 텐서가 됨

In [None]:
import tensorflow as tf
import numpy as np

In [None]:
# 3차원 텐서
# 2차원 행렬 (2행 4열)을 3개 생성

matrix3 = [[10,20,30,40],
           [50,60,70,80]]
matrix4 = [[11,22,33,44],
           [55,66,77,88]]
matrix5 = [[100,200,300,400],
           [500,600,700,800]]

# tensor 변환 - constant
t = tf.constant([matrix3,matrix4,matrix5])

print(t)  # shape=3차원2행4열

# rank
print(tf.rank(t))

# 2차원 행렬을 요소로 갖는 1차원 벡터를 만들어서
# 랭크-3 텐서 (2,4)크기의 행렬이 3개 결합되었다.

tf.Tensor(
[[[ 10  20  30  40]
  [ 50  60  70  80]]

 [[ 11  22  33  44]
  [ 55  66  77  88]]

 [[100 200 300 400]
  [500 600 700 800]]], shape=(3, 2, 4), dtype=int32)
tf.Tensor(3, shape=(), dtype=int32)


In [None]:
# stack() 함수로 만들기 - 2차원 배열을 차곡차곡 쌓기

t2 = tf.stack([matrix3, matrix4, matrix5])

print(t2)

print(tf.rank(t2))

tf.Tensor(
[[[ 10  20  30  40]
  [ 50  60  70  80]]

 [[ 11  22  33  44]
  [ 55  66  77  88]]

 [[100 200 300 400]
  [500 600 700 800]]], shape=(3, 2, 4), dtype=int32)
tf.Tensor(3, shape=(), dtype=int32)
